2022-09-16

科学者たちはAIを使って、画期的な新しいタンパク質を夢見ている。

Nature Briefingは2022年09月16日に、AI(Artificial Intelligence/人工知能)の大幅な進歩により、研究者は完全にオリジナルな分子を数ヶ月ではなく数秒で設計できるようになったと報告した。

2022年06月、韓国の規制当局は、人間が設計した新しいタンパク質から作られた史上初の医薬品であるCOVID-19ワクチンを認可した。

このワクチンは、10年近く前に研究者が労働集約的な試行錯誤の末に作り出した球状のタンパク質「ナノ粒子(nanoparticle)」をベースにしている。

現在では、AIの大幅な進歩により、シアトルのUW(University of Washington/ワシントン大学)の生化学者デビッド・ベイカー(David Baker,)が率いるチームは、このような分子の設計を数カ月ではなく数秒で行えるようになったと『Science』誌に報告している。

こうした取り組みは、DeepMind社のタンパク質構造予測ソフトウェアAlphaFoldなどのAIツールが生命科学者に受け入れられ、科学的な大変革の一端を担っている。
2022年07月、DeepMindはAlphaFoldの最新バージョンで、科学で知られているすべてのタンパク質の構造を予測したことを明らかにした。
また、ここ数カ月は、まったく新しいタンパク質を素早く作り出すことのできるAlphaFoldをベースにしたAIツールが爆発的に増えている。以前は、これは失敗率の高い、骨の折れる作業だった。

スペインのジローナ大学の計算生物学者であるノエリア・フェルス(Noelia Ferruz, a computational biologist at the University of Girona, Spain)は、「AlphaFold以来、タンパク質設計に取り組む方法に変化が生じています。」と「私たちは、非常にエキサイティングな時代に立ち会っているのです。」語る。

ほとんどの努力は、自然界に存在しないような形をしたオリジナルのタンパク質を作るのに役立つツールに集中しており、これらの分子が何をすることができるのかにはあまり焦点が当てられていない。しかし、研究者たち、そしてAIをタンパク質設計に応用する企業の数は増えており、有毒廃棄物の浄化から病気の治療まで、有用な働きをするタンパク質を設計したいと考えている。この目標に向けて取り組んでいる企業には、ロンドンのDeepMindや、カリフォルニア州メンロパークのMeta(旧Facebook)などがある。

「その手法はすでに非常にパワフルで、これからもっと強力になっていくでしょう」「問題は、それらでどんな問題を解決するかです。」とベイカーは言う。

ベイカー教授の研究室では、過去30年間、新しいタンパク質を作ることに専念してきた。1990年代に開発された「ロゼッタ」と呼ばれるソフトウェアが、このプロセスを段階的に分割している。

当初、研究者たちは、他のタンパク質の断片を寄せ集めて新しいタンパク質の形を考え、このソフトウェアがその形に対応するアミノ酸の配列を推測した。

しかし、この「第一ドラフト」タンパク質が、実験室で作られたときに望ましい形に折り畳まれることはほとんどなく、別の確認作業で行き詰まってしまう。

そこで、タンパク質の配列を微調整して、目的の1つの構造だけに折り畳まれるようにする、
もう1つのステップが必要だった。

ハーバード大学の進化生物学者で、ベイカーの研究室でかつて働いていたセルゲイ・オヴチニコフ(Sergey Ovchinnikov)は、このステップでは、異なる配列がどのように折り畳まれるかをすべてシミュレーションする必要があり、計算コストがかかると言う。「文字通り、1万台のコンピュータを何週間も動かして、これをやっていたのです。」

AlphaFoldや他のAIプログラムを調整することで、その時間のかかるステップが瞬時にできるようになったと、オヴチニコフは言う。ベイカー教授のチームが開発した「幻覚作用(hallucination」と呼ばれる手法では、ランダムなアミノ酸配列を構造予測ネットワークに送り込み、ネットワークが予測した通りに、よりタンパク質らしくなるように構造を変化させる。ベイカー教授のチームは、2021年の論文で、研究室で100以上の小さな「幻覚(hallucinated)」タンパク質を作り、その約5分の1が予測された形状に類似していることを明らかにした。

AlphaFoldや、ベイカー教授の研究室が開発したRoseTTAFoldと呼ばれる同様のツールは、個々のタンパク質鎖の構造を予測するために訓練されたものである。しかし、研究者たちはすぐに、このようなネットワークが、相互作用する複数のタンパク質の集合体をもモデル化できることを発見した。

これをもとに、ベイカーと彼のチームは、自己集合してさまざまな形と大きさのナノ粒子になるタンパク質を作り出せると確信した。これは、1つのタンパク質の多数のコピーでできており、COVID-19ワクチンの基になっているものと似ている。

しかし、彼らが研究所で微生物にその作品を作るように指示したところ、150のデザインのうち、どれもうまくいきませんでした。「試験管の底に沈むだけでした」とベイカーは言う。

同じ頃、研究室のもうひとりの研究者である機械学習科学者のジャスタス・ダウパラス(Justas Dauparas)は、逆フォルディング問題(inverse folding problem)と呼ばれる、あるタンパク質の全体形状に対応するタンパク質配列を決定するためのディープラーニングツールを開発中だった。
セルゲイ・オヴチニコフによると、ProteinMPNNと呼ばれるこのネットワークは、AlphaFoldやその他のツールを使って作成したデザイナータンパク質の「スペルチェック」として機能し、分子全体の形状を維持しながら配列に手を加えることができるという。

ベイカー教授のチームがこの第2のネットワークを幻のタンパク質ナノ粒子に適用したところ、実験的にその分子を作ることに大いに成功した。

研究チームは、低温電子顕微鏡やその他の実験手法を用いて、30種類の新しいタンパク質の構造を決定し、そのうち27種類がAIが導いた設計と一致した。その中には、自然界には存在しないような、複雑な対称性をもつ巨大なリングも含まれていた。理論的には、この方法を使えば、ほとんどすべての対称的な形状に対応するナノ粒子を設計できると、この研究の共同研究者である生物物理学者ルーク・ミレス(Lukas MillesI)は「このようなネットワークができることを目の当たりにすると、電撃的です。」と言う。

ディープラーニングの革命
ストックホルム大学の計算生物学者であるアルネ・エロフソン(Arne Elofsson, a computational biologist at Stockholm University)は、proteinMPNNのようなディープラーニングツールは、タンパク質設計に大きな変化をもたらしたと述べている。「タンパク質を描き、ボタンを押すと、10回に1回はうまくいくようなものが出てきます。」ベーカーのチームがナノ粒子を設計したように、設計プロセスの異なる部分に取り組むために複数のニューラルネットワークを組み合わせれば、さらに高い成功率を達成することができる。「現在では、タンパク質の形状を完全に制御できるようになりました」とセルゲイ・オヴチニコフは言う。

AIをタンパク質設計に応用している研究室は、ベイカー教授の研究室だけではない。今月bioRxivに投稿されたレビュー論文で、フェルズ(Ferruz)教授たちは、さまざまなアプローチで近年開発された40以上のAIタンパク質設計ツールを数えた。(「タンパク質の設計方法(How to design a protein)」参照)。

proteinMPNNを含むこれらのツールの多くは、逆折れ込み問題に取り組んでいる。

特定の構造に対応する配列を指定するもので、画像認識ツールから借用したアプローチを用いることが多い。また、GPT-3などの言語ニューラルネットワークに似たアーキテクチャを採用したものもあり、人間のような文章を生成することができる。

しかし、その代わりに、これらのツールは新規のタンパク質配列を生成することができる。このようなネットワークを共同開発したフェルズ教授は、「これらのネットワークは、タンパク質と『話す』ことができるのです。」と言う。

カリフォルニア大学バークレー校の機械学習研究者であるクロエ・シュ(Chloe Hsu, a machine-learning researcher at the University of California, Berkeley)は、Meta社の研究者とともに逆フォルディングネットワーク(inverse folding network)を開発した。

多くの研究チームは、既存のタンパク質の構造からその配列を正確に決定するネットワークの能力を測定している。しかし、これはすべての手法に当てはまるわけではなく、回収率と呼ばれるこの指標が、新規タンパク質の設計にどのように適用されるかは不明である、と科学者たちは言う。
フェルズ教授は、AlphaFoldが他のネットワークよりも優れていることを最初に証明した、2年に1度のCASP(Critical Assessment of protein Structure Prediction/タンパク質構造予測評価実験)のようなタンパク質デザインコンペティションを開催したいと考えている。「夢のような話です。CASPのようなものがあれば、この分野を大きく前進させることができるでしょう」と、彼女は言う。

ベイカーたちは、実験室で新しいタンパク質を作ることこそ、自分たちの手法を試す究極の試験であると固く信じている。彼らが最初に幻のタンパク質集合体を作るのに失敗したことが、それを示している。「AlphaFoldはそれを素晴らしいタンパク質だと思っていましたが、ウェットラボでは明らかにうまくいきませんでした」と、ベイカーの研究室の生物物理学者で、ベイカー(Baker)、ミレス(Milles)、カリフォルニア大学の生化学者アレクシス・クルベ(UW biochemist Alexis Courbet)とともに、この作業を共同指揮したバジル・ウィッキー(Basile Wicky)は言う。

しかし、タンパク質設計のためのAIツールを開発しているすべての科学者が、実験装置を容易に利用できるわけではない。イリノイ州にあるトヨタ工科大学シカゴ校の計算生物学者ジンボ・シュウ(Jinbo Xu, a computational biologist at the Toyota Technological Institute at Chicago in Illinois)は、共同研究先を見つけるには時間がかかるため、ジンボ・シュウ氏は独自のウェットラボを設立して、チームの創作物をテストしているところだという。

ベーカーによれば、特定の仕事を念頭に置いてタンパク質を設計する場合にも、実験が不可欠になるとのことである。ベイカー教授の研究チームは7月、新規タンパク質に特定の配列や構造を埋め込むことを可能にする2つのAI手法を発表した。彼らはこれらのアプローチを用いて、特定の反応を触媒する酵素、他の分子と結合できるタンパク質、乳児の入院の主な原因である呼吸器系ウイルスに対するワクチンに使用できるタンパク質を設計した。

昨年、DeepMindはロンドンにAlphaFoldなどのAIツールを創薬に応用することを意図したIsomorphic Labsというスピンオフ企業を立ち上げた。DeepMindのCEOである√(Demis Hassabis)は、ディープラーニング技術、特にAlphaFoldにとって、「私たちは、タンパク質設計の領域でかなり多くの作業を行っています。かなり初期の段階です。」タンパク質設計は明白かつ有望なアプリケーションであると見ているという。

doi: https://doi.org/10.1038/d41586-022-02947-7