科学技術
トップ  > コラム&リポート 科学技術 >  File No.22-42

【22-42】AIの発展によって活性化した計算生物学の研究

馬愛平(科技日報記者) 2022年09月14日

image

画像提供:視覚中国

 AIによるタンパク質の構造予測という分野で最近、画期的な成果が発表された。人工知能企業であるDeepMindが、アミノ酸の配列情報からタンパク質の立体構造を予測するAI「AlphaFold」を通して、約100万の生物種の2億種類以上のタンパク質の構造予測を行い、科学界で記録されているほぼすべてのタンパク質をカバーしているという。

 こうした情報は、「AlphaFold」の「タンパク質構造データバンク(PDB)」で公開されおり、世界中の研究者がアクセスできるようになっている。PDBは「DeepMind」が欧州のバイオインフォマティクス研究所(EBI)と共同で開発し、昨年7月にリリースされた時点で、人間のタンパク質構造の98.5%が公開されていた。

 近年、AIによるタンパク質の構造予測は大きな成果を収めており、中国内外の各大企業も次々と参入している。AIのアクティベート、データ駆動の下、AIによるタンパク質の構造予測は現在、舞台裏から出てステージ上に上がるようになり、その産業化発展も現在、新たな段階へと突入している。

AIによるタンパク質の構造予測の背後にある計算生物学

 タンパク質の3次元構造によって細胞におけるその機能が決まる。タンパク質の構造情報を明らかにすることは、医薬品の研究開発といった分野において非常に重要だ。これまで、研究者はX線結晶構造解析といった手段を活用してタンパク質構造を予測してきたが、時間がかかり、骨も折れ、高価であるだけでなく、必要な結果を得ることができないこともよくある。一方、「AlphaFold」は、実験で測定したタンパク質構造情報を学習することで、その他のタンパク質の3次元構造を予測し、その精度は非常に高い。EBIのデータによると、AlphaFoldの予測の約35%が非常に正確で、実験で測定された結果に匹敵できるほどだ。また、残りの45%の予測は、多くのシーンで利用できるという。

 AIがタンパク質構造予測の効率を大幅に向上させたことは、AIによるタンパク質の構造予測が近年多くの人に知られるようになった原因だが、その背後にある計算生物学も既に長年の発展を経てきた。計算生物学は、異なるタイプの生物データによりアルゴリズムとモデルを構築し、生物システム自体を理解し、関連の研究及び応用の学科を推進している。

 AIが発展するにつれて、計算生物学も活性化されている。浦発硅谷銀行の「医療健康業界投資・撤退傾向」報告によると、2021年、米国市場で計算生物学会社に投じられた資金は前年比3倍増の計59億ドルに達し、非計算生物学会社の投資の2倍以上に達した。2019年以来、シード、またはシリーズAの融資を初めて実施したバイオ医薬品製造・研究開発ツール会社707社のうち、計算生物学会社が129社と、18%を占めた。2021年、計算生物学会社への投資額は激増し、2019年と2020年の資金調達の合計のほぼ2倍となっている。

 中国でも、各研究機関と企業が現在、それ関連の展開を行っている。例えば、清華大学人工知能産業研究院で孵化したAI製薬企業・華深智薬(Helixon)は最近、AIと生命科学の連携分野でブレイクスルーを実現し、研究者がタンパク質構造予測の面で全く新しい技術を開発したと発表した。華深智薬によると、その技術を使うと、タンパク質の一次配列だけから、タンパク質の3次元構造のアルコリズムを予測することができるという。

医薬品の研究開発が加速し、高精度医療をサポート

 計算生物学は現在、従来の製薬業界の多額の投資が必要、高い技術力が必要、ハイリスク、周期が長いという特性を改善しつつあり、医薬品の研究開発のプロセスを加速させている。ある分析機関によると、中国の計算生物学の発展の主な方向性は依然としてAI製薬で、2017--21年には関連の創始会社が爆発的に増加し、いずれも既に融資を獲得している。ビジネススタイルを見ると、業界全体において企業向けサービスがメインとなっている。

 このほか、計算生物学は高精度医療の実現をサポートしている。

 ある機関の分析によると、応用の面で、計算生物学産業は大まかに次の3種類に分けることができる。1つ目は、生物の性質・原理を計算、シミュレーションするタイプだ。例えば、タンパク質構造の予測や発症メカニズムの研究、タンパク質相互作用の予測、抗体・抗原のエピトープの予測、ゲノミクスに基づく疾患の原因または新型バイオマーカーを探すなどがある。2つ目は、予測・判断モデルを構築するタイプだ。例えば、AI製薬における標的に基づく化合物性質予測、疾患診断、監視、治療のモデリング、細胞、器官、人体をカバーするバイオシミレーターなどがある。3つ目は生物体に対して抑制・改造を実施するタイプだ。例えば、新療法、医薬品開発、高精度医療、バイオ医薬品製造などがある。うち、高精度医療は今後、計算生物学において長期間、重点的に注力される方向性になる可能性がある。この方向性を見ると、海外では既に、マルチオミクスに基づき展開を行う企業が登場している。

 例えば、2021年11月、アストラゼネカやドイツのメルク、ファイザー、テバなどの大手製薬企業6社は、アマゾン、イスラエルのバイオテック基金と共同でAIと医薬品開発の間を行き来するスタートアップのための新しいインキュベーター「AION Labs」を立ち上げた。「AION Labs」は、イスラエルのアーリーステージエコシステムの下で、AIと計算生物学技術に基づいて医薬品の発見と開発を行うアーリーステージの企業を立ち上げたり、投資したりするほか、こうした企業に資源、指導を提供し、さらに、共同で新技術を開発し、最終的に製薬業界に利益を還元することを目指している。AION Labsは、ある声明の中で、「当機関が投資を行うアーリーステージ企業は今後、AIやクラウドコンピューティングを活用して、新しい治療法をさらにスピーディーに、効率よく探し出し、患者を中心とした高精度医療を推進するだろう」としている。

■関連リンク

生物計算学の商業化実現までに残るハードル

 計算生物学が人々の視野に少しずつ入るようになっているものの、商業化を実現するためには、カギとなるボトルネックがいくつかあり、それを打破しなければならない。

 まず、生物の根本的な原理をさらに明確にしなければならない。現時点で、大量の生物学そのものの根本的なメカニズムがさらに研究されることが必要だ。そして、モデリングと生物認証を行う際、こうした知識を導入してその分野の認知にマッチしない誤差を減らし、精度を高める必要がある。

 次に、統一された計算とデータの枠組みが必要だ。計算生物学が実際に幅広く応用されるためには、マルチオミクスデータ、マルチパート、機能の並列性をカバーするモデルが必要だ。また、異なるアルコリズムとプラットフォーム間での相互操作を実現するように、計算生物学中における画像や動画、分子アトラス、DNAコード、遺伝子発現、電気信号といった複数の異種データを保証し、明確な基準と共通のフォーマットを持つ必要がある。

 このほか、消費級のデータ取得、プロジェクト実施能力、業界の信頼、モデルの解釈可能性の問題、データのプライバシーの問題などもある。


※本稿は、科技日報「被AI催火的計算生物学賽道」(2022年8月15日付6面)を科技日報の許諾を得て日本語訳/転載したものである。