CCS特集2025年夏:SyntheticGestalt
分子特化型基盤AI開発、立体構造や表面電位を学習
2025.06.24−SyntheticGestaltは、ライフサイエンス領域での人工知能(AI)開発に特化した研究開発企業。今年4月に世界最大の分子特化型基盤AIモデル「SG4D10B」を開発した。これをベースにADMET(体内動態および毒性)や各種物理化学的性質の予測など、医薬品や化粧品、農薬、新素材などの幅広い分野において独自のAIモデルを構築することが可能。基盤モデルを下敷きにすることで、従来の予測精度と汎化性能の低さの課題を解決する高精度AIの活用が可能になると期待される。
同社の設立は2018年。当初から分子に特化したAI開発を目指しており、英国と日本のベンチャーキャピタルから1,400万ドルの資金を調達。これまでは主にAI創薬に関連した受託研究・共同研究のスタイルで事業を行ってきている。
今回の「SG4D10B」は、国産生成AI開発を支援する経済産業省と新エネルギー・産業技術総合開発機構(NEDO)のGENIAC(Generative AI Accelerator Challenge)の支援を得て開発したもの。ウクライナのEnamine社が持つ960億化合物の中から100億の化合物情報を学習データに利用している。NVIDIAやIBMなどの先行グループが開発した分子基盤モデルと比べて学習量が圧倒的に多いことに加え、分子の立体構造や表面電位などの詳細情報を取り入れて事前学習させていることが特徴。3次元構造に加え、複数の配座を考慮したことから“4D”と称しているという。この基盤モデルの上で、目的に合わせて各社が保有している数百から数万件規模のデータを用いてAI応用モデルを構築して実際に利用するかたちとなる。
基盤モデルを使った応用モデルについては、20種類の世界レベルベンチマークで最先端の性能を達成しており、その応用は創薬だけでなく、幅広い領域に及んでいる。例えば、ビールとウイスキーにおける香り化合物と相互作用する受容体タンパク質の発見、食品機能成分に結合するタンパク質の発見とその生理機能の予測、バイオメタン化ためのメタン生成細菌・酵素の発見、化学プロセスをバイオプロセスに転換するための酵素タンパク質の発見−などの事例がある。AIモデルができてしまえば予測は瞬時に行えるため、数百億の化合物群からの探索も短時間で可能。
「SG4D10B」については、今年3月に米国カリフォルニア州サンノゼで開催された「NVIDIA GTC 2025」で発表しており、欧米からの反響も期待されるところ。共同研究スタイルのビジネスを拡大させるとともに、GoogleやAWSと協力して無料公開版の提供も行っている。