Google發布重磅AI模型!預測地球所有生物分子,將大大加速癌症等疾病治療研究

愛範兒 2024-05-09 19:30:24

Google 旗下的 DeepMind,一夜之間讓學術界炸了鍋。

5 月 8 日,DeepMind 官宣了一個新的 AI 模型:AlphaFold 3。

相關的研究論文,發表在權威的《自然》雜志上,一來就占據了頭版。

ChatGPT 之後,AI 模型不計其數,但最有資格自稱改變世界的,可能只有 AlphaFold 3。

AlphaFold 超級進化,讓生物世界更加「高清」

我們在中學生物課上學過,蛋白質是由氨基酸通過肽鍵連接形成的長鏈分子,在空間中折疊成複雜的三維結構。

三維結構決定了蛋白質的功能,直接影響了藥物設計和疾病治療。

可以說,蛋白質結構預測,是生物學最重要的命題之一。

但預測蛋白質的三維結構,是一件難事,往往需要複雜的實驗,甚至被形容爲「困擾了生物學家 50 年的問題」。

2016 年,DeepMind 的 AlphaGo,戰勝了職業九段棋手,重寫了圍棋這門古老的技藝。

DeepMind 的 AlphaFold,則要探聽生物學的密碼,窺探生命本身的堂奧。

2018 年,AlphaFold 1 發布。

2020 年,AlphaFold 2 面世,已經可以在幾分鍾內大規模地准確預測蛋白質的形狀,並精確到原子級別。

現在,我們迎來了 AlphaFold 3,一個野心更大的 AI:超越蛋白質,探索所有的生物分子。

生物分子,即構成生物體的分子,包括蛋白質、DNA、RNA 等。

DeepMind 認爲,只有了解生物分子如何在數百萬種組合中相互作用,才能開始真正理解生命的過程。

一言以蔽之,AlphaFold 3 比起前代,覆蓋的範圍更廣了,可以准確預測蛋白質、DNA、RNA、配體等生物分子的結構,以及它們如何相互作用。

先來看一些 AlphaFold 3 的預測結果。

7PNM,是一種普通感冒病毒的刺突蛋白。

如圖所示,AlphaFold 3 對 7PNM(藍色部分)與抗體(綠色部分)、單糖(黃色部分)相互作用時的結構預測,與真實結構(灰色部分)吻合。

預測背後有其意義,把這類蛋白質研究清楚,科學家便能更了解免疫系統和包括新冠在內的冠狀病毒,甚至提出更好的治療方案。

除了蛋白質的結構,AlphaFold 還能預測分子複合物,即多個分子組成的複雜結構。

下圖的酶,來自一種對植物有害的土壤真菌。

AlphaFold 的預測結果,包含一個酶蛋白(藍色部分)、一個離子(黃色球體)和一些單糖(黃色部分),契合了真實結構(灰色部分)。

深入了解這種酶與植物細胞如何相互作用,可以幫助研究人員開發更健康、抵抗力更強的作物,給農業生産帶來實際的好處。

類似地,AlphaFold 3 預測了一個由蛋白質(藍色部分)、RNA 鏈(紫色部分)和兩個離子(黃色部分)組成的分子複合物,同樣和真實結構(灰色部分)高度匹配。

這種複合物參與蛋白質的合成,即細胞生命活動和健康的基本過程之一,研究意義同樣深遠。

展現預測結果的准確性,再強調相關的用途,DeepMind 想要告訴世界,AlphaFold 3 是一種「革命性的模型」。

一方面,研究範圍更廣了。把視野擴充到蛋白質之外,特別是配體等小分子,可以涵蓋更多的藥物。

另一方面,准確度也提高了。對于蛋白質與其他分子類型的相互作用,與現有的預測方法相比,AlphaFold 3 的精度至少進步了 50%。其中一些重要的相互作用,提升甚至達到了 100%。

這樣一來,AlphaFold 3 可以造福更多的研究,加速藥物設計、推動基因組學、研發更健康的作物、開發生物可再生材料……

說到技術原理,AlphaFold 3 基于 AlphaFold 2 改進,核心是 Evoformer 深度學習架構,並使用了類似 Midjourney 的擴散網絡。

使用 AlphaFold 3 的過程,有些像我們和大語言模型聊天。輸入對生物分子的描述,AlphaFold 3 生成這些分子的三維結構,並研究它們如何相互作用。

AlphaFold 3 給出預測結果的過程,類似逐步去噪的 AI 文生圖擴散模型,從模糊的原子雲開始,逐步彙聚成准確的分子結構。

講人話的生成式 AI,增強了格子間打工人的生産力。AlphaFold 對科學家們的意義,也不外如是。

在實驗室進行蛋白質結構預測,可能要花掉攻讀一個博士學位的時間,以及數十萬美元。上億個預測,怕是窮盡幾百萬人的一生也無法完成。

但有了 AlphaFold,科學家們可以提出大膽的問題、創新的假設,然後在實驗室進行測試,加速研究的進程。

DeepMind 的一句話,足以向普通人概括 AlphaFold 3 的意義:

AlphaFold 3 將生物世界帶入高清。

將 AlphaFold 交給世界,等待科學發現的新文藝複興

之前爲了嘲諷 OpenAI 的閉源,馬斯克給它起了個綽號:CloseAI。

投餵了 OpenAI 好幾篇論文的 Google,在某些方面更有開源的精神。

2021 年 7 月,AlphaFold 2 在 Nature 發布了論文,也開源了代碼。

截至目前,AlphaFold 2 已用于預測數億個結構。全球數百萬研究人員,將 AlphaFold 2 用于瘧疾疫苗、癌症治療和酶設計等領域。

也是在 2021 年 7 月,DeepMind 和歐洲生物信息研究所(EMBL-EBI)合作,發布了 AlphaFold 蛋白結構數據庫,提供了迄今爲止最完整、最准確的人類蛋白質組圖景。

DeepMind 在官宣的博客裏提到,這是自人類基因組繪圖以來最重要的數據集之一,現在他們將 AlphaFold 的力量,免費交到全世界科研人員的手中。

一年之內,超過 50 萬研究人員使用了 AlphaFold 數據庫,查看了超過 200 萬個結構,加速解決塑料汙染、抗生素耐藥性等現實問題。

自那以後,數據庫還在不斷地擴充。

2022 年 7 月,DeepMind 發布了幾乎所有科學已知的蛋白質預測結構,總共超過 2 億個,除了人類,其中還包括了植物、細菌、動物和其他生物體的預測結構。

AlphaFold 數據庫,就像蛋白質結構的「Google 搜索」,也像一個繁星閃爍的蛋白質宇宙。蛋白質的三維結構是生命的基石,看起來又精致美觀,讓人感歎大自然造物的神奇。

不過,這次發布的 AlphaFold 3,相比 AlphaFold 2,態度稍微顯得保守,招致了一些批評的聲音。

AlphaFold 3 目前沒有開源,不能在本地部署,研究人員只能通過 DeepMind 最新推出的研究平台 AlphaFold Server,免費訪問大部分功能,且用途是非商業的。

最阻礙科學進步的是服務的訪問次數:每天只能進行 10 次預測。

摳門行爲的背後,DeepMind 可能有自己的商業考量——子公司 Isomorphic Labs 已經與制藥公司合作,將 AlphaFold 3 應用于藥物設計。

Google DeepMind 聯合創始人兼首席執行官 Demis Hassabis 樂觀地表示,首批 AI 設計的藥物可能會在未來幾年內准備好進行測試。

當然,AlphaFold 還是有局限性的。

中國結構生物學家顔甯,曾經在 2022 年回答過關于 AlphaFold 2 會否替代科學家的話題。

在 Nav/Cav 方面,AlphaFold 2 依舊停留在他們 2017 年的水平,而在測試新型小分子與蛋白的相互作用時,AI 預測無一正確。

顔甯解釋,生物結構學不僅僅是關于折疊,更要理解蛋白質的動態變化,理解與其他生物大分子或者調節小分子的相互作用,理解在細胞原位裏的狀態,因爲數據不夠,這些都是 AI 還無能爲力的領域。

如今,AlphaFold 3 在 AlphaFold 2 的不足之處,邁出了一大步,讓我們看到了預測不同生物分子相互作用的可能性,但它仍然是專注于分子結構的靜態預測,有時還會産生幻覺。

之前在接受采訪時,Demis Hassabis 批評了 AI 的炒作現象。

他認爲,AI 應該被作爲「科學的終極工具」,比如預測蛋白質結構的 AlphaFold 模型,人類即將迎來科學發現的新文藝複興。

英雄所見略同,英偉達的黃仁勳,也很看好醫療和生物技術的 AI 賽道,在 2024 年 GTC AI 大會上介紹了不少 AI 醫療服務,並與強生等公司在手術和醫學成像領域達成了合作。

Sora 模擬物理世界,而 AlphaFold 3 更讓我們了解生物世界,回歸了我們對 AI 最初的期待——加速科學發現,推動人類進步,理解生命本身。

雖然 AGI 還遠在天邊,文字、圖片、視頻、蛋白質分子,彼此不同,卻又相互呼應。

AI 確實已經如此強大,也與日常生活越來越緊密相關,我們可以期待,每天都有更多的創新出現,也有更多的謎團被解開。

張成晨

利若秋霜,辟除凶殃。 工作郵箱:zhangchengchen@ifanr.com

郵箱8

#歡迎關注愛範兒官方微信公衆號:愛範兒(微信號:ifanr),更多精彩內容第一時間爲您奉上。

愛範兒|原文鏈接· ·新浪微博

0 阅读:9