麻省理工學院新人工智能算法提高蛋白質工程效率

知兼 2024-04-07 08:18:52

在一項可以顯著加快生物技術和醫學研究步伐的開創性研究中,美國麻省理工學院的一個研究團隊公布了一種新的計算方法,該方法旨在改變蛋白質優化。這種利用人工智能的創新方法專門針對增強蛋白質功能,改變了該領域傳統上采用的費力和耗時的方法。

蛋白質工程是現代生物技術的基石,涉及一絲不苟地設計蛋白質,以實現新的或改進的功能。這 些工程蛋白質是推進藥物開發、環境可持續性和我們對生物過程的理解的關鍵。然而,蛋白質結構的複雜性,加上巨大的潛在氨基酸序列,使優化成爲一項艱巨的挑戰——直到現在。

麻省理工學院團隊的研究在將在最近發表的一篇論文中進行了詳細說明,介紹了基于圖平滑(GGS)的吉布斯采樣(Gibbs Sampling with Graph-based Smoothing),這是一種將基于圖的平滑與吉布斯采樣相結合的方法,以預測有益的蛋白質突變。這種方法不僅簡化了優化過程,還大大提高了識別高健康蛋白質變體的效率。

計算生物學的飛躍

GGS方法的核心是應用圖信號處理來平滑蛋白質的適應性,促進對可能的突變進行更有效的探索。研究人員解釋說,蛋白質設計是一個難題,因爲從DNA序列到蛋白質結構和功能的映射非常複雜。GGS方法通過創建最佳蛋白質配置的可導航地圖來簡化這種複雜性。

這種方法在兩種蛋白質上進行了測試:綠色熒光蛋白(reen fluorescent protein,GFP),通常用作研究中的生物標志物,以及一種來自腺相關病毒( adeno-associated virus,AAV)的蛋白質,這些都對基因治療應用至關重要。結果令人震驚,GGS方法在優化GFP序列方面實現了2.5倍的適應性改進——這證明了其徹底改變蛋白質工程的潛力。

GGS方法的特點

GGS方法與傳統方法的不同之處在于,即使初始數據有限,它也能高效運行。這是蛋白質工程的遊戲規則改變者,在蛋白質工程中,收集大量實驗數據往往是不切實際且昂貴的。通過利用在平滑合適的景觀(smoothed fitness landscape)上訓練的卷積神經網絡(CNN)模型,GGS方法能夠系統地探索突變空間,以識別以前無法訪問的有益突變。

此外,使用基于圖的平滑來爲優化算法創建更可導航的合適景觀,這代表了該領域的一種新方法。研究人員評論說,這項工作體現了人類作爲科學發現特征的偶然性,強調了將來自不同背景的研究人員聚集在一起應對這一挑戰的合作精神。

影響和未來方向

GGS方法的影響遠遠超出了GFP和AAV蛋白質的直接改善。它的廣泛適用性表明,這是解決各種蛋白質工程挑戰的強大工具,從開發更有效的藥物到設計可以 分解塑料廢物的酶。

展望未來,研究人員計劃將GGS方法應用于其他蛋白質,旨在用他們的計算模型超越幾十年的人工實驗。參與這項研究的研究人員說,數十個實驗室已經研究了二十年,但仍然沒有比這更好的了。該團隊的雄心壯志是明確的:利用他們的計算技術來突破蛋白質工程中可能的界限。

0 阅读:0

知兼

簡介:知己知彼,兼聽則明,分享與産業強相關的科技動態