議題背景:

今(2021)年7月23日, DeepMind於《自然》(Nature)期刊發表最新研究,顯示AlphaFold能可靠的預測人類蛋白質體中將近60%的氨基酸結構位置。作者提到,AlphaFold大規模且準確的結構預測能力將成為重要的工具,可以幫助解決新的科學問題,有助於進一步研究蛋白質的功能。

研究文獻:

AI預測蛋白質結構的脈絡:

  • 去(2020)年11月30日,Google投資的AI實驗室「DeepMind」在部落格文章〈AlphaFold: a solution to a 50-year-old grand challenge in biology〉宣布AI軟體「AlphaFold」可以藉由胺基酸序列,快速且準確預測蛋白質的3D立體結構,但沒有說明太多技術細節。
  • 今(2021)年7月15日,DeepMind在《自然》(Nature)期刊發表了AlphaFold的研究,也在網站〈AlphaFold Open Source〉公開更新版的Alpha Fold v2.0的原始程式碼。
  • 與DeepMind在Nature發布研究的同一日期,2021年7月15日,華盛頓大學在《科學》(Science)期刊發表AI軟體「RoseTTA Fold」的研究結果,接近DeepMind的結構預測能力,而且僅從胺基酸序列的資訊就能快速且準確的預測出蛋白質複合體的結構。
  • 今年7月23日,DeepMind於《自然》(Nature)期刊發表最新研究,顯示AlphaFold能可靠的預測人類蛋白質體中將近60%的氨基酸結構位置,這些預測的數據會由歐洲生物資訊研究所(European Bioinformatics Institute, EMBL-EBI)所屬的公開資料庫免費提供給科學社群。

相關資料:

  1. Jumper, John, et al. (2021) "Highly accurate protein structure prediction with AlphaFold." Nature: 1-11.
  2. Baek, Minkyung, et al. (2021) "Accurate prediction of protein structures and interactions using a three-track neural network." Science.
  3. Tunyasuvunakool, K. et al. (2021) "Highly accurate protein structure prediction for the human proteome." Nature.
  4. 請參考〈「AI可以解決蛋白質結構預測的難題」之專家意見〉。
專家怎麼說?

2021年07月23日
中央研究院生物醫學科學研究所研究員 黃明經

藉由高解析度的蛋白質結構,科學家可深入理解例如病毒變異如何改變感染能力的分子機制,進而設計藥物來反制。在今年初的Nature文章[1],AlphaFold的研發證明,結合大數據和人工智慧演算法,電腦可以從胺基酸序列準確地預測蛋白質的三維結構,掃除了過去須仰賴複雜且費時的物理繞射實驗的限制。

  1. 這份研究,與先前預測蛋白質結構的研究相比,最值得公眾重視的部分是什麼?

現在最新研究呈現以AlphaFold預測整個人類蛋白質體的結果[2],其中有幾點特別值得一提:

(1)研究涵蓋人類蛋白質之規模前所未見,讓人類基因體約兩萬個基因中,僅剩少數(<2%)巨大的蛋白質(>2700胺基酸)尚缺完整結構。

(2)研究中附有指數可評估每個胺基酸被預測結構位置的準確性。分析顯示,AlphaFold的預測結果約60%的胺基酸是可信賴的,包括以往少有結構資訊但常是藥物標靶的膜蛋白。

(3)此研究預測的是全長的蛋白質,因此包含比較複雜的蛋白質結構中,兩個不同區塊結合的狀態。

(4)所有程式碼和預測的結構均公開供免費下載使用。

  1. 我們該如何解讀這份研究?它可以如何幫助我們理解蛋白質體結構與醫藥應用的關係?

AlphaFold的預測並不侷限於人類蛋白質體,更能勝任其他相對單純的物種,包括病毒病菌等微生物。但AlphaFold是一相當複雜的軟體程式集,對硬體設備的要求也高。一般生物學者雖可免費擁有,將面臨無足夠計算資源或不知怎麼使用的困境。所幸所釋出的預測結構已含20個物種、超過35萬個蛋白質,可以應付現階段大部分研究的需要。

此外,另一篇研究是由華盛頓大學貝克教授(David Baker)實驗室的RoseTTAFold[3]提供,讓使用者直接輸入蛋白質序列就可獲得預測結構的服務。RoseTTAFold也是透過人工智慧深度學習產生的預測工具,它的表現接近AlphaFold,若以滿分100的考試來比喻,是80分與90分的差別,推測是因為貝克教授並無對等的龐大計算資源。但RoseTTAFold可以同時輸入多條蛋白質序列,用來預測蛋白質複合體的結構,這是目前AlphaFold尚未有的功能。

半世紀前X-光晶體繞射的實驗解出第一個蛋白質三維結構,開啟了結構生物學和基於結構的藥物研發。AlphaFold和RoseTTAFold代表的人工智慧不僅為這個領域開創新紀元,對生物和醫學各種領域的研究也將產生革命性的影響。我們可以預期,新的研究策略,新的醫藥應用將因此爆發。

註釋與參考資料:

[1] Jumper, John, et al. (2021) "Highly accurate protein structure prediction with AlphaFold." Nature: 1-11.

[2] Tunyasuvunakool, K. et al. (2021) "Highly accurate protein structure prediction for the human proteome." Nature. https://doi.org/10.1038/s41586-021-03828-1

[3] Baek, Minkyung, et al. (2021) "Accurate prediction of protein structures and interactions using a three-track neural network." Science.

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明新興科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡媒體公關:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925