議題背景:

今年2月底,臺灣各報紙媒體報導AI開發新抗生素的新聞,皆引用一篇發布在《細胞》(Cell)期刊的研究:A Deep Learning Approach to Antibiotic Discovery.

新聞指出,研究團隊訓練AI深度學習,首度在不預設任何前提的情況下,讓AI找出抑制細菌生長的分子。AI成功找到一個最低毒性、進入初步臨床研究的分子,由研究團隊命名為「halicin」,可以在實驗小鼠體內殺死四類具抗藥性的重大病原體。新聞提及AI可縮短新藥篩選時間、加速藥物開發,是全新的突破。

相關新聞:

然而,運用AI開發新藥物仍有許多必須考量的前提和挑戰。對此,專家分別給予回應如下:

專家怎麼說?

2020年3月9日
國立臺灣大學化學系 朱忠瀚助理教授

藥物分子之所以能成為抗生素,必須滿足兩個要件:(一)能夠抑制細菌生長、(二)對人體無害或毒性很低。該篇論文藉著AI深度學習的能力,從兩個複雜資料庫的數據中,嘗試找出分子結構與這兩個要件之間的關連,最後以實驗測試AI是否能精準地找出新的抗生素。

針對第一個要件,該文首先由研究團隊從美國食品藥物署(FDA)核准的2,560個藥物分子中,去除重複的225個後,以細菌實驗區分出「會抑制大腸桿菌生長」的120個分子與「沒有顯著抑菌效果」的2,215個分子,並將結果告訴AI,讓AI同時深度學習兩種資料,並且自行歸納出抑菌分子「該有什麼樣的結構」。接下來針對第二要件,該文作者使用了含有1,478個分子對人體毒性的資料庫,以同樣方法訓練AI深度學習,讓AI自行歸納出對人體無害的分子應有什麼樣的結構。雖然沒有預設AI用什麼方法歸納,但是必須預設「找有抑菌功能且對人體無毒性」此目標給AI。

以上的思維合情合理,但執行面卻有缺陷。首先,AI深度學習的成果,取決於訓練數據量的多寡。雖然尚未有研究明確顯示需要多少資料量才足夠,但是就如Google圖像辨識功能,動輒需要數百萬幅照片做訓練。該文作者僅採用2,560個分子資料庫中的2,335個分子,其實資料量相對較少。其次,抗菌機制大致可以分為五大類(破壞細胞膜、細胞壁,干擾核酸、蛋白質製造,或是阻止其他細菌代謝物的生合成),藥物分子結構也因抗菌機制的差異而不同。因此AI僅從120種已知「會抑制大腸桿菌生長」的分子,以及2,215個「抑菌效果不顯著」的分子中學習,恐怕很難歸納出針對抗菌機制的普遍適用規則。[註1] 如同透過寥寥幾個單字、例句來學習一個新的語言,多半只能學到一點皮毛。AI是否能從1,478個實驗數據中深度學習,針對藥物分子找出對人體毒性的規則,也不免令人有相同的疑慮。

最後,AI依據先前兩個步驟所學,在一億多個虛擬藥物分子中,先挑出它認為能抑制細菌生長的分子,再從中剔除它認為對人體有毒性的分子。經過這兩輪的篩選找出23個可能作為抗生素的分子。作者實際測試這23個分子的抑菌效果,結果僅8個有抑菌效果,其中6個效果不甚理想,僅有兩個分子抑菌效果顯著。其中一個分子雖然抑菌效果極佳,但結構卻與某些已知抗生素類似,實際上新發現的分子只有一個,這樣的效率只能算是低空飛過。

21世紀以來,傳統的藥物研發方法所找到的分子,僅有一種新的抗生素「Daptomycin」通過FDA審核上市[1]。[註2] 人類亟需新的方法來突破眼前的瓶頸,包含加速開發流程以及收集足夠的資料。該篇論文的結果雖然差強人意,但我認為這篇論文的重要性,在於它首次顯示出運用AI開發新抗生素的策略是可行的;如何取得大量、分子結構多樣性高且包含藥物交互作用資訊的資料來訓練AI,將會是日後AI抗生素研發能否繼續進步的關鍵。

註釋:

[註1] 「能抑菌」的120筆資料和「不能抑菌」的2,215筆資料,對AI的深度學習同等重要。只要人類設定前提,AI總是可以歸納出「某些」規則,這些規則多有代表性、對人類理解抑菌機制有多大用處,則是另外一回事情。

[註2] 傳統的藥物研發方法是搜尋有抑菌功效的細菌發酵產物。Daptomycin即是由玫瑰孢鏈黴菌的發酵產物萃取而來,雖然在1987年已被跨國製藥公司禮來(Eli Lilly and Company)發現,但2003年才被美國FDA核准。

[註3] Fluorouracil結構式如圖

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明新興科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡媒體公關:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925