2019新型冠狀病毒引發的肺炎疫情,自去年年底爆發至今,臺灣各大報紙媒體皆報導運用AI分析大數據,用於預測疫情的新聞:

新聞指出,利用人工智慧分析大數據,可以同時收集官方以及非官方來源的資訊,分析與疾病相關的詞彙,比政府單位更快發現疫情。此外也可事先預測疾病蔓延的地點,甚至可以排名城市疫情危險的係數。

然而目前的AI實際協助疾病預測,仍有限制和必須克服的困難。我們邀請專家針對訓練AI的資料、預測模型等方面回應如下:

2020年3月14日
國立臺灣大學地理環境資源學系教授兼系主任/國家蚊媒傳染病防治研究中心 防疫研究專家 溫在弘

人工智慧技術需要仰賴大量的數據,才能找出重要的特徵來進行預測。例如,醫學影像辨識、人臉辨識、聊天機器人等領域大多累積足夠的資料,透過機器學習與電腦快速運算的特性,才能建立有效的預測模式。若將人工智慧技術的架構應用於疫情預測,目前尚有一些需克服的瓶頸:

1. 新興傳染病數據累積不易:我們能用累積足夠的資料,針對經常性的流行疫情發展預測模式,例如:流行性感冒、登革熱等,因為我們能逐漸掌握這些疫情的流行週期、嚴重度與危險因子等特性,所以預測模型的準確性足夠。然而,新興傳染病是由於自然環境與社會結構快速變遷,導致某些病原體開始對人類宿主有致病能力,故多數人都不具免疫能力,受感染地區可能因為人畜或人際之間互相傳染而大幅擴張,擴張速度及範圍的數據比經常性的疫情更難掌握。例如:2003年的SARS、2009年的新型流感(Influenza A/H1N1)和當前的肺炎疫情(COVID-19)等。相較於每年流行的流感或登革熱等疫情,由於大規模疫情爆發頻率較低,我們目前無法累積足夠的傳播途徑、感染效率等數據。因此在疫情爆發階段,大規模新興傳染病很難有足夠的訓練樣本,無法比較每年造成疫情流行的不同條件,故較難訓練人工智慧發展出合適的預測模型。

2. 人類行為的複雜性高,不易全面收集分析:疾病傳播會因為人群之間的互動型態(例如:接觸、飛沫或血液等不同途徑),造成病原體傳播過程不同。而且不同的交通工具(公車、捷運、開車等)與不同人口特徵(性別、年齡、職業等)造成人群間接觸頻率與接觸時間的差異,皆會影響疾病傳播。但很難完整收集這些數據並分析,因此我們尚未全面理解這些影響疾病傳播的重要參數和機制。若能透過物聯網與大數據的架構,可更細緻收集大量人類複雜行為的資料,有助於後續發展基礎的預測模型。另一困難在於個人隱私權的保護,涉及到誰可以收集或使用這些資料,需處理更複雜的資料隱私議題。

3. 深度學習架構複雜,不易找出預測關鍵:複雜的人工智慧神經網路在足夠的資料下,可以建立有效的預測模式。然而,深度學習往往就是許多輸入參數、模型建立,最後直接得出結果。在這過程中,我們依然很難理解這些參數如何相互影響,難以從這些複雜的模型外部,去了解神經網路內部的運算狀況。因此,即便對於同樣的疾病,例如這次的肺炎疫情,利用韓國疫情數據訓練出預測模型,同樣的參數可否延伸到預測歐美的案例,仍充滿不確定性。就算神經網路模式的疫情預測能力很精確,但若不瞭解不同參數效果,很難找出影響疫情走向的關鍵變數。

疫情擴散涉及生物系統與社會系統相互作用的複雜機制,若用人工智慧神經網路架構去預測疫情,目前我們無法清楚解釋AI預測的詳細機制,很難用預測結果來輔助發展合適的防疫策略。因此,我們應該理解運用人工智慧預測疫情的侷限性,以謹慎保守的態度看待模式預測的結果,避免過度詮釋預測的感染人數,造成不必要的社會恐慌。

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明新興科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡媒體公關:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925