議題背景

美國的貝爾實驗室(Nokia Bell Labs)研究團隊開發了一個新的AI演算法,可以根據「DreamBank」資料庫,自動把超過24,000 份夢境報告的敘述,拆解成段落、句子和單詞,並找出單詞之間的關聯和語法規則,分析夢境和現實生活的連結。新聞報導指出,研究人員認為這項成果可以幫助心理學家找出異常的夢,有助判斷人們的心理健康。

此篇研究於2020年8月26日發表在英國《皇家學會開放科學》期刊(Royal Society Open Science)上,研究團隊也製作《The Dreamcatcher》這個網站,把AI分析夢境報告的結果用圖像表示。

研究原文:

Fogli, A., Maria Aiello, L., and Quercia, D. (2020). “Our dreams, our selves: automatic analysis of dream reports.Royal Society Open Science, 7(8), 192080.

相關新聞與討論:

究竟AI為什麼可以解夢?真的可以藉此知道夢境的意義,或幫助我們發現心理健康的問題嗎?我們邀請專家釋疑。

專家怎麼說?

2020年9月18日
國立政治大學心理學系暨心理學研究所教授 楊建銘

利用大數據來分析夢境內容相當有趣,但它的實用性可能有待驗證。至於國外的研究是否可以應用於中文的夢境分析,我想語言、夢境以及情緒與心理狀態的經驗絕對有文化差異,但也有他的共通性。如果有方法能精確分類中文和英文語句的話,運用到中文的情境應該還是有部分價值,若透過更多中文資料來修正AI系統,英文的夢境解析系統應該也可以適用中文。至於應用部分,我相信「異常」的心理狀態的確會有不同的夢境,但透過夢境是否能夠偵測「心理異常」,就比較有難度了,偵測到偽陽性(False positive)[註1]的機率應該蠻高的。若能夠比較已知有精神疾患者以及沒有精神疾患者兩組人的夢境,的確可能有所差異,但是這篇研究不是這個情況,而是反過來從夢境去推論人的心理狀態,更難做出精確的結論。況且記錄夢境本身就是件有難度且可能產生偏差的事,回憶夢境時很容易會加入清醒時的意念或選擇,若目的是要偵測是否有一些異常的心理現象,或許使用問卷、晤談或心理測驗會更容易些。在心理治療當中,如果要用夢境協助判斷病患的心理狀態,實際上需要對於病患的狀況有一定程度的了解,並且和病患互動並討論夢的情緒和感受,不是僅依靠文本分析。我的結論會是,這是個有趣的議題以及研究,可以從大數據當中看到很多我們在另一個意識狀態下的內在認知活動,但是否能夠有實用的價值,成為一個「解夢」的機器,這就有待更多研究來證實。

相關利益聲明:無相關利益

2020年9月18日
台灣應用心理學會理事長 蔡宇哲

「AI可以解夢」這個議題可以看成AI分析臉書文章來判斷心理健康的升級版。臉書、推特等社群軟體的文章[註2]和夢境報告,都必須是作者自己透過文字、語言表達出來,而這就非常涉及個人特質、教育程度、語言能力。姑且不論分析夢境是否真能探視內心,作夢者表達夢境就是一種個人主觀的詮釋,跟清醒時表達某件生活事件的感想是一樣的,差別在於夢境是睡眠中自主發生、無法控制。

另外,回憶夢境還涉及記憶的提取,人類的記憶同樣包含個人主觀的詮釋,並不是百分之百的回應原本夢境的內容。最後來到作夢者的個別差異。有些人的作夢頻率高但有些人卻很低、幾乎不作夢[註3],因為做夢頻率的高低不同,可能會導致這兩者回憶和敘述夢境的能力有差異。而貝爾實驗室的這篇研究[註4]獲得的資料多半來自作夢頻率較高者,因此建立的資料庫是偏態[註5],相對缺少那些作夢頻率低的人。

方法學上,以「當事者在清醒時回憶並描述夢境的文字」為研究素材,得出「夢境是現實生活延續」的支持性結論,的確有循環論證的疑慮,不過研究夢與現實生活連結的實驗方法眾多,要解決這個問題並不難。例如有一個研究是讓受試者在白天長時間玩俄羅斯方塊,透過受試者自由報告睡眠中夢的內容,發現很多人作的夢中有方塊、箱子從空中掉落的情節,特別是俄羅斯方塊的初學者;即使是理論上不記得現實生活中玩過俄羅斯方塊的失憶症患者,也描述夢中出現方塊的情節[註6]。俄羅斯方塊這類的視覺刺激一般不太會出現在夢中,也比較不涉及語言文化因素,因此就可以避免循環論證的疑慮。

相關利益聲明:並未任職或與此文相關的單位有任何利益關係。

2020年9月22日
國立台灣大學語言學研究所副教授 謝舒凱

這個研究用的是傳統的自然語言處理(Natural Language Processing,NLP)[註7]方式來解析夢境報告,並未使用媒體報導的AI技術例如晚近的神經網路深度學習技術。作者們用的其實比較像是借用文本分析(Text mining/Text analytics)的流程,在心理學家開發的一種編碼夢境的系統下,結合外在知識資源庫(如維基百科與詞彙網路)來辨識夢境文本反映出的主題、主角、互動與情緒等等,並嘗試討論夢對應現實生活的連結。

這種分析的好處是可以規模化,可以不再完全依賴人力做耗時的爬梳與分析。這也是近年來自然語言處理和文本分析結合,在許多領域都取得一定成果的技術典範。不過用這種依賴語言資料的方式來解析夢境,可能會遭遇幾個挑戰,比較是一般媒體報導較未關注到的科學討論,如下四項。

1.  大量且包含多元背景的做夢者樣本很難取得。如研究作者自己坦言,這個研究的樣本主要來自住在美國、有不錯教育背景的人。長期而言,也很難取得包含各年齡、性別、地區等資料的樣本。此外,受限於個資問題,也很難得到完整的做夢者檔案(如個人特質等),因此在實驗上很難作控制,統計上也無法觀察共線性效應[註8]。

2.  從敘事角度來說,也有做夢者的「選擇性說法」,即只選擇自己記得或顯著的部分,以及敘事表達的能力不同等問題。做夢者可能「轉寫」夢境,且夢境與現實生活都不可能隔天一模一樣地重複,所以無法重複驗證或重製(reproducible)夢境與現實的關聯性。

3.  這樣的研究相當依賴語言。不同的語言文本,會有不同的語言帶來的解析問題。以中文來說,雖然不用處理詞形還原(lemmatization)[註9],但要處理斷詞或分詞(word segmentation)[註10]的問題。從語言表達的角度來看,敘事語言的結構,如敘述夢境,與常規文本(如新聞、教科書)也不同。

4.  這個研究用的機器學習方法,需要標準答案據以學習與預測。目前的分析流程,仰賴許多在自然語言學界中仍未確認實效的工具。這個研究使用自然語言處理工具箱(Natural Language Toolkit,NLTK)[註11]中的句法剖析器(parser)[註12],背後先由研究人員預設一定的語法表達架構,預設 用NLP分析敘述夢境的文字時,可以連結到已經定義好的詞彙,但因為詞彙的定義可能不包含解讀整段文章的脈絡,以及歧義的概念,所以NLP分析系統仍無法完整連結夢境報告和既有的詞彙定義。此外,這篇研究使用的資料,來自一般日常生活使用的語言,而非從「夢的世界」產生的語言,所以如何用科學方法連結生活和夢境,仍有討論空間。在情緒解析上,這個研究用的計算方式是仰賴「情緒詞表」,假設有特定文字可以分別代表正向、中性以及負向,三種情緒,再連結敘述夢境的文字。但此方法比較容易讓結果偏差,已經不是最近研究情緒計算領域的作法,近期大多採用AI深度學習的方式,較為準確。

總之,機器是否可以解夢?要看我們如何定義「解」。這個研究呈現的是,可以某個程度地將機器對夢的解析對應到人對夢的解析,也可以某種程度的支持「夢境是日常生活的延續」、「女性的夢中比起與環境互動或攻擊,較多的是情緒性的表達等」各種夢境心理學的假說。也許我們可以高度期待機器可以輔助心理學家或諮商實務工作者,從夢中找到可預測或判斷心理狀態的指標,讓心理治療歷程更為順暢,但是要讓AI可以解夢,應該還需要更多研究。

相關利益聲明:無相關利益

註釋與參考資料:

[註1]這裡的偽陽性是指,受測者沒有心理疾患,卻被判斷為有心理疾患。

[註2] 延伸閱讀:蔡岷哲(2019)。〈臉書發文也能預測憂鬱症?從動態分析看出其中奧妙之處〉。臺大科學教育發展中心。
文章中提到已有學者分析病患在社群軟體上的貼文,希望藉此知道預測心理疾病及憂鬱症的方法。

[註3] 參考文獻:Eichenlaub, J. B., Bertrand, O., Morlet, D., and Ruby, P. (2014). “Brain reactivity differentiates subjects with high and low dream recall frequencies during both sleep and wakefulness.Cerebral Cortex, 24(5), 1206-1215.
根據研究,回憶夢境的頻率高是指一週超過3次,頻率低是指一個月少於2次。

[註4] 參考文獻:Fogli, A., Maria Aiello, L., and Quercia, D. (2020). “Our dreams, our selves: automatic analysis of dream reports.Royal Society Open Science, 7(8), 192080.

[註5] 偏態:依照一般的統計狀況,資料呈現常態分布的曲線。如果多數資料不是集中在曲線的中央位置,表示資料「左偏」或「右偏」,就屬於偏態的資料分布。
參考來源:國家教育研究院雙語詞彙、學術名詞暨辭書資訊網,教育大辭書(偏態),2020年9月23日檢索。

[註6] 參考文獻:Stickgold, R., Malia, A., Maguire, D., Roddenberry, D., and O'Connor, M. (2000). “Replaying the game: hypnagogic images in normals and amnesics.Science, 290(5490), 350-353.

[註7] 自然語言處理是分析文本的一系列方法。請參考:國家教育研究院雙語詞彙、學術名詞暨辭書資訊網,圖書館學與資訊科學大辭典(自然語言處理)

[註8] 共線性效應(Multi-Collinearity):線性回歸的統計模型中,若含有多個變數,且彼此相關時,會造成統計分析的困難,例如估計值不精確、互相衝突或解釋時互相矛盾等。請參考:國家教育研究院雙語詞彙、學術名詞暨辭書資訊網,教育大辭書(多元共線性),2020年9月26日檢索。

[註9] 詞形還原(lemmatization):英文的詞彙很多都是從單詞衍生,例如painful是pain這個單詞的衍生詞彙;詞形還原即是去掉詞彙中衍生的部分,提取能夠表達完整語意的單詞。

[註10] 斷詞或分詞(word segmentation):分析文本時,需要先把句子拆解成單詞,才能處理後續的語意分析。請參考:中央研究院,中文斷詞系統,2020年9月26日檢索。

[註11] 自然語言處理工具箱(Natural Language Toolkit,NLTK):提供研究人員分析及處理文本的工具。請參考:NLTK 3.5 documentation

[註12] 剖析器(parser):一種程式,會根據人類給的文法定義,把輸入的句子輸出成語法結構圖。請參考:國家教育研究院雙語詞彙、學術名詞暨辭書資訊網,資訊與通信術語辭典(剖析器),2020年9月24日檢索。

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明新興科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡媒體公關:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925