此篇報導為與工商時報合作,並刊載於<科學家新視野專欄-AI攻防社群媒體的隱私與道德>

國立成功大學數據科學研究所教授 李政德

背景:

網路技術的成熟與行動裝置的普及,使社群媒體成為人們分享生活點滴與獲取最新資訊的重要平台,社群互動固然帶來樂趣與便利。但AI技術在社群媒體上因此形成雙面刃,為演算技術的研發帶來機會,也為隱私道德的界線帶來挑戰。

近年人工智慧亦廣泛應用於社群媒體,作為廣告推薦系統(AD Recommender Systems)、病毒式行銷(Viral Marketing)、以及用戶情緒偵測(User Sentiment Detection)。然而諸如假新聞(Fake News)橫行、網路霸凌(Cyberbully)以及洩漏個資(Privacy Leaking)等可能侵害隱私道德。AI技術在社群媒體上也被惡意人士用來探測個人隱私資訊,如透過AI還原用戶彼此間的社交關係以及揭露使用者曾活動的地點。

本文將介紹AI應用在社群媒體上的隱私保護與道德挑戰。

 

AI於社群媒體上的用戶隱私攻防戰

你是否知道,利用社群媒體上貼文的文字就能讓AI得知你最近在什麼地方活動?你是否知道有心人士利用AI僅需透過打卡紀錄,就能準確猜出你有哪些朋友?透過AI監督式學習中的其中一種方法「隨機森林」(Random Forest),訓練在貼文文字所表示的特徵向量上,就能準確預測用戶發表貼文的所在地點。但是若將部分文字的語意向上層擴展(Generalization),譬如把貼文中的「新光三越」換成「百貨公司」,就會有效降低AI的預測效果。另一方面,研究人員設計出基於主動學習的隨機漫步演算法(Active Learning-based Random Walk),在用戶打卡資料所建構的異質性圖形結構(Heterogeneous Graphs)上運算,便可成功預測朋友關係。不過,若藉由一種特殊打卡防衛機制(Check-in Shielding Scheme),來推薦兼具隱私保護與地點語意的打卡地點,便能有效降低洩漏交友隱私的風險。

 

兼顧用戶隱私保護與預測實用性的社群AI

隨著用戶愈來愈重視隱私,他們在社群媒體上所揭露的個資和數位足跡將大量減少。然而眾所周知AI仰賴大數據進行訓練學習,是否能讓應用於社群網路的 AI(如朋友推薦與用戶興趣偵測),能兼顧用戶隱私保護與預測實用性呢?研究人員實驗發現,透過矩陣運算有效融合使用者個資(如性別與年齡)與社群網路結構(Social Network),加上圖特徵表示學習技術(Graph Representation Learning),將能彌補隱私所帶來的資料稀疏性問題,讓 AI 既能保護個資,也能準確推薦社群朋友與偵測興趣[1]。此外,AI也能輔助自動設定貼文的隱私,根據文字資訊與使用者隱私設定的歷史紀錄,推薦該貼文的隱私層級。例如僅家人可見(Family)、親密好友可見(Closed friends)、一般朋友可見(Acquaintance),以及完全公開(Public)。其中一有效做法是結合文字特徵與用戶屬性的多任務學習(Multi-Task Learning),可同時預測貼文類別並推薦隱私層級。

 

用AI打擊越過道德界限的社群行為

社群媒體上近年最受關注的議題,莫過於假新聞橫行、網路霸凌猖獗,以及仇恨言論引起族群對立,AI對這些越過道德界限的社群行為已有應對之策。其基本精神是從大量社群媒體貼文中學習,理解文字隱含語意,並結合用戶屬性、回覆情緒,以及轉傳擴散結構,讓深度學習演算法找出四者彼此間與不具道德行為的關係。針對假新聞偵測,筆者帶領的研究團隊設計出「圖神經網路模型」(Graph Neural Network),捕捉用戶性格與貼文主題間的關聯,並透過共注意力機制(Co-attention Mechanism)找出哪些字詞與哪些用戶是偵測假新聞的關鍵線索。針對網路霸凌偵測,筆者的團隊亦發現,回覆者的文字情緒順序以及回覆習慣[2]對早期偵測貼文霸凌有正面關係[3],並據此開發一個融合了考量回覆序列、社群結構、語意理解的深度模型,在霸凌行為萌生之初便能做到準確預測,可供社群平台管理者應用。

AI迎戰社群媒體的隱私與道德議題會是一個不斷演化的過程,有心人士透過AI揭露隱私的方法會持續進步,社群媒體越過道德界限的方式也不斷調整、設法避過AI。但AI本身的學習框架與訓練方法,亦能隨著累積、更新的社群數據來修正其預測模型,透過妥善運用AI來保護隱私道德,以對抗惡意使用 AI 造成的問題,我們或許可以期待,終將邁向一個兼具隱私保護與道德品質的社群世界。

註釋與參考資料:

[1] Xu, D., Yuan, S., Wu, X., & Phan, H. (2018, June). DPNE: Differentially Private Network Embedding. In Pacific-Asia Conference on Knowledge Discovery and Data Mining (pp. 235-246). Springer, Cham.

[2] 文字情緒順序及回覆習慣:譬如一開始回覆多為正面情緒,後來回覆轉為負面情緒,這種將有較高機會是霸凌。

[3] 「早期」是指在貼文被張貼後,例如一小時內,便能準確預測未來是否會有霸凌行為發生。

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明新興科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡媒體公關:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925