議題背景:

司法院於今(2023)年8月發布一項消息:為了減輕法官的工作負擔並提高審判效率,司法院從去年4月開始發展生成式人工智慧(AI),委託中華電信研發「AI 技術運用於司法院內量刑及裁判書生成」TMT5 語言模型架構,以此工具撰寫「不能安全駕駛」、「幫助詐欺」等兩類犯罪的裁判草稿,以供法官製作裁判時參考,預計今年12月試辦上線。

究竟目前的AI技術可以撰寫裁判書到什麼程度?未來又將如何善用AI技術協助司法系統呢?台灣科中心邀請自然語言處理技術、文字探勘等研究的AI專家解析。

 

專家怎麼說?

【邵軒磊】【高宏宇】【古倫維】

2023年12月12日
國立臺灣師範大學東亞學系教授 邵軒磊

Q1:台灣目前的生成式AI技術可以撰寫裁判書到什麼樣的程度?

根據實作經驗,目前的生成式AI技術可以撰寫文字通順的裁判書,但在細微處仍然無法完全合乎規範,尤其是法條引用常有錯誤。以及,實際使用時,生成式AI依舊無法完全避免幻覺的出現,比如說多人多罪的複雜情狀,常有誤植情形。

Q2:AI撰寫裁判書,國外有類似的案例可供台灣參考嗎?

依照現今的資訊,有奧地利、英國、法國、拉脫維亞、荷蘭等國。但均侷限於某部分的小型任務,如簡易案件預測、資料庫檢誤、文書製作等等,還沒有大規模使用AI撰寫裁判書的例子。

Q3:運用AI撰寫裁判書,目前技術上的限制是什麼呢?有可以優化的方向嗎?

技術上的限制在於,裁判書內容不只是裁判結果,而是「證據認定」、「事實認定」、「法規適用」、「程序規範」等等。這些部分在涉及「價值判斷」的範圍,需要法官的專業與經驗,並不是「AI撰寫裁判書」的能力所及。無寧說「價值判斷」作為司法系統的核心價值,目前尚無法有AI技術上的突破。而有些人提出優化方式是:生成判決書之後再結合「規則法」的技術來檢視,但這個流程目前還未落實,效果不得而知。

Q4:您認為台灣目前生成式AI撰寫裁判書的技術,如何與法律互相配合運用?例如若要善用AI技術協助司法,可能還需要納入哪些領域的專家一起討論?

根據我參與的臺大數位法律中心(https://crema.com.tw/law/)的幾次專案製作與學術論文的經驗,「生成式AI撰寫裁判書」是AI法學的終端應用,實在很難一步到位。若要善用AI技術協助司法,需要三個能力,一、有資訊實作能力;二、能分解法律程序中不同階段任務能力;三、能知道什麼法律任務需要什麼資訊技術。第一、第二可以找各自領域專家,第三項則需要同時兼具跨領域能力的專家。

Q5:運用AI寫判決書會不會造成判決不符合人情和造成偏見?可以怎麼做或是發展,讓AI協助司法時,更能被我們信任,並符合安全規範、公開透明呢?

不使用AI寫判決書也有可能造成「不符合人情和造成偏見」。目前有學說或法規,希望區分某些可信任的演算法或依照演算目的來規範,但目前依然未有定論。從政治學的角度而言,司法系統本身是依照所積累的權威來做決斷,所以司法系統若是具備令社會信服的權威,是否使用或使用何種工具輔助,都會被信任,也會被認為是安全、公開透明的。

2023年12月14日
成功大學資訊工程學系特聘教授兼電機資訊學院副院長 高宏宇

Q1:台灣目前的生成式AI技術可以撰寫裁判書到什麼樣的程度?

以目前國際生成式AI發展狀況與能力來說,還不具備有撰寫完整裁判書的能力。雖然目前生成式AI對於大量已知資料的整理能力相當高,但裁判書中需考量法律準確性。台灣司法院之前也曾推過量刑趨勢推薦系統,以自然語言技術,分析判決書,提供類似案件的量刑參考。但也僅限於資料比對與檢索功能。

Q2:AI撰寫裁判書,國外有類似的案例可供台灣參考嗎?

四年前愛沙尼亞開發人工智慧法官用於索賠金額小於 7 千歐元的糾紛判決,但此提案也僅限於規劃與開發階段,且也希望是扮演協助法官的角色。

美國某些州政府已使用演算法建議合適的刑事判決,近年美國法院已廣泛運用「COMPAS」系統,這是一套幫助法官評估被告的再犯風險,作為量刑的準據。類似AI系統也多為判決決策的輔助,AI撰寫裁判書實際應用面還相當侷限。

Q3:運用AI撰寫裁判書,目前技術上的限制是什麼呢?有可以優化的方向嗎?

主要技術限制會是在判斷法律的邏輯與克服學習資料的偏差問題。前者需從自然語言論述中比對類似的案件,這需要考量法律上的精確性與個別案例情境的差別,AI需理解人類世界的常識,這涉及文化與風俗,這以目前AI或是生成式AI而言都還是不成熟的部分。

另外,AI的知識也是從人類提供的資料學得,資料本身若有歧視或是認知偏差問題,AI也從中學會了偏差認知,就如同COMPAS系統對於有色人種更容易被預測為高再犯率的偏差一樣。

Q4:您認為台灣目前生成式AI撰寫裁判書的技術,如何與法律互相配合運用?例如若要善用AI技術協助司法,可能還需要納入哪些領域的專家一起討論?

可以先從智慧檢索、案例比對與整理方面著手,讓法官與法律業者可以更有效率從大量資料中找到與案例相關的資料,並生成與整理成精確的報告,供法律學者或法官後續使用。

若要善用AI技術協助司法,我認為還需要法律專家、人工智慧與資料隱私專家、倫理與道德學者、法院與司法機構代表,以及社會科學家等一起討論。

2023年12月16日
中央研究院資訊科學研究所研究員 古倫維

Q1:台灣目前的生成式AI技術可以撰寫裁判書到什麼樣的程度?

目前的人工智慧技術在生成式模型方面,已經取得相當大的進展,一般的文獻撰寫都相當流暢。然而判決書中有許多細節無法完全顧及,包括法律用語的使用,引用法條的需求,前後文的推演尚須考慮一般民情等。目前的模型在判斷事實性的內容是否完全正確方面,也就是法條是否能夠正確引用,以及引用的段落的取捨等技術,尚有改進的空間;同時無法確定AI模型是否能夠顧及文化及一般社會認知,以及同理案件當事人立場等構成理想判決書的其他因素。

Q2:AI撰寫裁判書,國外有類似的案例可供台灣參考嗎?

目前各國在法律問題上應用語言模型的情況發展非常蓬勃,例如美國發展法律資料處理系統、愛沙尼亞的AI法官,加拿大AI調解等。然而一般性的應用方向,大部分是協助案件資料搜尋過濾,以降低案件成本。若與裁決有關,目前的應用則較侷限在一定條件的小範圍,例如特定金額以下案件,特定類型案件。

Q3:運用AI撰寫裁判書,目前技術上的限制是什麼呢?有可以優化的方向嗎?

首先,AI語言模型的效能與採用的模型類型關係很大,模型的進步也非常快,我們可以期待如果採用的技術能跟上最新的技術進展,所撰寫的判決書也會越來越完善。然而模型與法條的隨時更新,卻也是此應用的一個限制。目前根據新聞稿所開發的模型,採用發包特定類型案件的方式,模型與資料的維護會是一個挑戰。

第二,好的判決書須考量公正無偏見的問題,這是AI模型的一個已知的問題,可以從模型本身的訓練與使用資料兩方面來談。

我們不確定模型訓練的方式,是否能保證模型的學習過程不會影響最後撰寫判決書的公正性,這包括模型是否有特別做偏見處理,以及是否顧及訓練資料的平衡。從使用資料面來看,讓AI模型自動蒐集消化大量相關的資料,是最能考慮案件全面性而達到公正的方式,但我們也不確定目前的自動裁判書生成是否有包含資料收集的部分,還是仍然由人選擇部分資料作為輸入,AI只負責生成裁判書。

最後,除了公平之外,裁判書仍須考量同理心,閱讀感受,尤其是案件發生的時空背景,例如文化、歷史、社會因子都高度與最後裁判書的判決與撰寫結果相關。然而上述所提也正是目前語言模型AI技術較未發展完整之處。

Q4:您認為台灣目前生成式AI撰寫裁判書的技術,如何與法律互相配合運用?例如若要善用AI技術協助司法,可能還需要納入哪些領域的專家一起討論?
我認為若要使用AI撰寫裁判書,必須審慎考量失誤代價太高的情況發生的可能性,因此我建議朝向 (1) 大量自動應用以資料搜尋整理為主 (2) 自動判決或判決書生成作為一個「建議」,法官仍需作為最後確認的審核者,而自動生成裁判書功能應搭配經驗較豐富的法官,才能充分發揮其優勢,也就是節省撰寫時間,但又有更強的審核者能將錯誤更正。

未來若要持續發展AI寫判決書,領域人員如法官、律師、律師助理;技術人員如模型科學家、開發工程師,特別是關於隱私與AI幻覺問題解決方面;以及法律制定時需要的團隊,包括法條專家、社會學家等都需一起合作,才能提供司法領域更完善的AI技術。

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明台灣科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡我們:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925