生成式AI輔助寫判決書，智慧司法的時代即將來臨？活動紀錄

活動日期：2023年12月17日

主辦單位：台灣科技媒體中心

協辦單位：財團法人民間司法改革基金會（以下簡稱司改會）

活動背景：

司法院在112年2月6日發布第一次新聞稿宣布啟用AI量刑資訊系統，隨後8月27日再次發布新聞稿表示計畫運用生成式AI來協助法官撰寫判決。此後，司改會與其他公民團體於9月26日舉辦記者會說明對此議題的擔憂與呼籲。來自g0v的vTaiwan小組運用數位平台的力量，希望邀請多元利害關係人分享意見，蒐集統整後交給司法院參考。

台灣科技媒體中心關注正在發展中的科學／科技，其在社會上是否有充足且根據科技發展現況的討論，並認為科技發展與社會討論應該互相形塑。但是目前為止，該議題的多元面向尚未有機會展現，也極少有機會理解專家與大眾對於這一進展的看法。舉辦本活動的目的，希望讓法律專家與AI專家分享「生成式AI應用於協助法官撰寫判決」這一議題的見解，透過與談人和在場聽眾的參與，開啟公民社會多元討論的可能。

然本次活動並未廣邀各方專家與司法院代表出席，參與者也未仔細設計邀請對象（教育背景、年齡、地區、是否為利害關係人等）。

本場活動由台灣科技媒體中心發布臉書活動資訊及司改會粉專宣傳。

這是台灣科技媒體中心首次舉辦AI與司法議題相關的活動，或有不周延之處，期待未來有更豐富的討論。

補充資訊：

活動資訊：

本活動舉辦在2023年12月17日週日上午9:30-12:00，地點在司改會會議室，三位與會專家，分別是臺灣師範大學圖書資訊所特聘教授曾元顯、台灣大學語言學研究所教授謝舒凱、義謙法律事務所主持律師及司改會數位法小組召集人林俊宏律師，由台灣科技媒體中心執行長陳璽尹擔任主持人，工作人員分屬台灣科技媒體中心與司改會，出席參與者為11位。以現場舉手統計，約有半數是法律背景、半數是科技背景，對法律與AI皆有涉獵約為3人。

活動紀錄：

法律端的討論

今年八月，司法院宣布要以AI（人工智慧）來分析，為法官撰寫「不能安全駕駛」與「幫助詐欺」等兩種犯罪的裁判草稿，這讓包括司改會在內的許多民間團體與社會大眾感到震驚，並對此表達擔憂，雖然這在國外已有討論，但具體的AI系統如何訓練及其細節一直不明朗。

司改會等民間團體要求司法院公開AI系統的具體細節，包括它的訓練方式及應用範圍。司法院最終同意召開公聽會（2023年12月28日）。在公聽會前夕，司法院發布指引草案，其中包含AI判決只能輔助審判、使用者（法官）擁有完全的自主權以及系統設置時必須考慮風險管理等原則。

但司法院提出的指引草案似乎有許多進步空間。重要的是，判決的合理性、公正性和社會接受度是最基本的需求。在司法系統中應用AI是否能滿足這些需求？這將直接影響人類未來如何利用AI技術。

我們需要透明性原則來了解AI如何作用於法律判決，並且其運作必須是可解釋的。對於司法院的操作細節，公眾參與度低，許多細節仍不清晰。AI在處理高發案件如車禍、詐騙等方面的應用，目的是為了減輕法官的工作壓力，但對於AI如何影響判決現在沒有答案。司法院似乎更專注於降低司法人員的工作量而非評估AI對整個司法系統可能造成的影響。

法律領域可能存在偏見持續而且重複，現行法官的判決模式即存在類似困境。然而，法律應該也的確會隨著社會價值的演進而進步，甚至法律所開創的價值有機會引領社會改變。但，就如法官面對特定條件時有可能會做出特定判斷，AI的應用是否更可能固化過往的判決模式，導致無法反映社會多元和少數群體的價值，如原住民的特殊法律需求。法律判決追求的不僅是一致性和穩定性，而是根據每個案件的特殊價值做出考量。AI的資料若是匱乏，可能會系統性地對這些群體產生不公平的判決。

在現今制度下，法律演進與社會進步奠基在不斷的更新與調整，引進AI是否會使得法律見解僵化，不利於法律的健康發展，這是法律專業人士面對AI的未知發展感到困惑，對未來AI可能帶來變革充滿疑慮的其一原因。

從法治角度看，法官必須直接審查證據來裁判。AI介入處理證據時，會不會導致法官未能親見證據本身，違背直接審理原則？這種二手訊息處理可能破壞法律制度要求的直接審理原則。

面對AI輔助司法判決的疑慮，可能的解決方式是讓AI提供類似量刑參考資料，而非直接撰寫判決草稿，例如，提供不同酒精濃度相關的刑期參考，或基於被告年齡、教育程度的過往判決資料。這樣的輔助對法官是一種資訊來源，供參考而非決定。資料的整理與提供，若只是單純的數據匯總，可能不需AI，而是一個自動化的資料處理過程，或許能減少一些擔憂，但仍需考慮這些資料在沒有完整脈絡的情況下，是否可能誤導法官的判斷。以及資料的選取與摘要，本身就可能是基於價值選擇。因此，雖然AI輔助系統在證據分類和資料摘要上具有潛力，但我們需要謹慎定義其角色，以確保法律判決能反映人的價值和社會進步。這也是法律專業人士對於AI輔助判決所抱持的最大擔憂。

技術端的討論

司法院目前要發展的AI系統是否透明，讓各界有所疑慮，建議應開源其訓練資料及技術細節，以提高公信力。圖靈獎得主楊立昆提倡AI技術開源，強調這對技術進步的重要性。司法院應公開其AI系統的訓練過程與實驗數據，甚至程式碼，以允許研究者與利害關係人了解其運作並檢視可能的偏見。此外，AI的訓練應考量數據量的偏誤，避免法官成為AI的橡皮圖章。

AI之於司法系統的角色，在目前的階段，專家建議應是事後「輔助」，而非事前草擬；比如分析法官判決書中可能遺漏的要點。AI應該用於提升判決的品質，而非一鍵生成判決書。透過開源的方式，司法院的AI能力雖不及大型語言模型如GPT-3，仍能在司法判決中發揮輔助作用。這類技術的進展雖快，但是否有助於法官工作仍待觀察。

生成式AI的核心是透過機率模型預測文字，使生成的語言合理且流暢。早期科學家將語言生成問題簡化為條件機率問題，這種模型能夠根據上文預測下一個字詞的機率。現代的AI如Chat GPT等，能夠透過大量文本學習，自動調整模型參數，達到預測文字的目的。這種模型沒有固定規則，完全基於訓練資料。若資料中存在某詞，AI便能在合適的上下文中創造出新句子。儘管AI能夠創造出沒在訓練資料中的新句子，但這些創造往往是基於訓練資料中文字出現的模式。雖然這些語言模型的能力強大，但它們依然受限於所餵養的資料，且創造與捏造之間的界限模糊。AI的運用在法律判決上需要更多實驗和數據來證實其可行性，尤其是在處理特定或一般化案例時。專家建議，為了增加透明度和信任，AI的訓練過程和數據應該開源。

綜合討論

大型語言模型的不透明性與解釋性問題

從語言學的角度出發，應用AI在法律領域的挑戰，特別是在理解和運用法律語言方面。討論者指出，法律是建立在語言之上的知識體系，而AI在處理法律問題時，必須能夠理解和應用法律特定的語言用法。例如，在法律文本中「公然」這個詞的使用，可能與日常用語中的意義有所不同，這需要AI能夠準確識別和適應，但不確定是否能訓練AI系統辨別出這類細微的差異。

要應用AI領域在司法系統目前缺乏明確規範和標準，特別是在透明性和可解釋性，這是當前熱議且未解決的。討論者提到，即使科學家了解生成式AI的基本架構，其運作細節仍是待探索的過程。如果一個系統連專家都覺得不透明，如何能對一般人透明並易於理解？倘若研究者目前仍無法完全解決生成式AI的產出有時能接近人類的水準、有時虛構得能令外行人信以為真，就應該更謹慎看待生成式AI應用於司法系統的潛力。

不同的模型和訓練資料，會決定生成式AI的能力與產出。即使AI能夠彙總和分析大量資料，但其生成的結果可能不足以解釋或正確反映法律判決的複雜性。討論者建議，為了提高信任度，AI生成的判決書應詳細解釋其來源，讓法官和當事人都能清楚理解。若用目前AI技術的自動生成功能，與會者表示懷疑，認為這違反了透明性和可解釋性原則。

司法院AI系統開源，可能解決什麼問題？產生什麼問題？

討論者強調了開源在AI發展中的重要性，指出如果AI系統開源，可增進這些AI系統的透明度。與會者提出，台灣的判決書等資料是否足以訓練AI，有待嚴謹的實驗證實，因為過去的判決可能未包含新的觀點和價值。然而，若資料更為豐富，例如包括教科書或國外判決，也許可以解決訓練AI的資料量不足的問題。訓練資料的豐富性和時效性在設計AI系統時，需要謹慎考量，因為AI的有效性和準確性取決於可用於訓練的數據質量和範圍，這需要開源並納入不同研究單位的合作。

目前的AI系統，包括OpenAI的ChatGPT在推出之前，都經過嚴格試驗，例如不能透露個資、不能教導人類自殘、用毒、殺人等符合安全性的測試。透過嚴謹且標準化的測試流程，才能確保每一次修改的AI系統，能產生符合人類福祉的結果。就像開發疫苗，需有嚴謹的標準程序，在逐步擴大規模的過程中確保對人體無害，才能實際應用。目前國際上推出AI產品的競爭雖然激烈，但並沒有跳過嚴謹測試的過程，特別是安全性測試。司法院的指引，應納入系統佈署前嚴謹且可公開測試流程的研究結果。

然而，如果司法院AI系統開源，是否會導致各方（如企業或政府）開發出不同的系統，並且資源豐富的一方能訓練出更好的系統。這是否會影響司法系統追求的公平，以及實務上的攻防？以致司法院的指引，應考量具體落實的細節與實務方面的可能性。

倫理問題

科技應用在法律上的案例，就像過去人工驗票的過程逐漸轉向電子化，因其可量化、可計算，其應用的概念與方式相對透明、可解釋，是以民眾可接受也能理解。若有一天，AI變得更透明和可理解，是否應該讓AI在司法判決上發揮決定性作用？

但進一步問，如果AI能夠考量到少數族群或進步價值，並做出公平的判決，那麼它可能會比人類法官更進步。若這真的是可期待的前景，民眾屆時是否能自由選擇要AI法官或人類來審案？這樣的演變可能牽涉到更廣泛的基本人權，需要社會積極討論。

而AI最終是否會隨著人類價值而演進，抑或會重複偏見，目前在研究上仍缺乏證據。AI在司法系統中扮演不同的角色，之於司法系統的改變為何，仍不清楚。如若司法系統大量藉助AI，那若AI判斷錯誤時是否能翻案和尋求賠償？

即使AI可以被控制和調整，這本身也涉及許多價值取捨和判斷，更何況生成式AI所謂可控與調整，目前的可操作性極低。

總結

總結來說，與會者認為生成式AI若要應用於司法領域，挑戰在於可信度、可解釋性、可問責性、是否重複偏見、是否違背直接審理原則、生成式AI應用於司法的角色，以及該系統訓練資料的品質與資料量是否足夠，此外，訓練資料的代表性亦是問題。系統完成之前的測試實驗，設計是否得當、過程是否嚴謹透明，都是應用AI於高風險任務時，應當要考量的因素。

「生成式AI應用於司法系統」這一命題，與會者經討論後，認為首先需要學術界的投入和研究這些AI系統，理解不同模型、訓練資料及其產出的質量，並公開實驗方法和數據。根據這些研究結果制定指引，有了指引，才開始開發系統，並進行社會影響評估，包括司法體系中可能的使用者，AI模型應用於司法系統的方式和影響，納入利害關係人的意見，讓民眾了解如此變革對個人權益的影響。

現階段若要導入AI，應以分析人類撰寫的判決書是否考量周到為宜，而這不僅是目前AI系統的強項，也是目前較安全的作法。

隨著計算能力的快速提升，在未來五至二十年內，每個人都將能在自己的電腦上使用AI，這將對每一個人以及司法系統帶來重大變化。要應用生成式AI在司法領域須採謹慎、開放且透明的態度，並事先訂定測試規範。AI的發展是人類了解自己並向前邁進的機會，相關的研究與討論必須與之共進。

Tags: AI 判決書智慧司法生成式AI

科學成果

SMC 資料庫

SMC 資料庫

生成式AI輔助寫判決書，智慧司法的時代即將來臨？活動紀錄

相關文章

「偵測大型語言模型中的AI幻覺」專家意見

新演算法加速微型衛星影像傳輸 有望協助救災

「新演算法加速微型衛星影像傳輸」專家意見

「運用AI協助法官寫判決書草稿」專家意見

科學成果

新演算法加速微型衛星影像傳輸有望協助救災