用ChatGPT找法院判決?從Roberto Mata v. Avianca, Inc.案淺析生成式AI之侷限
資訊工業策進會科技法律研究所
2023年09月08日
生成式AI是透過研究過去資料,以創造新內容和想法的AI技術,其應用領域包括文字、圖像及影音。以ChatGPT為例,OpenAI自2022年11月30日發布ChatGPT後,短短二個月內,全球月均用戶數即達到1億人,無疑成為民眾日常生活中最容易近用的AI科技。
惟,生成式AI大量使用後,其中的問題也逐漸浮現。例如,ChatGPT提供的回答僅是從所學習的資料中統整歸納,無法保證資料的正確性。Roberto Mata v. Avianca, Inc.案即是因律師利用ChatGPT撰寫訴狀,卻未重新審視其所提供判決之正確性,以致後續引發訴狀中所描述的判決不存在爭議。
壹、事件摘要
Roberto Mata v. Avianca, Inc.案[1]中,原告Roberto Mata於2019年8月搭乘哥倫比亞航空從薩爾瓦多飛往紐約,飛行過程中膝蓋遭空服員的推車撞傷,並於2022年2月向法院提起訴訟,要求哥倫比亞航空為空服員的疏失作出賠償;哥倫比亞航空則主張已超過《蒙特婁公約》(Montreal Convention)第35條所訂之航空器抵達日起兩年內向法院提出損害賠償之請求時效。
R然而,法院審理過程中發現原告訴狀內引用之六個判決無法從判決系統中查詢,進而質疑判決之真實性。原告律師Steven A. Schwartz因而坦承訴狀中引用的六個判決是ChatGPT所提供,並宣稱針對ChatGPT所提供的判決,曾多次向ChatGPT確認該判決之正確性[2]。
貳、生成式AI應用之潛在風險
雖然運用生成式AI技術並結合自身專業知識執行特定任務,可能有助於提升效率,惟,從前述Roberto Mata v. Avianca, Inc.案亦可看出,依目前生成式AI技術之發展,仍可能產生資訊正確性疑慮。以下彙整生成式AI應用之8大潛在風險[3]:
一、能源使用及對環境危害
相較於傳統機器學習,生成式AI模型訓練將耗費更多運算資源與能源。根據波士頓大學電腦科學系Kate Saenko副教授表示,OpenAI的GPT-3模型擁有1,750億個參數,約會消耗1,287兆瓦/時的電力,並排放552噸二氧化碳。亦即,每當向生成式AI下一個指令,其所消耗的能源量相較於一般搜尋引擎將可能高出4至5倍[4]。
二、能力超出預期(Capability Overhang)
運算系統的黑盒子可能發展出超乎開發人員或使用者想像的隱藏功能,此發展將會對人類帶來新的助力還是成為危險的阻力,則會隨著使用者之間的相互作用而定。
三、輸出結果有偏見
生成式AI通常是利用公開資料進行訓練,若輸入資料在訓練時未受監督,而帶有真實世界既存的刻板印象(如語言、種族、性別、性取向、能力、文化等),據此建立之AI模型輸出結果可能帶有偏見。
四、智慧財產權疑慮
生成式AI進行模型訓練時,需仰賴大量網路資料或從其他大型資料庫蒐集訓練資料。然而,若原始資料來源不明確,可能引發取得資料未經同意或違反授權條款之疑慮,導致生成的內容存在侵權風險。
五、缺乏驗證事實功能
生成式AI時常提供看似正確卻與實際情形不符的回覆,若使用者誤信該答案即可能帶來風險。另外,生成式AI屬於持續動態發展的資訊生態系統,當產出結果有偏誤時,若沒有大規模的人為干預恐難以有效解決此問題。
六、數位犯罪增加與資安攻擊
過去由人工產製的釣魚郵件或網站可能受限於技術限制而容易被識破,然而,生成式AI能夠快速建立具高度說服力的各種擬真資料,降低詐騙的進入門檻。又,駭客亦有可能在不熟悉技術的情況下,利用AI進一步找出資安弱點或攻擊方法,增加防禦難度。
七、敏感資料外洩
使用雲端服務提供商所建立的生成式AI時,由於輸入的資料存儲於外部伺服器,若要追蹤或刪除有一定難度,若遭有心人士利用而導致濫用、攻擊或竄改,將可能產生資料外洩的風險。
八、影子AI(Shadow AI)
影子AI係指開發者未知或無法控制之AI使用情境。隨著AI模型複雜性增加,若開發人員與使用者未進行充分溝通,或使用者在未經充分指導下使用 AI 工具,將可能產生無法預期之風險。
參、事件評析
在Roberto Mata v. Avianca, Inc.案中,法院關注的焦點在於律師的行為,而非對AI技術使用的批判。法院認為,隨著技術的進步,利用可信賴的AI工具作為協助用途並無不當,惟,律師應踐行其專業素養,確保所提交文件之正確性[5]。
當AI科技發展逐漸朝向自主與獨立的方向前進,仍需注意生成式AI使用上之侷限。當個人在使用生成式AI時,需具備獨立思考判斷的能力,並驗證產出結果之正確性,不宜全盤接受生成式AI提供之回答。針對企業或具高度專業領域人士使用生成式AI時,除確認結果正確性外,更需注意資料保護及治理議題,例如建立AI工具合理使用情境及加強員工使用相關工具之教育訓練。在成本能負擔的情況下,可選擇透過企業內部的基礎設施訓練AI模型,或是在訓練模型前確保敏感資料已經加密或匿名。並應注意自身行業領域相關法規之更新或頒布,以適時調整資料使用之方式。
雖目前生成式AI仍有其使用之侷限,仍應抱持開放的態度,在技術使用與風險預防之間取得平衡,以能夠在技術發展的同時,更好地學習新興科技工具之使用。
[1] Mata v. Avianca, Inc., 1:22-cv-01461, (S.D.N.Y.).
[2] Benjamin Weiser, Here’s What Happens When Your Lawyer Uses ChatGPT, The New York Times, May 27, 2023, https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.html (last visited Aug. 4, 2023).
[3] Boston Consulting Group [BCG], The CEO’s Roadmap on Generative AI (Mar. 2023), https://media-publications.bcg.com/BCG-Executive-Perspectives-CEOs-Roadmap-on-Generative-AI.pdf (last visited Aug. 29, 2023).
[4] Kate Saenko, Is generative AI bad for the environment? A computer scientist explains the carbon footprint of ChatGPT and its cousins, The Conversation (May 23, 2023.), https://theconversation.com/is-generative-ai-bad-for-the-environment-a-computer-scientist-explains-the-carbon-footprint-of-chatgpt-and-its-cousins-204096 (last visited Sep. 7, 2023).
[5] Robert Lufrano, ChatGPT and the Limits of AI in Legal Research, National Law Review, Volume XIII, Number 195 (Mar. 2023), https://www.natlawreview.com/article/chatgpt-and-limits-ai-legal-research (last visited Aug. 29, 2023).
英國工黨政府在2024年7月17日的議會開幕致詞上宣布,將於2025年提出「網路安全與韌性法案」(Cyber Security and Resilience Bill),用以更新現有的網路與資訊系統規則(The Network and Information Systems Regulations 2018)。現有的法規涵蓋5大行業領域:交通運輸、能源、飲水、健康衛生,以及數位基礎設施和部分數位服務(含網路市集、網路搜尋引擎、雲端運算服務等),分別由12個主管機關負責在各自領域落實該法規。 根據英國國家網路安全中心的評估,英國正面臨著來自敵意國家(或受其資助的行為人)日益增加的威脅。而英國的基礎設施在運作時不應該忽視這些威脅。工黨政府希望加強英國的網路防禦和面臨惡意攻擊時的網路韌性,從而確保英國社會所依賴的基礎設施和關鍵服務能夠持續運作,並確保數位經濟能夠持續增長。 根據目前公布的資訊,該法案將會在既有框架下面針對三個方向進行強化: 1. 擴大法規的職權範圍,將更多的數位服務和供應鏈納入保護範圍,保護英國的必要公共服務,避免受到網路攻擊。 2. 提供監管機關採取必要性網路安全措施的法源依據,從法律層面賦予監管機關採取更多安全措施的權利。 3. 強制要求納管對象網路安全事件通報,讓政府確實掌握網路攻擊的次數與相關資訊,以提升整體英國社會對於此類事件的理解與掌握。 該法案預計於2025年提交給英國議會審議,其對於網路安全、數位基礎設施和關鍵設施的安全保護框架,可以作為我國未來提升數位基礎建設及關鍵設施資訊網路安全的重要參考對象。
新加坡政府推出民眾資料共享平台MyInfo新加坡政府在2016年05月05日發表了數位平台「MyInfo」。 新加坡政府推出此一平台的目標是「以數位方式來整合目前的工作,去除現行的不便與散亂,讓民眾與政府打交道時更輕鬆 」。因此,「MyInfo」將每個新加坡公民散在各政府機關間的個人資料整合成單一檔案,使用者也可以自行決定加入額外的資訊,像是年收入、教育程度、就業情況以及家人資料。當民眾需要填寫不同的政府表單時,不需要再一直填寫重複的內容。 新加坡政府表示,每個公民可以自由決定他們要不要註冊MyInfo。當使用者選擇使用這項服務時,相關機關會針對可能被運用的資料先徵詢使用者的同意。 MyInfo計畫是由新加坡財政部與資訊通信發展管理局共同發起。新加坡政府的數位服務團隊在一年前左右開始設計這項服務,目前平台上仍持續在測試並改善使用者經驗。 MyInfo從2016年01月到04月試營運,已經有超過32,000人使用這項服務(佔新加坡總人口0.6%)。在2016年06月之前,MyInfo會提供15項服務,包括註冊公用住宅、更新報稅資料以及求職資訊等。到2018年,所有需要雙認證的數位服務都會整合在MyInfo平台,估計會有200項服務項目。 這個計畫是新加坡「數位政府」(Digital Government)政策的重要拼圖之一。新加坡政府將持續擴大MyInfo的服務項目,希望藉由此服務來蒐整更多資料,並增加可供政府機關間分享的個人資料數目。伴隨愈加豐富的數據資料,各政府部門更能事先了解民眾的需求並提出民眾真正需要的服務。
日本政府發布2024年版「實現數位社會重點計畫」.Pindent{text-indent: 2em;} .Noindent{margin-left: 2em;} .NoPindent{text-indent: 2em; margin-left: 2em;} .No2indent{margin-left: 3em;} .No2Pindent{text-indent: 2em; margin-left: 3em} .No3indent{margin-left: 4em;} .No3Pindent{text-indent: 2em; margin-left: 4em} 日本於2024年6月21日內閣決議更新「實現數位社會重點計畫」(デジタル社会の実現に向けた重点計画),作為日本最新數位與資料治理革新之上位政策,以達成實現Society5.0以及整合並協調各機關數位政策之目標,力求克服日本近年面臨人口減少、勞動力不足、產業競爭力下降、災害風險等之課題。 「實現數位社會重點計畫」自2021年發布第一版起,即以六項願景整合相關政策,分別為: 1. 數位化實現成長:數位轉型推動整體社會的生產力與競爭力; 2. 重要領域數位化:資料串連推動醫療、教育、防災、兒童等領域的安全發展; 3. 數位化實現區域振興:數位工具活化各區域特色; 4. 沒有人落後的數位社會:使所有人都可以體驗數位化服務; 5. 開發與保護數位人力:建立持續培養數位人力的社會; 6. 推動國際資料流通:實現資料可信任的跨國自由流通。 2024年「實現數位社會重點計畫」以六項願景分述各機關計劃推動的320個相關政策,如有醫院急救時共享醫療資訊、電子母子健康手冊、兒童資料串接、減少長者數位障礙、女性數位人才培育,以及推動資料可信任自由流通(Data Free Flow with Trust)等。 此外,本次更新之計畫新增「業務、系統、制度三位一體」作為推動架構。其中業務指結合資料與數位應用的行政服務;系統則是指適合於業務運作的軟、硬體;制度則指透過包含資料標準、指引或法令等方式形成之規範。日本藉此推動架構評估資料與數位之政策從起草、規劃到執行等階段中業務、系統與制度之間的協調性,為政策的制定者、使用者提供便利與高品質的數位體驗。 由2024年實現數位社會重點計畫的更新可知,日本強調在數位轉型階段中社會整體革新的企圖,加強政策在業務、系統、制度三個層面的一致性,以在邁向數位社會的同時克服社會轉型的挑戰。
歐盟執委會發布「歐洲健康資料空間」規則提案,旨在克服健康資料利用之障礙歐盟執委會(European Commission)於2022年5月3日發布「歐洲健康資料空間」(European Health Data Space, EHDS)規則提案,其旨在克服健康資料利用之障礙,以充分發揮數位健康與健康資料之潛力。EHDS為一個專門用於健康之資料共享框架(health-specific data sharing framework),針對患者以及用於研究、創新、政策制定、患者安全、統計或監管目的等電子健康資料之運用,建立明確規則、通用標準與實務、基礎設施與治理框架,無論是個人、醫療人員、健康照護提供者、研究人員、監管人員、產業界皆可由此受益。 EHDS之具體內容主要包括九個章節: (1)第一章為一般條款(General provisions),內容包括本規則之主題與範圍,並闡明定義、以及與其他歐盟法規之關係; (2)第二章為電子健康資料之原始利用(Primary use of electronic health data),其針對歐盟一般資料保護規則(GDPR)所載權利,增訂補充性之配套保護機制,並設定醫事人員及其他健康從業人員針對EHD之義務; (3)第三章為EHR系統與福祉應用(EHR systems and wellness applications),其主要重點為EHR系統之強制性自我認證計畫(mandatory self-certification scheme),要求其需符合可互通性與安全性等基本要求,並界定EHR系統中各經濟營運商(economic operator)之義務、EHR系統合規(conformity)要求,並負責EHR系統市場監督機構之義務; (4)第四章為電子健康資料之二次利用(Secondary use of electronic health data),如將資料用於研究、創新、政策制定、患者安全或監管活動。本章定義一組資料類型,規範可利用之既定目的以及受禁止之目的(如商業廣告、增加保險、開發危險產品),並規定會員國必須建立健康資料近用機構(health data access body),以便電子健康資料的二次利用,並確保由資料持有者所產生之電子資料可提供給資料使用者; (5)第五章為其他行動(Additional actions),其旨在提出其他措施以促進會員國之能量建構(capacity building),以配合EHDS之發展,包括數位公共服務之資訊交換、資金,並規範於EHDS下非個人資料之國際近用規定; (6)第六章為歐洲治理與協調(European governance and coordination),其創建「歐洲健康資料空間委員會」(European Health Data Space Board, EHDS Board),促進數位健康當局及健康資料近用機構之間的合作,特別是電子健康資料之原始與二次利用間之關係,並包含歐盟基礎設施聯合管理小組(joint controllership groups for EU infrastructure)相關規定,其任務在於就電子健康資料之原始與二次利用所需之跨境數位基礎建設進行相關決策; (7)第七章為授權與委員會(Delegation and Committee),其允許歐盟執委會通過關於EHDS之授權法案(delegated acts),並希望根據C (2016) 3301號決定成立一個專家小組,以便於準備授權法案、實施本規則時提供建議與協助; (8)第八章為附則(Miscellaneous)規定,其中包含關於合作與處罰之規定,以及要求於本規則實施後進行評估與檢視之條款; (9)第九章為延遲適用與最終條款(Deferred application and final provisions),其規定本規則與個別條款之生效日。