用ChatGPT找法院判決?從Roberto Mata v. Avianca, Inc.案淺析生成式AI之侷限
資訊工業策進會科技法律研究所
2023年09月08日
生成式AI是透過研究過去資料,以創造新內容和想法的AI技術,其應用領域包括文字、圖像及影音。以ChatGPT為例,OpenAI自2022年11月30日發布ChatGPT後,短短二個月內,全球月均用戶數即達到1億人,無疑成為民眾日常生活中最容易近用的AI科技。
惟,生成式AI大量使用後,其中的問題也逐漸浮現。例如,ChatGPT提供的回答僅是從所學習的資料中統整歸納,無法保證資料的正確性。Roberto Mata v. Avianca, Inc.案即是因律師利用ChatGPT撰寫訴狀,卻未重新審視其所提供判決之正確性,以致後續引發訴狀中所描述的判決不存在爭議。
壹、事件摘要
Roberto Mata v. Avianca, Inc.案[1]中,原告Roberto Mata於2019年8月搭乘哥倫比亞航空從薩爾瓦多飛往紐約,飛行過程中膝蓋遭空服員的推車撞傷,並於2022年2月向法院提起訴訟,要求哥倫比亞航空為空服員的疏失作出賠償;哥倫比亞航空則主張已超過《蒙特婁公約》(Montreal Convention)第35條所訂之航空器抵達日起兩年內向法院提出損害賠償之請求時效。
R然而,法院審理過程中發現原告訴狀內引用之六個判決無法從判決系統中查詢,進而質疑判決之真實性。原告律師Steven A. Schwartz因而坦承訴狀中引用的六個判決是ChatGPT所提供,並宣稱針對ChatGPT所提供的判決,曾多次向ChatGPT確認該判決之正確性[2]。
貳、生成式AI應用之潛在風險
雖然運用生成式AI技術並結合自身專業知識執行特定任務,可能有助於提升效率,惟,從前述Roberto Mata v. Avianca, Inc.案亦可看出,依目前生成式AI技術之發展,仍可能產生資訊正確性疑慮。以下彙整生成式AI應用之8大潛在風險[3]:
一、能源使用及對環境危害
相較於傳統機器學習,生成式AI模型訓練將耗費更多運算資源與能源。根據波士頓大學電腦科學系Kate Saenko副教授表示,OpenAI的GPT-3模型擁有1,750億個參數,約會消耗1,287兆瓦/時的電力,並排放552噸二氧化碳。亦即,每當向生成式AI下一個指令,其所消耗的能源量相較於一般搜尋引擎將可能高出4至5倍[4]。
二、能力超出預期(Capability Overhang)
運算系統的黑盒子可能發展出超乎開發人員或使用者想像的隱藏功能,此發展將會對人類帶來新的助力還是成為危險的阻力,則會隨著使用者之間的相互作用而定。
三、輸出結果有偏見
生成式AI通常是利用公開資料進行訓練,若輸入資料在訓練時未受監督,而帶有真實世界既存的刻板印象(如語言、種族、性別、性取向、能力、文化等),據此建立之AI模型輸出結果可能帶有偏見。
四、智慧財產權疑慮
生成式AI進行模型訓練時,需仰賴大量網路資料或從其他大型資料庫蒐集訓練資料。然而,若原始資料來源不明確,可能引發取得資料未經同意或違反授權條款之疑慮,導致生成的內容存在侵權風險。
五、缺乏驗證事實功能
生成式AI時常提供看似正確卻與實際情形不符的回覆,若使用者誤信該答案即可能帶來風險。另外,生成式AI屬於持續動態發展的資訊生態系統,當產出結果有偏誤時,若沒有大規模的人為干預恐難以有效解決此問題。
六、數位犯罪增加與資安攻擊
過去由人工產製的釣魚郵件或網站可能受限於技術限制而容易被識破,然而,生成式AI能夠快速建立具高度說服力的各種擬真資料,降低詐騙的進入門檻。又,駭客亦有可能在不熟悉技術的情況下,利用AI進一步找出資安弱點或攻擊方法,增加防禦難度。
七、敏感資料外洩
使用雲端服務提供商所建立的生成式AI時,由於輸入的資料存儲於外部伺服器,若要追蹤或刪除有一定難度,若遭有心人士利用而導致濫用、攻擊或竄改,將可能產生資料外洩的風險。
八、影子AI(Shadow AI)
影子AI係指開發者未知或無法控制之AI使用情境。隨著AI模型複雜性增加,若開發人員與使用者未進行充分溝通,或使用者在未經充分指導下使用 AI 工具,將可能產生無法預期之風險。
參、事件評析
在Roberto Mata v. Avianca, Inc.案中,法院關注的焦點在於律師的行為,而非對AI技術使用的批判。法院認為,隨著技術的進步,利用可信賴的AI工具作為協助用途並無不當,惟,律師應踐行其專業素養,確保所提交文件之正確性[5]。
當AI科技發展逐漸朝向自主與獨立的方向前進,仍需注意生成式AI使用上之侷限。當個人在使用生成式AI時,需具備獨立思考判斷的能力,並驗證產出結果之正確性,不宜全盤接受生成式AI提供之回答。針對企業或具高度專業領域人士使用生成式AI時,除確認結果正確性外,更需注意資料保護及治理議題,例如建立AI工具合理使用情境及加強員工使用相關工具之教育訓練。在成本能負擔的情況下,可選擇透過企業內部的基礎設施訓練AI模型,或是在訓練模型前確保敏感資料已經加密或匿名。並應注意自身行業領域相關法規之更新或頒布,以適時調整資料使用之方式。
雖目前生成式AI仍有其使用之侷限,仍應抱持開放的態度,在技術使用與風險預防之間取得平衡,以能夠在技術發展的同時,更好地學習新興科技工具之使用。
[1] Mata v. Avianca, Inc., 1:22-cv-01461, (S.D.N.Y.).
[2] Benjamin Weiser, Here’s What Happens When Your Lawyer Uses ChatGPT, The New York Times, May 27, 2023, https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.html (last visited Aug. 4, 2023).
[3] Boston Consulting Group [BCG], The CEO’s Roadmap on Generative AI (Mar. 2023), https://media-publications.bcg.com/BCG-Executive-Perspectives-CEOs-Roadmap-on-Generative-AI.pdf (last visited Aug. 29, 2023).
[4] Kate Saenko, Is generative AI bad for the environment? A computer scientist explains the carbon footprint of ChatGPT and its cousins, The Conversation (May 23, 2023.), https://theconversation.com/is-generative-ai-bad-for-the-environment-a-computer-scientist-explains-the-carbon-footprint-of-chatgpt-and-its-cousins-204096 (last visited Sep. 7, 2023).
[5] Robert Lufrano, ChatGPT and the Limits of AI in Legal Research, National Law Review, Volume XIII, Number 195 (Mar. 2023), https://www.natlawreview.com/article/chatgpt-and-limits-ai-legal-research (last visited Aug. 29, 2023).
美國自911事件後,事後檢討之建議之一為統合全美單一公共安全網路,可供跨部門之第一線救災人員使用。俟後美國於2008年拍賣700MHz頻段 (Auction 73)時,原本將Block D (788-793MHz/ 758-763MHz)共10MHz規劃為全國單一執照(Nationwide License),並與公共安全(public safety)頻段相連,得標者須與美國政府簽訂網路分享協議(Network Sharing Agreement, NSA),在必要時供緊急服務優先使用,惟該頻段歷經兩次拍賣均低於底價流標。2012年,商務部成立獨立機構First Responder Network Authority (下稱FirstNet),規劃如何統合所有與公共安全相關之通訊網路,FCC在2016年將前述流標之700MHz頻段撥交FirstNet使用。 FirstNet 2017年3月宣布與AT&T達成25年之合作協議,由AT&T協助該機構建置緊急服務人員專用之全國性LTE無線寬頻網路,該網路之主要用途為當緊急事故發生時,第一線之人員可利用該關鍵基礎設施進行通訊聯繫之用。FirstNet與AT&T的合作協議主要包括以下三個部分: FirstNet將提供上下行合計共20MHz 之頻譜 (788-798MHz / 758-768MHz),該頻段係美國主要之LTE頻段,商業價值極高,且設備之生態圈極為成熟。此外,FirstNet也將在未來5年提供65億美金的建設經費,該經費來源為FCC過去頻譜拍賣之標金收入。 AT&T承諾於25年內投入400億美金用於網路基礎設施的建設與維運,並確保網路的覆蓋率。 FirstNet同意在該網路未用於緊急服務時,得做為AT&T商業網路之一部分進行營運,但是當有緊急服務需求時,應立即提供緊急救難使用。 近年來,公共安全災防 (Public Protection and Disaster Relief)寬頻網路已成為許多先進國家的首要推動政策,包含英國與境內第一大電信商Everything Everywhere (EE)合作,芬蘭政府近來亦與電信商Telia共同合作測試LTE技術之公共安全網路。
美國聯邦法院裁定執法部門無搜索令要求提供手機位置記錄並未違憲美國聯邦第六巡迴上訴法院於2016年4月13日就U.S. v. Timothy Ivory Carpenter & Timothy Michael Sanders案作出判決,裁定執法機關在未取得搜索令的情況下要求出示或取得手機位置記錄,並不違反憲法增修條文第4條。美國憲法增修條文第4條規定:「人人具有保障人身、住所、文件及財物的安全,不受無理之搜索和拘捕的權利;此項權利,不得侵犯;除非有可成立的理由,加上宣誓或誓願保證,並具體指明必須搜索的地點,必須拘捕的人,或必須扣押的物品,否則一概不得頒發搜索令。」 本案事實係聯邦調查局取得兩名涉及多起搶劫案之嫌疑人的手機位置,而根據手機位置之相關資料顯示,於相關搶案發生之時間前後,該二名嫌疑人均位於事發地半英哩至兩英哩的範圍內,故該二名嫌疑人隨後被控多項罪名。在肯認與個人通訊相關之隱私法益的重要性的同時,聯邦第六巡迴上訴法院認為,「縱使個人通訊之內容落於私領域,但是為了將該些通訊內容自A地至B地所必須之資訊,則非屬私領域之範疇。」聯邦第六巡迴上訴法院拒絕將憲法增修條文第4條的保護延伸至像是個人通訊或IP位址等之後設資料(metadata),其原因在於,蒐集此等資訊或記錄並不會揭露通訊的內容,因此本案之嫌疑人就聯邦調查局所取得之資訊並無隱私權之期待。法院認定,此等行為不同於自智慧型手機取得資訊,因為後者「通常而言儲存了大量有關於特定使用人之資訊。」 2015年11月9日,美國聯邦最高法院拒絕審理Davis v. United States案,該案係爭執搜索令於執法部門要求近用手機位置資料時之必要性。加州州長Jerry Brown於2015年10月亦簽署加州電子通訊法(California Electronic Communications Act, CECA),該法禁止任何州政府的執法機關或其他調查單位,在未出示搜索令的情況下,要求個人或公司提供具敏感性之後設資料。
中國大陸科學技術部《關於促進新型研發機構發展的指導意見》中國大陸科學技術部於2019年9月12日公布《關於促進新型研發機構發展的指導意見》,目標是提升國家創新體系整體效能。在2016年5月中國大陸國務院發布的《第十三個五年規劃綱要》提及,為強化科技創新的引導作用,必須優化創新組織體系,藉由發展市場導向的「新型研發機構」,推動跨領域偕同創新。故「新型研發機構」必須聚焦在科技創新需求,主要從事科學技術創新與研發服務,具備投資主體多元化、管理制度現代化、營運機制市場化、用人機制靈活的獨立法人機構,得依法註冊為科技類民辦非企業單位(社會服務機構)、事業單位和企業。 中國大陸科學技術部本次公布的指導意見,主要係針對「新型研發機構」在未來政策上之具體運作與發展方向提供指引,包括新型研發機構能夠申報的國家科研項目、鼓勵設立科技類民辦非企業單位的新型研發機構政策、政府獎勵科研措施等說明。 (一) 新型研發機構申報國家科研項目 本指導意見第11條,符合條件的新型研發機構,可申報國家科技重大專項、國家重點研發計劃、國家自然科學基金等各類政府科技項目、科技創新基地和人才計劃。 (二) 鼓勵設立科技類民辦非企業單位的新型研發機構 本指導意見第12條,科技類民辦非企業單位應依法進行登記管理,營運所得利潤主要用於機構管理運作、建設發展和研發創新等,出資方不得分紅。並得依據《中華人民共和國企業所得稅法》及非營利組織企業所得稅、職務科技成果轉化個人所得稅、科技創新進口稅收等規定,享受稅收優惠。 (三) 支持與獎勵科研措施 本指導意見第14條,地方政府得根據區域創新發展需要,支持新型研發機構建設發展,包括給予基礎建設、購買科研設備、人才住房配套服務;採用創新券(innovation vouchers),推動企業向新型研發機構購買研發創新服務。第15條,更鼓勵透過國家科技成果轉化引導基金,支持新型研發機構推動科研成果轉化。
英國發佈具有決定性的基因體醫藥報告正當英國衛生部門(Department of Heath)計畫建構一個受命與提供資金的機構來進行癌症分子研究時,一個著重於基因藥物使用的英國政府諮詢組織-人類基因體策略團體(Human Genomics Strategy Group)提出報告要求英國健康照護服務(National Health Service, NHS)以多面向的方式來開發潛在性基因體科技。 人類基因體策略團體所提供的報告建置出了英國就基因體藥物於臨床應用可行性的相關步驟,該等步驟可提昇英國臨床醫師決定疾病的風險與傾向、從事正確的診斷與預知,以及培養個人醫療的能力。除此之外,該報告亦開展了人類基因體於臨床與診斷照護上的創新應用,並且提供英國政府關於基因資料之處理、公共健康議題與教育等措施資訊,以用來支持基因體科技的應用。 該報告建議,有鑑於英國已擁有強健的研究文化與資源,現階段英國已經準備好基因體藥物研究的初期階段。然而,在開始基因體藥物的研究之前,英國政府應該先在基因體技術廣泛使用於臨床照護與診斷的面向上作出更多的努力,其中包括建制出一套對於基因體與臨床基因檢驗的清楚標準,用以發展出一般性的程序來幫助健康照護專業人員來取得檢驗並分析結果。除此之外,為了防止前述一般性程序產生各項倫理道德性爭議,該報告亦建議英國政府應該發展出一套法制規範來處理關於基因藥物是否具有利用性的挑戰議題,並且以該規範來防範各種基因體資料可能被濫用的問題。 而除了建置基因體計畫法制面的規範,為了讓基因體技術能更廣泛的應用於臨床照護與診斷的範疇,此報告亦建議英國NHS應該規劃採用基因體科技的計畫、發展中央基因體儲存網絡來處理大量由基因體藥物所產生的生物資訊,以及開展出針對基因體科技所發展的受命計畫和服務傳遞模型。同時,考量英國國民與健康照護人員對於促進基因體藥物亦有所幫助,該報告也建議英國NHS應該持續提供相關教育與訓練課程來提高前述人員對於基因體藥物的認知與其帶來的益處。 有鑑於基因體醫藥報告對於英國未來從事基因實驗、臨床研究與基因藥物的研發具有決定性的影響,然該報告僅建構出具體的大方向,對於細節部分尚未有大量的著墨。因此,英國官方部門如何將此份報告於法制面和技術面加以具體落實,實值得繼續就相關內容作後續的追蹤。