用ChatGPT找法院判決?從Roberto Mata v. Avianca, Inc.案淺析生成式AI之侷限
資訊工業策進會科技法律研究所
2023年09月08日
生成式AI是透過研究過去資料,以創造新內容和想法的AI技術,其應用領域包括文字、圖像及影音。以ChatGPT為例,OpenAI自2022年11月30日發布ChatGPT後,短短二個月內,全球月均用戶數即達到1億人,無疑成為民眾日常生活中最容易近用的AI科技。
惟,生成式AI大量使用後,其中的問題也逐漸浮現。例如,ChatGPT提供的回答僅是從所學習的資料中統整歸納,無法保證資料的正確性。Roberto Mata v. Avianca, Inc.案即是因律師利用ChatGPT撰寫訴狀,卻未重新審視其所提供判決之正確性,以致後續引發訴狀中所描述的判決不存在爭議。
壹、事件摘要
Roberto Mata v. Avianca, Inc.案[1]中,原告Roberto Mata於2019年8月搭乘哥倫比亞航空從薩爾瓦多飛往紐約,飛行過程中膝蓋遭空服員的推車撞傷,並於2022年2月向法院提起訴訟,要求哥倫比亞航空為空服員的疏失作出賠償;哥倫比亞航空則主張已超過《蒙特婁公約》(Montreal Convention)第35條所訂之航空器抵達日起兩年內向法院提出損害賠償之請求時效。
R然而,法院審理過程中發現原告訴狀內引用之六個判決無法從判決系統中查詢,進而質疑判決之真實性。原告律師Steven A. Schwartz因而坦承訴狀中引用的六個判決是ChatGPT所提供,並宣稱針對ChatGPT所提供的判決,曾多次向ChatGPT確認該判決之正確性[2]。
貳、生成式AI應用之潛在風險
雖然運用生成式AI技術並結合自身專業知識執行特定任務,可能有助於提升效率,惟,從前述Roberto Mata v. Avianca, Inc.案亦可看出,依目前生成式AI技術之發展,仍可能產生資訊正確性疑慮。以下彙整生成式AI應用之8大潛在風險[3]:
一、能源使用及對環境危害
相較於傳統機器學習,生成式AI模型訓練將耗費更多運算資源與能源。根據波士頓大學電腦科學系Kate Saenko副教授表示,OpenAI的GPT-3模型擁有1,750億個參數,約會消耗1,287兆瓦/時的電力,並排放552噸二氧化碳。亦即,每當向生成式AI下一個指令,其所消耗的能源量相較於一般搜尋引擎將可能高出4至5倍[4]。
二、能力超出預期(Capability Overhang)
運算系統的黑盒子可能發展出超乎開發人員或使用者想像的隱藏功能,此發展將會對人類帶來新的助力還是成為危險的阻力,則會隨著使用者之間的相互作用而定。
三、輸出結果有偏見
生成式AI通常是利用公開資料進行訓練,若輸入資料在訓練時未受監督,而帶有真實世界既存的刻板印象(如語言、種族、性別、性取向、能力、文化等),據此建立之AI模型輸出結果可能帶有偏見。
四、智慧財產權疑慮
生成式AI進行模型訓練時,需仰賴大量網路資料或從其他大型資料庫蒐集訓練資料。然而,若原始資料來源不明確,可能引發取得資料未經同意或違反授權條款之疑慮,導致生成的內容存在侵權風險。
五、缺乏驗證事實功能
生成式AI時常提供看似正確卻與實際情形不符的回覆,若使用者誤信該答案即可能帶來風險。另外,生成式AI屬於持續動態發展的資訊生態系統,當產出結果有偏誤時,若沒有大規模的人為干預恐難以有效解決此問題。
六、數位犯罪增加與資安攻擊
過去由人工產製的釣魚郵件或網站可能受限於技術限制而容易被識破,然而,生成式AI能夠快速建立具高度說服力的各種擬真資料,降低詐騙的進入門檻。又,駭客亦有可能在不熟悉技術的情況下,利用AI進一步找出資安弱點或攻擊方法,增加防禦難度。
七、敏感資料外洩
使用雲端服務提供商所建立的生成式AI時,由於輸入的資料存儲於外部伺服器,若要追蹤或刪除有一定難度,若遭有心人士利用而導致濫用、攻擊或竄改,將可能產生資料外洩的風險。
八、影子AI(Shadow AI)
影子AI係指開發者未知或無法控制之AI使用情境。隨著AI模型複雜性增加,若開發人員與使用者未進行充分溝通,或使用者在未經充分指導下使用 AI 工具,將可能產生無法預期之風險。
參、事件評析
在Roberto Mata v. Avianca, Inc.案中,法院關注的焦點在於律師的行為,而非對AI技術使用的批判。法院認為,隨著技術的進步,利用可信賴的AI工具作為協助用途並無不當,惟,律師應踐行其專業素養,確保所提交文件之正確性[5]。
當AI科技發展逐漸朝向自主與獨立的方向前進,仍需注意生成式AI使用上之侷限。當個人在使用生成式AI時,需具備獨立思考判斷的能力,並驗證產出結果之正確性,不宜全盤接受生成式AI提供之回答。針對企業或具高度專業領域人士使用生成式AI時,除確認結果正確性外,更需注意資料保護及治理議題,例如建立AI工具合理使用情境及加強員工使用相關工具之教育訓練。在成本能負擔的情況下,可選擇透過企業內部的基礎設施訓練AI模型,或是在訓練模型前確保敏感資料已經加密或匿名。並應注意自身行業領域相關法規之更新或頒布,以適時調整資料使用之方式。
雖目前生成式AI仍有其使用之侷限,仍應抱持開放的態度,在技術使用與風險預防之間取得平衡,以能夠在技術發展的同時,更好地學習新興科技工具之使用。
[1] Mata v. Avianca, Inc., 1:22-cv-01461, (S.D.N.Y.).
[2] Benjamin Weiser, Here’s What Happens When Your Lawyer Uses ChatGPT, The New York Times, May 27, 2023, https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.html (last visited Aug. 4, 2023).
[3] Boston Consulting Group [BCG], The CEO’s Roadmap on Generative AI (Mar. 2023), https://media-publications.bcg.com/BCG-Executive-Perspectives-CEOs-Roadmap-on-Generative-AI.pdf (last visited Aug. 29, 2023).
[4] Kate Saenko, Is generative AI bad for the environment? A computer scientist explains the carbon footprint of ChatGPT and its cousins, The Conversation (May 23, 2023.), https://theconversation.com/is-generative-ai-bad-for-the-environment-a-computer-scientist-explains-the-carbon-footprint-of-chatgpt-and-its-cousins-204096 (last visited Sep. 7, 2023).
[5] Robert Lufrano, ChatGPT and the Limits of AI in Legal Research, National Law Review, Volume XIII, Number 195 (Mar. 2023), https://www.natlawreview.com/article/chatgpt-and-limits-ai-legal-research (last visited Aug. 29, 2023).
「美國食品和藥物管理局(FDA)」於2017年4月6日准許「23and me個人基因遺傳健康風險服務測試(簡稱GHR)」進行行銷,FDA要求該測試方法可以一定準確度檢測出十種疾病及可能條件。GHR是第一個被美國食品藥物管理局授權允許直接對消費者進行測試並提供個人遺傳傾向及醫療疾病條件資訊給消費者的測試。 GHR試圖提供遺傳風險資訊給消費者,但這個測試無法確定人們發展成疾病或發病條件的總體風險,因為除了某些遺傳變體的存在,還有很多因素會影響健康條件的發展,包含環境以及生活方式的因素,因此該檢測可能可以幫助人們做選擇生活方式的決定或告知消費者專業的健康照護。 23and me的GHR測試是運作自隔離唾液樣品中的DNA,此檢測被測試超過500000個遺傳變體,其檢測關於發展成以下十種疾病或發病條件增加風險的存在與否,包括帕金森氏症(Parkinson’s disease)、阿茲海默症(Late-onset Alzheimer’s disease)、自體免疫問題(Celiac disease)、α-1抗胰蛋白酶缺乏症、早發性原發性肌張力障礙(early-onset primary dystomia)、因子XI缺乏症(factor XI deficiency)、高血病1型(gaucher disease type1)、葡萄糖6-磷酸脫氫酶缺乏症(glucose 6- phosphate dehydrogenase defiency)、遺傳性血色素沉著症(hereditary hemochromatosis)、遺傳性血栓形成(hereditary thrombophilia)。 此外,FDA更要求所有DTC測試在醫療用途目的上之使用必需要能跟消費者溝通,使消費者可以充分了解該測試法後選用。其中一個研究顯示,23andMe的GHR測試的相關資訊是容易被理解的,有90%的人能夠了解報告中所呈現的資訊。
加拿大聯邦政府預計2018年於全國落實碳排放費用徵收加拿大總理賈斯汀.杜魯道(Justin Trudeau)於2016年10月提出一項改革方案,要求全國各省份或地區於2018年開始,須擇一實施碳稅(Carbon tax)制度或碳交易系統(Cap-and-Trade System):前者,聯邦政府將制定徵收下限,從2018年每噸10元,逐年提高10元,直至2022年每噸50元為止;至於碳交易系統,則須設立嚴格管控規範,以達聯邦政府實施碳稅制度所得減少碳排放量之預期值。同時,杜魯道更進一步表示,費用將交由各省區自行向排放者進行徵收,並可就其所得作自由運用,反之,倘若未確實執行該項政策者,聯邦政府則將強制介入實施。 事實上,綜觀國際間徵收碳稅制度,主要有兩種類型:一類為全國落實碳稅徵收,例如:荷蘭、丹麥、德國或南韓等,其中尚可再細分是否作為一獨立稅目進行徵收,前述荷蘭及丹麥二國,即直接設立碳稅進行徵收,至於德國與南韓,則是將碳排放作為能源稅之計算因子之一作收取;另一類為國內部分地區自行決定收取,如:美國加州地區及原先加拿大不列顛哥倫比亞省與魁北克省等。 至於未來觀察重點,應在於加拿大實施上述碳排放費用徵收政策後,勢必對於民生消費習慣具相當程度影響,諸如:暖氣、民生用電、交通工具燃料、公共運輸、食品、服裝或其他消費服務,預期均有相應之漲幅,再者,各省區之經濟政策及投資環境,亦可能有不小程度之衝擊,此兩處後續發展,均值得作持續性觀察。
中國大陸發明專利申請量已躍居世界第四位中國知識產權局局長田力普在「2006 年中國保護知識產權高層論壇」上表示,2005 年中國發明專利申請量居世界第四位,成為世界第十大申請國,在發展中國家排名第二。 不過,雖然中國大陸知識產權制度實施二十年來成績顯著,但是中國大陸自行研發的能力仍有待提昇。因為,2005 年中國大陸發明專利申請十七萬餘件中有近五成來自外國,而來自獨資、合資等三資企業只佔了大約六分之一。若從申請發明專利的技術程度觀察,外國人發明專利申請案集中在高科技的技術領域,而中國國內發明多集中在一般技術領域。 對照 2005 年大陸的中央企業研發投入額佔當年銷售收入的比重平均為 1.5% ,相較先進國家大型企業一般不低於銷售收入 5% 的研發費用,差距甚遠。事實上,大陸央企擁有的所有專利總數已達30520項,但這數字還不及日本佳能企業的一半。因此,大陸國資委主任李榮融表示,在中央企業負責人業績考核體系中,國資委將會加大科技投入和創新能力建設的考核力度。
桃莉羊誕生十年 複製技術之醫療運用距收成階段仍遙遠十年前的 7 月 5 日 ,全世界第一隻複製的哺乳類動物桃莉羊在英國誕生。 複製羊成功的案例,吸引了如潮水般的錢潮,流入探索利用這項新技術的領域,諸如有關治療癌症、心臟病、阿茲海默症和其他嚴重疾病的研究。科學家應用在姚莉身上的技術是屬於「細胞核轉置技術」( SCNT ),簡言之,是把卵子的細胞核取出,然後把身體細胞的細胞核放入這個卵子中。在這個新建構的卵子中,只有來自身體細胞的染色體,而沒有原卵子的染色體,新卵子中僅含有提供身體細胞者的基因組,所以稱之為「複製」。科學複製有很大的潛在風險,代價又高,但它對醫學研究仍有很大的貢獻,其中最引人注意的,就是可取得胚胎幹細胞。 幹細胞是一群尚未完全分化的細胞,同時具有分裂增殖成另一個與本身完全相同的細胞,以及分化成為多種特定功能的體細胞兩種特性,在生命體由胚胎發育到成熟個體的過程中,扮演最關鍵性的角色。研究人員相信未來可以利用幹細胞,修復或是更換受傷或是病變的器官中的細胞或組織,特別是利用有患者自己基因的幹細胞組織移植,可以避免免疫系統的排斥現象。 當年科學家複製桃莉羊時所抱持之野心不小,然而這十年來,科學家們並沒有能夠達成以幹細胞治療人類疾病的目標,雖然因複製 技術本身具有高度爭議性,許多國家已立法予以規制,然卻依舊無法避免如 前首爾大學教授黃禹錫偽造幹細胞研究成果的醜聞發生,這項醜聞使原本即因幹細胞研究和倫理會產生衝突而不易獲得公私部門經費支持的研究工作,更為雪上加霜。 英國胚胎學者指出,回顧過去醫學研究史上的新發現,不論是試管嬰兒或是其他的技術,從第一次到最後技術完全成熟階段,都需要花很長的時間一步步完成,未來可能還需要五十年的時間,複製技術對醫學的貢獻才可能到達豐收階段。