用ChatGPT找法院判決?從Roberto Mata v. Avianca, Inc.案淺析生成式AI之侷限
資訊工業策進會科技法律研究所
2023年09月08日
生成式AI是透過研究過去資料,以創造新內容和想法的AI技術,其應用領域包括文字、圖像及影音。以ChatGPT為例,OpenAI自2022年11月30日發布ChatGPT後,短短二個月內,全球月均用戶數即達到1億人,無疑成為民眾日常生活中最容易近用的AI科技。
惟,生成式AI大量使用後,其中的問題也逐漸浮現。例如,ChatGPT提供的回答僅是從所學習的資料中統整歸納,無法保證資料的正確性。Roberto Mata v. Avianca, Inc.案即是因律師利用ChatGPT撰寫訴狀,卻未重新審視其所提供判決之正確性,以致後續引發訴狀中所描述的判決不存在爭議。
壹、事件摘要
Roberto Mata v. Avianca, Inc.案[1]中,原告Roberto Mata於2019年8月搭乘哥倫比亞航空從薩爾瓦多飛往紐約,飛行過程中膝蓋遭空服員的推車撞傷,並於2022年2月向法院提起訴訟,要求哥倫比亞航空為空服員的疏失作出賠償;哥倫比亞航空則主張已超過《蒙特婁公約》(Montreal Convention)第35條所訂之航空器抵達日起兩年內向法院提出損害賠償之請求時效。
R然而,法院審理過程中發現原告訴狀內引用之六個判決無法從判決系統中查詢,進而質疑判決之真實性。原告律師Steven A. Schwartz因而坦承訴狀中引用的六個判決是ChatGPT所提供,並宣稱針對ChatGPT所提供的判決,曾多次向ChatGPT確認該判決之正確性[2]。
貳、生成式AI應用之潛在風險
雖然運用生成式AI技術並結合自身專業知識執行特定任務,可能有助於提升效率,惟,從前述Roberto Mata v. Avianca, Inc.案亦可看出,依目前生成式AI技術之發展,仍可能產生資訊正確性疑慮。以下彙整生成式AI應用之8大潛在風險[3]:
一、能源使用及對環境危害
相較於傳統機器學習,生成式AI模型訓練將耗費更多運算資源與能源。根據波士頓大學電腦科學系Kate Saenko副教授表示,OpenAI的GPT-3模型擁有1,750億個參數,約會消耗1,287兆瓦/時的電力,並排放552噸二氧化碳。亦即,每當向生成式AI下一個指令,其所消耗的能源量相較於一般搜尋引擎將可能高出4至5倍[4]。
二、能力超出預期(Capability Overhang)
運算系統的黑盒子可能發展出超乎開發人員或使用者想像的隱藏功能,此發展將會對人類帶來新的助力還是成為危險的阻力,則會隨著使用者之間的相互作用而定。
三、輸出結果有偏見
生成式AI通常是利用公開資料進行訓練,若輸入資料在訓練時未受監督,而帶有真實世界既存的刻板印象(如語言、種族、性別、性取向、能力、文化等),據此建立之AI模型輸出結果可能帶有偏見。
四、智慧財產權疑慮
生成式AI進行模型訓練時,需仰賴大量網路資料或從其他大型資料庫蒐集訓練資料。然而,若原始資料來源不明確,可能引發取得資料未經同意或違反授權條款之疑慮,導致生成的內容存在侵權風險。
五、缺乏驗證事實功能
生成式AI時常提供看似正確卻與實際情形不符的回覆,若使用者誤信該答案即可能帶來風險。另外,生成式AI屬於持續動態發展的資訊生態系統,當產出結果有偏誤時,若沒有大規模的人為干預恐難以有效解決此問題。
六、數位犯罪增加與資安攻擊
過去由人工產製的釣魚郵件或網站可能受限於技術限制而容易被識破,然而,生成式AI能夠快速建立具高度說服力的各種擬真資料,降低詐騙的進入門檻。又,駭客亦有可能在不熟悉技術的情況下,利用AI進一步找出資安弱點或攻擊方法,增加防禦難度。
七、敏感資料外洩
使用雲端服務提供商所建立的生成式AI時,由於輸入的資料存儲於外部伺服器,若要追蹤或刪除有一定難度,若遭有心人士利用而導致濫用、攻擊或竄改,將可能產生資料外洩的風險。
八、影子AI(Shadow AI)
影子AI係指開發者未知或無法控制之AI使用情境。隨著AI模型複雜性增加,若開發人員與使用者未進行充分溝通,或使用者在未經充分指導下使用 AI 工具,將可能產生無法預期之風險。
參、事件評析
在Roberto Mata v. Avianca, Inc.案中,法院關注的焦點在於律師的行為,而非對AI技術使用的批判。法院認為,隨著技術的進步,利用可信賴的AI工具作為協助用途並無不當,惟,律師應踐行其專業素養,確保所提交文件之正確性[5]。
當AI科技發展逐漸朝向自主與獨立的方向前進,仍需注意生成式AI使用上之侷限。當個人在使用生成式AI時,需具備獨立思考判斷的能力,並驗證產出結果之正確性,不宜全盤接受生成式AI提供之回答。針對企業或具高度專業領域人士使用生成式AI時,除確認結果正確性外,更需注意資料保護及治理議題,例如建立AI工具合理使用情境及加強員工使用相關工具之教育訓練。在成本能負擔的情況下,可選擇透過企業內部的基礎設施訓練AI模型,或是在訓練模型前確保敏感資料已經加密或匿名。並應注意自身行業領域相關法規之更新或頒布,以適時調整資料使用之方式。
雖目前生成式AI仍有其使用之侷限,仍應抱持開放的態度,在技術使用與風險預防之間取得平衡,以能夠在技術發展的同時,更好地學習新興科技工具之使用。
[1] Mata v. Avianca, Inc., 1:22-cv-01461, (S.D.N.Y.).
[2] Benjamin Weiser, Here’s What Happens When Your Lawyer Uses ChatGPT, The New York Times, May 27, 2023, https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.html (last visited Aug. 4, 2023).
[3] Boston Consulting Group [BCG], The CEO’s Roadmap on Generative AI (Mar. 2023), https://media-publications.bcg.com/BCG-Executive-Perspectives-CEOs-Roadmap-on-Generative-AI.pdf (last visited Aug. 29, 2023).
[4] Kate Saenko, Is generative AI bad for the environment? A computer scientist explains the carbon footprint of ChatGPT and its cousins, The Conversation (May 23, 2023.), https://theconversation.com/is-generative-ai-bad-for-the-environment-a-computer-scientist-explains-the-carbon-footprint-of-chatgpt-and-its-cousins-204096 (last visited Sep. 7, 2023).
[5] Robert Lufrano, ChatGPT and the Limits of AI in Legal Research, National Law Review, Volume XIII, Number 195 (Mar. 2023), https://www.natlawreview.com/article/chatgpt-and-limits-ai-legal-research (last visited Aug. 29, 2023).
中國大陸於2017年8月在杭州設立網路法院(Internet court),專責處理網路購物、線上著作侵權等涉及網路爭議之案件。該法院網站設有「線上訴訟平台」,當事人在該平台使用手機號碼註冊帳號後,可遞交起訴狀和相應的證據材料,勾選所需依據的法律條文,系統將自動讀取該當事人之相關身分資訊、線上交易過程及各類表單資料。 近日該網路法院針對一線上著作權侵權案件,於審判過程中採用區塊鏈電子數據作為證據,等同認可區塊鏈電子存證之法律效力。由於區塊鏈作為去中心化的數據庫,每筆網路交易訊息皆同步於整個區塊鏈網路,因此區塊鏈有著難以竄改、刪除的特性。杭州網路法院將從第三方存證平台的資格、侵權網頁取證技術可信度及區塊鏈電子數據保存完整性進行審查,對本案電子數據之證據效力作出認定。 杭州網路法院認為,對於採用區塊鏈等技術進行存證之電子數據,應秉承開放、中立的態度進行個案分析認定,不得因為區塊鏈等技術本身屬於新型且複雜之技術而排斥或提高其認定標準。本案認可區塊鏈技術存證之法律效力,將對區塊鏈未來應用發展有很大的影響,隨著技術發展逐步成熟,產業應用的實際效果也愈發顯著。
OECD 發布2015年科學、科技與產業計分板,建議各國政府應增加對於創新研發之投資於2015年10月19日,經濟合作與發展組織(OECD)發布最新2015年OECD科學、科技與產業計分板(OECD Science, Technology and Industry Scoreboard 2015),此份報告指出,各國政府應增加對於創新研發的投資,以發展工業、醫療、資通訊產業的新領域科技,也將為氣候變化等全球性挑戰提供急需的解決措施。該報告數據顯示,美國、日本和韓國在新一代突破性科技方面具領先地位,即智慧製造材料、健康、資通訊技術這些有潛力改變現有進程的領域,尤其是韓國,最近在這些領域獲得了重大進展。自2000年以來,韓國的公共研發支出增加二倍之多,2014年GDP佔比達1.2%。反觀,許多發達經濟體的公共研發支出卻停滯不前,2014年OECD經濟體公共研發GDP佔比平均水平低於0.7%。 於2010-12年間,在智慧製造材料、健康和新一代資通訊技術領域,在歐洲和美國申請專利家族(patent families)中,美國、日本和韓國共佔到65%以上,接著是德國、法國與中國。2005-07年,韓國在這三個領域的專利家族申請數表現出最為強勁。在資通訊技術領域,韓國正致力於推動智慧聯網技術,歐盟是量子計算,中國則是巨量資料。於2013年OECD國家總研發支出實際增長了2.7%,達1.1萬億美元,但其GDP佔比與2012年相同,為2.4%。這一增長主要來自企業研發投入,而政府研發投入受到了預算合併等措施的影響。創新不止依靠研發上的投入,也依靠互補性資產,如軟體、設計和人力資本,即知識資本(knowledge-based capital, KBC)。知識資本投入已證實可抵抗經濟危機的衝擊,且2013年的數據表明各個經濟行業都增加了對知識資本的投入。但自2010年以來,許多發達國家政府資助或實施的研發減少或停滯不前。OECD警示,研發支出的減少對許多發達經濟體科技研發系統的穩定產生了威脅。鑑於OECD國家70%的研發來自企業部門,也傾向於關注特定應用程序的開發,從而改進先前的OECD計分版本,此份報告強調政府有必要保持對更具開放性的“基礎研究”的投入,始能激發與一些潛在用戶相關的新發現與新發明。
日本名古屋地方法院強調刑事手段對於營業秘密保護的必要性日本名古屋地方法院(下稱法院)在2022年3月18日,對於被控訴違反《不正競爭防止法》的「愛知製鋼」前董事本蔵義信(下稱本蔵)等,宣判無罪。被告本蔵致力研發磁阻抗( Magnetic Impedance, MI)感測器,嗣後對於提高感測器性能及開拓市場等方向,與「愛知製鋼」意見分歧。故於2014年離職另成立マグネデザイン公司,翌年研究發現Giga Spin Rotation (GSR)原理,能製造更小且性能更高的感測器,並取得多項專利。 在2017年,原告「愛知製鋼」以被告本蔵等在2013年的會議中洩露營業秘密等為理由,提起告訴。經過兩次搜查,檢調發現相關會議筆記及白板照片等證據,故向法院提起公訴。法院指出在刑事程序,同樣適用民事上營業秘密法定構成要件,然而本案涉及的技術資訊,屬於工程上一般性、抽象性資訊,不符合秘密性要件。此外,法院認為原告「愛知製鋼」除未落實機密分級,在書面資料上標示「機密」外;且在保密期限屆滿後,亦未與生產商再簽署保密契約,難認為已採取合理保密措施,故不能認定被告本蔵等洩漏營業秘密。 雖然日本經濟產業省已明確指出刑事罰係針對違法性高的行為,且法院對於刑事訴訟的舉證程度,要求必須達到無合理懷疑。同時社會亦有輿論認為調查人員應慎重判斷,避免因不當提起訴訟,造成科學技術發展的負面影響。但在本案中,法院則強調營業秘密對於企業經濟活動的重要性極高,為避免因營業秘密侵害行為,致損害企業競爭力,故採取刑事保護的必要性,越發提高。綜上所述,若企業欲透過刑事罰,保護營業秘密,須採取更嚴謹的管理措施,始能確保藉由刑事訴訟程序,主張權利救濟。 本文同步刊登於TIPS網站(https://www.tips.org.tw)
英國將建立全國性的身份證資料庫英國財政部於表示新成立的身份與護照服務 (Identity and Passport Service, IPS) 將接管由國家統計局 (Office for National Statistics) 所負責的市民資訊計劃 (Citizen Information Project) ,此一計劃之目的係為建立一個包含個人姓名、住址、生日以及一個獨特的身份證字號的成人人口註冊系統 (Adult Population Register) 。 IPS 將負責發展全國身份登記系統 (National Identity Register , NIR) 以作為成人人口資料庫 (Adult Population Database) 。之後,將以 NIR 中所儲存的資料為最終的個人聯絡資料來源。目前此一資料庫只針對年滿 16 歲的成人進行聯絡資料的蒐集,不含兒童的聯絡資料在內,至於是否要建立兒童人口資料庫則有待更進一步的商討。