用ChatGPT找法院判決?從Roberto Mata v. Avianca, Inc.案淺析生成式AI之侷限
資訊工業策進會科技法律研究所
2023年09月08日
生成式AI是透過研究過去資料,以創造新內容和想法的AI技術,其應用領域包括文字、圖像及影音。以ChatGPT為例,OpenAI自2022年11月30日發布ChatGPT後,短短二個月內,全球月均用戶數即達到1億人,無疑成為民眾日常生活中最容易近用的AI科技。
惟,生成式AI大量使用後,其中的問題也逐漸浮現。例如,ChatGPT提供的回答僅是從所學習的資料中統整歸納,無法保證資料的正確性。Roberto Mata v. Avianca, Inc.案即是因律師利用ChatGPT撰寫訴狀,卻未重新審視其所提供判決之正確性,以致後續引發訴狀中所描述的判決不存在爭議。
壹、事件摘要
Roberto Mata v. Avianca, Inc.案[1]中,原告Roberto Mata於2019年8月搭乘哥倫比亞航空從薩爾瓦多飛往紐約,飛行過程中膝蓋遭空服員的推車撞傷,並於2022年2月向法院提起訴訟,要求哥倫比亞航空為空服員的疏失作出賠償;哥倫比亞航空則主張已超過《蒙特婁公約》(Montreal Convention)第35條所訂之航空器抵達日起兩年內向法院提出損害賠償之請求時效。
R然而,法院審理過程中發現原告訴狀內引用之六個判決無法從判決系統中查詢,進而質疑判決之真實性。原告律師Steven A. Schwartz因而坦承訴狀中引用的六個判決是ChatGPT所提供,並宣稱針對ChatGPT所提供的判決,曾多次向ChatGPT確認該判決之正確性[2]。
貳、生成式AI應用之潛在風險
雖然運用生成式AI技術並結合自身專業知識執行特定任務,可能有助於提升效率,惟,從前述Roberto Mata v. Avianca, Inc.案亦可看出,依目前生成式AI技術之發展,仍可能產生資訊正確性疑慮。以下彙整生成式AI應用之8大潛在風險[3]:
一、能源使用及對環境危害
相較於傳統機器學習,生成式AI模型訓練將耗費更多運算資源與能源。根據波士頓大學電腦科學系Kate Saenko副教授表示,OpenAI的GPT-3模型擁有1,750億個參數,約會消耗1,287兆瓦/時的電力,並排放552噸二氧化碳。亦即,每當向生成式AI下一個指令,其所消耗的能源量相較於一般搜尋引擎將可能高出4至5倍[4]。
二、能力超出預期(Capability Overhang)
運算系統的黑盒子可能發展出超乎開發人員或使用者想像的隱藏功能,此發展將會對人類帶來新的助力還是成為危險的阻力,則會隨著使用者之間的相互作用而定。
三、輸出結果有偏見
生成式AI通常是利用公開資料進行訓練,若輸入資料在訓練時未受監督,而帶有真實世界既存的刻板印象(如語言、種族、性別、性取向、能力、文化等),據此建立之AI模型輸出結果可能帶有偏見。
四、智慧財產權疑慮
生成式AI進行模型訓練時,需仰賴大量網路資料或從其他大型資料庫蒐集訓練資料。然而,若原始資料來源不明確,可能引發取得資料未經同意或違反授權條款之疑慮,導致生成的內容存在侵權風險。
五、缺乏驗證事實功能
生成式AI時常提供看似正確卻與實際情形不符的回覆,若使用者誤信該答案即可能帶來風險。另外,生成式AI屬於持續動態發展的資訊生態系統,當產出結果有偏誤時,若沒有大規模的人為干預恐難以有效解決此問題。
六、數位犯罪增加與資安攻擊
過去由人工產製的釣魚郵件或網站可能受限於技術限制而容易被識破,然而,生成式AI能夠快速建立具高度說服力的各種擬真資料,降低詐騙的進入門檻。又,駭客亦有可能在不熟悉技術的情況下,利用AI進一步找出資安弱點或攻擊方法,增加防禦難度。
七、敏感資料外洩
使用雲端服務提供商所建立的生成式AI時,由於輸入的資料存儲於外部伺服器,若要追蹤或刪除有一定難度,若遭有心人士利用而導致濫用、攻擊或竄改,將可能產生資料外洩的風險。
八、影子AI(Shadow AI)
影子AI係指開發者未知或無法控制之AI使用情境。隨著AI模型複雜性增加,若開發人員與使用者未進行充分溝通,或使用者在未經充分指導下使用 AI 工具,將可能產生無法預期之風險。
參、事件評析
在Roberto Mata v. Avianca, Inc.案中,法院關注的焦點在於律師的行為,而非對AI技術使用的批判。法院認為,隨著技術的進步,利用可信賴的AI工具作為協助用途並無不當,惟,律師應踐行其專業素養,確保所提交文件之正確性[5]。
當AI科技發展逐漸朝向自主與獨立的方向前進,仍需注意生成式AI使用上之侷限。當個人在使用生成式AI時,需具備獨立思考判斷的能力,並驗證產出結果之正確性,不宜全盤接受生成式AI提供之回答。針對企業或具高度專業領域人士使用生成式AI時,除確認結果正確性外,更需注意資料保護及治理議題,例如建立AI工具合理使用情境及加強員工使用相關工具之教育訓練。在成本能負擔的情況下,可選擇透過企業內部的基礎設施訓練AI模型,或是在訓練模型前確保敏感資料已經加密或匿名。並應注意自身行業領域相關法規之更新或頒布,以適時調整資料使用之方式。
雖目前生成式AI仍有其使用之侷限,仍應抱持開放的態度,在技術使用與風險預防之間取得平衡,以能夠在技術發展的同時,更好地學習新興科技工具之使用。
[1] Mata v. Avianca, Inc., 1:22-cv-01461, (S.D.N.Y.).
[2] Benjamin Weiser, Here’s What Happens When Your Lawyer Uses ChatGPT, The New York Times, May 27, 2023, https://www.nytimes.com/2023/05/27/nyregion/avianca-airline-lawsuit-chatgpt.html (last visited Aug. 4, 2023).
[3] Boston Consulting Group [BCG], The CEO’s Roadmap on Generative AI (Mar. 2023), https://media-publications.bcg.com/BCG-Executive-Perspectives-CEOs-Roadmap-on-Generative-AI.pdf (last visited Aug. 29, 2023).
[4] Kate Saenko, Is generative AI bad for the environment? A computer scientist explains the carbon footprint of ChatGPT and its cousins, The Conversation (May 23, 2023.), https://theconversation.com/is-generative-ai-bad-for-the-environment-a-computer-scientist-explains-the-carbon-footprint-of-chatgpt-and-its-cousins-204096 (last visited Sep. 7, 2023).
[5] Robert Lufrano, ChatGPT and the Limits of AI in Legal Research, National Law Review, Volume XIII, Number 195 (Mar. 2023), https://www.natlawreview.com/article/chatgpt-and-limits-ai-legal-research (last visited Aug. 29, 2023).
由於數位環境下,歐盟著作權法架構在著作跨境使用上仍有不明確之處,因此歐執會於2016/09/14公布「歐盟單一數位市場之著作權指令」法案(Proposition de DIRECTIVE DU PARLEMENT EUROPÉEN ET DU CONSEIL sur le droit d’auteur dans le marché unique numérique)。法案產生背景是因為擬藉由此法案補充現行歐盟著作權規範架構之不足。 此法案涉及三大重點議題,包括:網路著作內容之跨境取得、歐盟著作權規則如何在數位及跨國環境下運作、以及歐盟著作權市場運作。 因應作品新型式數位使用及具跨境使用性質,法案對於科學研究上資料探索(la fouille de textes et de données)、以教育為目的使用及為文化遺產保存使用,於網路跨境使用上,賦予著作權法跨境使用例外。 其次,為便利VOD平台取得影視著作之授權使用,此法案要求會員國設立授權協商機制,由公正第三方,就數位著作授權,提供權利人及平台諮詢業務。又為簡化數位新聞出版品之授權,確保出版者對數位新聞業之投資,法案承認數位新聞出版者為著作鄰接權人。也就是說,針對新聞作品數位使用上,賦予數位新聞出版者重製權及公眾提供權(le droit de mise à disposition)。 另外為確保著作權授權市場運作,明定網路儲存及連接服務業者(ISP)雖可主張第三人免責規定,但仍負有採取適當及合比例性措施來保護網路著作權之義務;同時,要求授權作品(包含權利移轉)之事後使用資訊需透明化,若有權利金與使用收益比例不當之情形,會員國需有補償機制之救濟並提供替代性爭端解決機制,希望藉由促進著作經濟價值的正確評估,加強對著作人及表演人之保護。 簡而言之,指令目的在擴大歐盟內部使用接近(近用)受著作權保護之網路作品機會,促進受著作權保護作品得以跨境使用於教育、研究及文化保存,以確保數位著作權市場運作效益。 法案將依據歐盟立法程序分送歐盟議會及理事會審查。 本文同步刊登於TIPS網站(https://www.tips.org.tw)
抗癌中草藥將進行臨床試驗中央研究院院士鄭永齊研發的中草藥新藥 PHY906 ,宣布將與國家衛生研究院合作進行大腸直腸癌第一/二期臨床試驗,這項藥物由美國 PhytoCeutica 公司及台灣的順天堂製藥共同合作,預計四年後進入市場。 PHY906 係從一千八百年前的傳統古方大棗、芍藥、黃耆、甘草等四種中草藥中找到的複方產品,經動物實驗證明可治療下瀉、噁心、發燒及疼痛等徵狀,積極療效方面,將測試癌症化療所引發的副作用。 此學名為 PHY906 的藥物係由耶魯大學授權給其衍生公司 Phyceotica 後,透過「 Phytomics 」的品管專利技術,除了在美國繼續進行一/二期肝癌試驗外,也將在台灣執行大腸直腸癌的第一/二期臨床試驗,預定明年底可申請在美國執行第三期臨床試驗,順利的話,可在三年內完成人體臨床試驗。 據了解, Phyceotica 公司於一九九八年成立,主要股東包括香港及台灣的中華開發工銀,同時和順天堂中藥廠成為生產合作夥伴。 國家衛生研究院日前舉辦「中藥全球化聯盟」第四次會議,全世界五十一個會員參與,會議重點在探討四大技術平台,包括建立中藥品質管制、中藥來源鑑定及栽培標準化、建立中藥資料庫及推動國際中心臨床試驗;希望藉由該會議讓更多國家業者共同參與該藥的臨床試驗工作。
荷蘭公司控《中國好聲音》商標侵權,索賠300萬北京法院於2016年3月17日開始審理關於「夢想強音文化傳播有限公司」和「北京正議天下文化傳媒公司」未經授權使用荷蘭Talpa公司商標一案。 Talpa公司主要業務為開發、製作電視節目模式,〈The Voice of〉是該公司開發的一款歌唱比賽真人秀電視節目模式,為該公司知名產品。Talpa已向中國、澳州、美國、歐盟等在內約70個國家,註冊了「The Voice of 」商標,商標圖示為一隻手拿麥克風之圖像。 《中國好聲音》製作單位於2012年向荷蘭Talpa 買下節目模式與商標圖示,用以製作音樂真人秀《中國好聲音》;今年Talpa並未與其續約,故《中國好聲音》製作單位未取得Talpa公司商標專用權。 惟負責《中國好聲音》第五季海選活動之夢想強音文化傳播公司和北京正議天下文化傳媒公司,在好聲音全國海選活動與宣傳中,大量使用與Talpa註冊商標幾乎相同的圖形及文字;Talpa公司認為,此為類似商品上使用與註冊商標相同或近似商標行為,已造成消費者混淆,依中國大陸人民共和國商標法第57條,構成侵害商標專用權。據此,Talpa公司要求上開兩間公司立即停止商標侵權行為,並要求登報道歉與連帶賠償律師費、公證費、翻譯費及各項損失300萬元。 本文同步刊登於TIPS網站(http://www.tips.org.tw)
美國公布TPP官方版本確認智慧財產權及資料專屬權條款美國貿易代表辦公室(the Office of the United States Trade Representative,簡稱USTR)於11月5日公布泛太平洋夥伴協議官方版本,並待各成員國國會同意。其中第18章是有關智慧財產權受到爭議較多。其涉及層面包括商標、地理標示、著作權及相關權利、網路服務提供者、資料專屬保護、專利連結、發明專利、工業設計、智慧財產權執行等等。其重點如下: (1)商標:TPP規定不得以視覺可感知的標識作為申請商標註冊的要件。 (2)地理標示:TPP要求提供適當及公開的程序來保護地理標示。 (3)著作權及相關權利:其中最重要者為將著作、表演或錄音物的著作權保護期間,延長至70年。 (4)網路服務提供者:TPP要求對ISP業者提供法律誘因,免除其可能擔負的共同侵權責任,鼓勵其與著作權人合作,共同遏止網路侵權。 (5)資料專屬保護:TPP要求對農藥或醫藥品提供資料專屬保護,保護期間為新化學性農藥至少10年;新成分新藥至少5年;已知藥品之新適應症、新複方或新投藥方法之臨床資料至少3年;新生物藥品至少8年或5年(併同其他有效保護市場機制)。 (6)專利連結:TPP要求建立專利連結制度。 (7)發明專利制度:其中較為重要者為TPP規定優惠期期間為本國申請案申請日前1年,且不限制公開的行為態樣。對於審查不合理遲延者,應補償其專利期限。 (8)工業設計:TPP要求應提供物品部分設計之保護。 (9)智慧財產權保護的執行:TPP規定法院有權判決敗訴方負擔訴訟及律師費用費用;透過行政、司法及海關等層面採取迅速保全措施等等。