落實完善數位資料管理機制,
有助於降低AI歧視及資料外洩風險
資訊工業策進會科技法律研究所
2023年07月07日
近年來,科技快速發展,AI(人工智慧)等技術日新月異,在公私部門的應用日益廣泛,而且根據美國資訊科技研究與顧問公司Gartner在2023年5月發布的調查指出,隨著由OpenAI開發的ChatGPT取得成功,更促使各領域對於AI應用的高度重視與投入[1],與此同時,AI歧視及資料外洩等問題,亦成為社會各界的重大關切議題。
壹、事件摘要
目前AI科技發展已牽動全球經濟發展,根據麥肯錫公司近期發布的《生成式人工智慧的經濟潛力:下一個生產力前沿(The next productivity frontier)》研究報告指出,預測生成式AI(Generative AI)有望每年為全球經濟增加2.6兆至4.4兆的經濟價值[2]。同時在美國資訊科技研究與顧問公司Gartner對於超過2500名高階主管的調查中,45%受訪者認為ChatGPT問世,增加其對於AI的投資。而且68%受訪者認為AI的好處大於風險,僅有5%受訪者認為風險大於好處[3]。然而有社會輿論認為AI的判斷依賴訓練資料,將可能複製人類偏見,造成AI歧視問題,而且若程式碼有漏洞或帳戶被盜用時,亦會造成資料外洩問題。
貳、重點說明
首先,關於AI歧視問題,以金融領域為例,近期歐盟委員會副主席Margrethe Vestager強調若AI用於可能影響他人生計的關鍵決策時,如決定是否能取得貸款,應確保申請人不受性別或膚色等歧視[4],同時亦有論者認為若用於訓練AI的歷史資料,本身存有偏見問題,則可能導致系統自動拒絕向邊緣化族群貸款,在無形之中加劇,甚至永久化對於特定種族或性別的歧視[5]。
其次,關於資料外洩問題,資安公司Group-IB指出因目前在預設情況下,ChatGPT將保存使用者查詢及AI回應的訊息紀錄,若帳戶被盜,則可能洩露機敏資訊。據統計在2022年6月至2023年5月間,在亞太地區有近41000個帳戶被盜,而在中東和非洲地區有近25000個帳戶被盜,甚至在歐洲地區也有近17000個帳戶被盜[6]。另外在2023年3月時,ChatGPT除了發生部分用戶能夠檢視他人聊天紀錄標題的問題外,甚至發生個人資料外洩問題,即用戶可能知悉他人的姓名、電子郵件,付款地址,信用卡到期日及號碼末四碼等資料[7]。
參、事件評析
對於AI歧視及資料外洩等問題,應透過落實完善數位資料治理與管理機制,以降低問題發生的風險。首先,在收集訓練資料時,為篩選適合作為模型或演算法基礎的資料,應建立資料評估或審查機制,減少或避免使用有潛在歧視問題的資料,以確保分析結果之精確性。
其次,不論對於訓練資料、分析所得資料或用戶個人資料等,均應落實嚴謹的資料保密措施,避免資料外洩,如必須對於資料進行標示或分類,並依照不同標示或分類,評估及採取適當程度的保密措施。同時應對於資料進行格式轉換,以無法直接開啟的檔案格式進行留存,縱使未來可能不慎發生資料外洩,任意第三人仍難以直接開啟或解析資料內容。甚至在傳送帳戶登入訊息時,亦應採取適當加密傳送機制,避免遭他人竊取,盜取帳戶或個人資料。
財團法人資訊工業策進會科技法律研究所長期致力於促進國家科技法制環境完善,於2021年7月發布「重要數位資料治理暨管理制度規範(Essential Data Governance and Management System,簡稱EDGS)」,完整涵蓋數位資料的生成、保護與維護,以及存證資訊的取得、維護與驗證的流程化管理機制,故對於不同公私部門的AI相關資料,均可參考EDGS,建立系統性數位資料管理機制或強化既有機制。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1]Gartner, Gartner Poll Finds 45% of Executives Say ChatGPT Has Prompted an Increase in AI Investment (May 3, 2023), https://www.gartner.com/en/newsroom/press-releases/2023-05-03-gartner-poll-finds-45-percent-of-executives-say-chatgpt-has-prompted-an-increase-in-ai-investment (last visited June 30, 2023).
[2]McKinsey, The economic potential of generative AI: The next productivity frontier (June 14, 2023), https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-AI-the-next-productivity-frontier#introduction (last visited June 30, 2023).
[3]Gartner, supra note 1.
[4]Zoe Kleinman, Philippa Wain & Ashleigh Swan, Using AI for loans and mortgages is big risk, warns EU boss (June 14, 2023), https://www.bbc.com/news/technology-65881389 (last visited June 30, 2023).
[5]Ryan Browne & MacKenzie Sigalos, A.I. has a discrimination problem. In banking, the consequences can be severe (June 23, 2023), https://www.cnbc.com/2023/06/23/ai-has-a-discrimination-problem-in-banking-that-can-be-devastating.html (last visited June 30, 2023).
[6]Group-IB, Group-IB Discovers 100K+ Compromised ChatGPT Accounts on Dark Web Marketplaces; Asia-Pacific region tops the list (June 20, 2023), https://www.group-ib.com/media-center/press-releases/stealers-chatgpt-credentials/ (last visited June 30, 2023).
[7]OpenAI, March 20 ChatGPT outage: Here’s what happened (Mar. 24, 2023),https://openai.com/blog/march-20-chatgpt-outage (last visited June 30, 2023).
掌管網域名稱規則的組織—ICANN,於2008年6月底透過總裁Paul Twomey表示,其將計畫提出新的通用型網域名稱(Top-level domains, “TLD”),以為增加網域名稱的選擇性做準備,並且讓想透過網域名稱表現自我的使用者,有更多選擇模式。目前為止,網域名稱使用者可選擇的通用型網域名稱限於21種,例如.com、.org、.info等。 根據ICANN新的規劃,申請新的通用型網域名稱者,可以自己選擇其網域名稱,並且進行登記。所有的新申請者不但可以專屬使用其所選擇的網域名稱,也可以將該網域名稱透過登記移轉來進行買賣。 從ICANN的聲明來看,其預估申請者將會以群組做為主要的選擇,例如現有旅遊業者的.travel,另外以城市作為通用型網域名稱的需求也相當高,例如.nyc、.paris。 ICANN目前計畫限定一個期間來接受全世界的團體來申請通用型網域名稱,預估第一輪的申請期限截止後,ICANN將會透過預計9個月的評選程序,來處理所有的通用型網域名稱申請。目前ICANN的新計畫預計於2009年第二季開始接受申請。
美國專利商標局再審結果,將影響Motorola 與Aruba Networks間的專利侵權訴訟結果美商Motorola 公司(下稱MOT) 旗下Symbol Technologies, Inc.及Wireless Valley Communications, Inc.公司於2007年8月27日在美國德拉瓦州(Delaware)地方法院對美商Aruba Networks公司(下稱ARUN)提起專利侵權訴訟,指出ARUN侵害他們的無線區域網路連結技術(WLAN)等四項專利,並向法院申請永久禁制令及金錢上的損害賠償。 2008年9月,ARUN向法院申請反訴並向美國專利商標局(USPTO)對上開四項專利申請再審,指出MOT所據以主張的專利權申請日晚於ARUN之現有技術(Prior Arts)實施日。 今(2009)年2月,美國專利商標局已陸續對於ARUN所提的再審核發初審報告。其中,US Patent No.6625454中12/14說明項被認定為無效;US Patent Nos.6973622, 7173922之再審初審報告指出全部說明項都被認定為無效;目前還有1件ARUN申請的專利再審案在審查中,而根據MOT於法院上的陳述,美國專利商標局所受理的再審專利案件中,也多將原專利權認定為無效或變更。 ARUN所提的再審結果雖然尚未確定,但多數分析師認為再審結果多有利於ARUN。待再審結果確認後將會影響MOT v ARUN的訴訟結果,對於損害賠償判定也會有重大影響 。
美國賓州眾議院通過《人工智慧生成內容揭露法》美國賓州(Pennsylvania)眾議院於2024年4月10日通過《人工智慧生成內容的揭露法草案》(House Bill 1598 Disclosure of Artificially Intelligent Generated Content,下稱草案),規範AI生成內容及其利用行為以保護消費者。 草案規定,以AI生成之各種形式內容,在其首次呈現給消費者時應揭露資訊,使消費者知道該內容為AI生成之結果。如果明知或重大過失(Knowingly or recklessly)產出、散布或發布任何未「明確且顯著」(clear and conspicuous)揭露其內容為AI所生成者,即屬「不公平或欺騙性行為或做法」,將被依賓州《不公平貿易行為與消費者保護法》(Unfair Trade Practices And Consumer Protection Law)規定處罰。草案亦說明應如何揭露資訊,方符合條文所謂「明確且顯著」標準,例如針對AI生成之音訊內容,其揭露應以足夠的音量和節奏傳達,以便消費者聽取和理解。 此外,草案也關注兒童保護問題。鑑於AI生成的兒童性剝削圖像通報日益增加,草案最後新增規定,未來不能將「兒童性剝削圖像為AI生成」作為辯護理由,且檢察總長或地區檢察官可起訴製造、持有以及傳播AI生成之兒童色情或性虐待素材等相關行為。 目前草案已在州眾議院通過,由州參議院審議中。草案的提案議員強調,人們有權知道其消費的內容實際上是使用AI產出的成果,因此草案通過後,可望有效遏阻濫用AI的行為,提供賓州民眾更多的保障。
美國基改動物法規研擬中基改動物的技術研發腳步雖不如植物快速,不過自1980年出現重大的技術突破後,基改動物的研發成果不斷產出,目前基改動物的研發方向以醫藥用途最多,其次像是環保、食用、抗氣候變遷等,均有相關的研究投入。隨著研發成果的累積,美國也開始構思基改動物的規範議題,2008年9月,美國FDA及APHIS分別就基改動物提出規範細節及資訊調查的公告。 由於美國並未對基改生物訂定管理專法,而是利用既有的法規體系來管理基因改造生物,而既有法規原各有其規範目的,因此如何從這些既有法規的規範目的出發,闡述其用來規範基改動物的適當連結,以及相關主管機關將如何運用既有法規來管理基改動物,便成為研議的重點。 目前FDA內的CVM(Center for Veterinary Medicine)已率先宣告其對基改動物的主管權限,並公告「基因重組動物管理之產業指導原則(草案)」(Draft Guidance for Industry on the Regulation of Genetically Engineered Animals)。FDA認為,由於轉殖進入基改動物體內的重組DNA構體(rDNA construct),已對動物本身的結構與功能(construct and function)產生影響,符合其依聯邦食品藥品及化妝品管理法(Federal Food, Drug, and Cosmetic Act)規定所稱之藥(drug)的定義,因此,FDA宣告其對所有的基改動物(精確來說是轉殖於其體內的重組DNA構體),將視以動物用新藥(new animal drug)管理之,至於基改動物後續可能有不同的用途,則另須符合相關的產品主管法規,始可上市。在APHIS部分,其主要負責動物健康之把關,目前APHIS正對外進行廣泛的資訊蒐集與調查,以作為其後續研擬進一步的管理規則或政策之參考依據。