落實完善數位資料管理機制,
有助於降低AI歧視及資料外洩風險
資訊工業策進會科技法律研究所
2023年07月07日
近年來,科技快速發展,AI(人工智慧)等技術日新月異,在公私部門的應用日益廣泛,而且根據美國資訊科技研究與顧問公司Gartner在2023年5月發布的調查指出,隨著由OpenAI開發的ChatGPT取得成功,更促使各領域對於AI應用的高度重視與投入[1],與此同時,AI歧視及資料外洩等問題,亦成為社會各界的重大關切議題。
壹、事件摘要
目前AI科技發展已牽動全球經濟發展,根據麥肯錫公司近期發布的《生成式人工智慧的經濟潛力:下一個生產力前沿(The next productivity frontier)》研究報告指出,預測生成式AI(Generative AI)有望每年為全球經濟增加2.6兆至4.4兆的經濟價值[2]。同時在美國資訊科技研究與顧問公司Gartner對於超過2500名高階主管的調查中,45%受訪者認為ChatGPT問世,增加其對於AI的投資。而且68%受訪者認為AI的好處大於風險,僅有5%受訪者認為風險大於好處[3]。然而有社會輿論認為AI的判斷依賴訓練資料,將可能複製人類偏見,造成AI歧視問題,而且若程式碼有漏洞或帳戶被盜用時,亦會造成資料外洩問題。
貳、重點說明
首先,關於AI歧視問題,以金融領域為例,近期歐盟委員會副主席Margrethe Vestager強調若AI用於可能影響他人生計的關鍵決策時,如決定是否能取得貸款,應確保申請人不受性別或膚色等歧視[4],同時亦有論者認為若用於訓練AI的歷史資料,本身存有偏見問題,則可能導致系統自動拒絕向邊緣化族群貸款,在無形之中加劇,甚至永久化對於特定種族或性別的歧視[5]。
其次,關於資料外洩問題,資安公司Group-IB指出因目前在預設情況下,ChatGPT將保存使用者查詢及AI回應的訊息紀錄,若帳戶被盜,則可能洩露機敏資訊。據統計在2022年6月至2023年5月間,在亞太地區有近41000個帳戶被盜,而在中東和非洲地區有近25000個帳戶被盜,甚至在歐洲地區也有近17000個帳戶被盜[6]。另外在2023年3月時,ChatGPT除了發生部分用戶能夠檢視他人聊天紀錄標題的問題外,甚至發生個人資料外洩問題,即用戶可能知悉他人的姓名、電子郵件,付款地址,信用卡到期日及號碼末四碼等資料[7]。
參、事件評析
對於AI歧視及資料外洩等問題,應透過落實完善數位資料治理與管理機制,以降低問題發生的風險。首先,在收集訓練資料時,為篩選適合作為模型或演算法基礎的資料,應建立資料評估或審查機制,減少或避免使用有潛在歧視問題的資料,以確保分析結果之精確性。
其次,不論對於訓練資料、分析所得資料或用戶個人資料等,均應落實嚴謹的資料保密措施,避免資料外洩,如必須對於資料進行標示或分類,並依照不同標示或分類,評估及採取適當程度的保密措施。同時應對於資料進行格式轉換,以無法直接開啟的檔案格式進行留存,縱使未來可能不慎發生資料外洩,任意第三人仍難以直接開啟或解析資料內容。甚至在傳送帳戶登入訊息時,亦應採取適當加密傳送機制,避免遭他人竊取,盜取帳戶或個人資料。
財團法人資訊工業策進會科技法律研究所長期致力於促進國家科技法制環境完善,於2021年7月發布「重要數位資料治理暨管理制度規範(Essential Data Governance and Management System,簡稱EDGS)」,完整涵蓋數位資料的生成、保護與維護,以及存證資訊的取得、維護與驗證的流程化管理機制,故對於不同公私部門的AI相關資料,均可參考EDGS,建立系統性數位資料管理機制或強化既有機制。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1]Gartner, Gartner Poll Finds 45% of Executives Say ChatGPT Has Prompted an Increase in AI Investment (May 3, 2023), https://www.gartner.com/en/newsroom/press-releases/2023-05-03-gartner-poll-finds-45-percent-of-executives-say-chatgpt-has-prompted-an-increase-in-ai-investment (last visited June 30, 2023).
[2]McKinsey, The economic potential of generative AI: The next productivity frontier (June 14, 2023), https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-AI-the-next-productivity-frontier#introduction (last visited June 30, 2023).
[3]Gartner, supra note 1.
[4]Zoe Kleinman, Philippa Wain & Ashleigh Swan, Using AI for loans and mortgages is big risk, warns EU boss (June 14, 2023), https://www.bbc.com/news/technology-65881389 (last visited June 30, 2023).
[5]Ryan Browne & MacKenzie Sigalos, A.I. has a discrimination problem. In banking, the consequences can be severe (June 23, 2023), https://www.cnbc.com/2023/06/23/ai-has-a-discrimination-problem-in-banking-that-can-be-devastating.html (last visited June 30, 2023).
[6]Group-IB, Group-IB Discovers 100K+ Compromised ChatGPT Accounts on Dark Web Marketplaces; Asia-Pacific region tops the list (June 20, 2023), https://www.group-ib.com/media-center/press-releases/stealers-chatgpt-credentials/ (last visited June 30, 2023).
[7]OpenAI, March 20 ChatGPT outage: Here’s what happened (Mar. 24, 2023),https://openai.com/blog/march-20-chatgpt-outage (last visited June 30, 2023).
美國自911事件後,事後檢討之建議之一為統合全美單一公共安全網路,可供跨部門之第一線救災人員使用。俟後美國於2008年拍賣700MHz頻段 (Auction 73)時,原本將Block D (788-793MHz/ 758-763MHz)共10MHz規劃為全國單一執照(Nationwide License),並與公共安全(public safety)頻段相連,得標者須與美國政府簽訂網路分享協議(Network Sharing Agreement, NSA),在必要時供緊急服務優先使用,惟該頻段歷經兩次拍賣均低於底價流標。2012年,商務部成立獨立機構First Responder Network Authority (下稱FirstNet),規劃如何統合所有與公共安全相關之通訊網路,FCC在2016年將前述流標之700MHz頻段撥交FirstNet使用。 FirstNet 2017年3月宣布與AT&T達成25年之合作協議,由AT&T協助該機構建置緊急服務人員專用之全國性LTE無線寬頻網路,該網路之主要用途為當緊急事故發生時,第一線之人員可利用該關鍵基礎設施進行通訊聯繫之用。FirstNet與AT&T的合作協議主要包括以下三個部分: FirstNet將提供上下行合計共20MHz 之頻譜 (788-798MHz / 758-768MHz),該頻段係美國主要之LTE頻段,商業價值極高,且設備之生態圈極為成熟。此外,FirstNet也將在未來5年提供65億美金的建設經費,該經費來源為FCC過去頻譜拍賣之標金收入。 AT&T承諾於25年內投入400億美金用於網路基礎設施的建設與維運,並確保網路的覆蓋率。 FirstNet同意在該網路未用於緊急服務時,得做為AT&T商業網路之一部分進行營運,但是當有緊急服務需求時,應立即提供緊急救難使用。 近年來,公共安全災防 (Public Protection and Disaster Relief)寬頻網路已成為許多先進國家的首要推動政策,包含英國與境內第一大電信商Everything Everywhere (EE)合作,芬蘭政府近來亦與電信商Telia共同合作測試LTE技術之公共安全網路。
ICANN將增加網域名稱的選擇性掌管網域名稱規則的組織—ICANN,於2008年6月底透過總裁Paul Twomey表示,其將計畫提出新的通用型網域名稱(Top-level domains, “TLD”),以為增加網域名稱的選擇性做準備,並且讓想透過網域名稱表現自我的使用者,有更多選擇模式。目前為止,網域名稱使用者可選擇的通用型網域名稱限於21種,例如.com、.org、.info等。 根據ICANN新的規劃,申請新的通用型網域名稱者,可以自己選擇其網域名稱,並且進行登記。所有的新申請者不但可以專屬使用其所選擇的網域名稱,也可以將該網域名稱透過登記移轉來進行買賣。 從ICANN的聲明來看,其預估申請者將會以群組做為主要的選擇,例如現有旅遊業者的.travel,另外以城市作為通用型網域名稱的需求也相當高,例如.nyc、.paris。 ICANN目前計畫限定一個期間來接受全世界的團體來申請通用型網域名稱,預估第一輪的申請期限截止後,ICANN將會透過預計9個月的評選程序,來處理所有的通用型網域名稱申請。目前ICANN的新計畫預計於2009年第二季開始接受申請。
澳洲通過新修正之隱私法,大幅提高罰責以期遏止個資事故澳洲司法部長Mark Dreyfus於2022年10月26日提出聯邦《2022年隱私法修正案(執法及其他措施)》(Privacy Legislation Amendment (Enforcement and Other Measures) Bill 2022 (Cth) ),並於11月28日正式通過,顯示澳洲政府對於近期多起大型個資事故的重視,以及民眾對於個資保護之公民意識逐漸成熟。 近期澳洲發生之兩起大規模個資事故,其一為9月底澳洲第二大電信業者Optus表示受到網路攻擊,約有1,000萬人(約占澳洲人口40%)的個資遭到外洩,除了姓名、性別、生日等資料之外也包括用戶的住址、駕照和護照號碼等;無獨有偶,於十月底澳洲最大的私人健康保險公司Medibank亦公開聲明發生200GB的資料遭到竊取的個資事故,被竊資料中有大約970萬名現在或過去客戶的姓名、出生日期、地址、電話號碼和電子郵件地址等資料,因為此兩起大型個資事故的發生,促使澳洲政府不得不予以重視,在極短時間內通過新法修正。 此次修正案修改1988年《隱私法》(Privacy Act)、2010年《澳洲資訊委員法》(Australian Information Commissioner Act)和2005年《澳洲通訊及媒體管理局法》(Australian Communications and Media Authority Act 2005),修正重點包含加重裁罰、加強資訊委員執法權限及域外管轄權。 一、加重裁罰之部分,依修正《隱私法》第13G條,當嚴重或反覆侵犯他人隱私事件發生時,若行為人為「非法人」(a person other than a body corporate,即我國法之自然人)時,其由行政機關課予當事人之罰金(civil penalty)上限提高到250萬澳幣(約新台幣5,200萬);若行為人為「法人」(body corporate)時,罰金上限增加到5,000萬澳幣(約新台幣10億)或其所得利益價值的三倍(兩者取其高)。如果法院無法確定利益的數額,則取法人違規期間或事故發生後12個月內(擇其時間較長者)調整型營收(adjusted turnover*)的30%。 二、關於資訊委員執法權限強化部分,其擴大資訊委員與他公私部門間交換及查閱資訊之權限,資訊委員得向嫌疑人進行調查或要求交付相關證據,且賦予資訊委員得不待法院裁判,逕對妨害查辦者課以民事制裁,甚至得將屢次妨害查辦之法人團體之行為定為刑事犯罪。 三、有關域外管轄權部分,原先僅適用於「未在澳洲設立登記,但有在澳洲境內蒐集個資且經營業務」之公司;現刪除「有在澳洲境內蒐集個資」之規定,故未在澳洲登記之公司往後即使未在澳洲境內蒐集個資,若有在澳洲境內經營業務即受有域外效力之管轄,其範圍甚至將比歐盟GDPR之域外管轄權更為寬廣。 至於提高裁罰金額能否提升資安及個資保護之效益仍有待商榷,惟提高罰鍰額度應能使持有個資業者採行較高之資料保護安全措施等級。我國近期亦發生2,300萬筆民眾戶政資料外洩事件,依我國《個人資料保護法》規定,個資事故發生時,若被害人不易或不能證明其實際損害額時,法院依侵害情節,以每人每一事件500以上至2萬元以下計算財產損害。且同一原因事實造成的事件,原則上其賠償最高總額以2億元為限。若我國將來修法適當調整金額,相信有望遏止類似事故不斷發生。 *調整型營收(adjusted turnover):指公司(及相關企業)在違規期間內營業額扣除應調整之稅額例外項目後,所有商品及服務價值的總和。
美國聯邦與州政府對於污染物排放超標免責立法之衝突。美國聯邦最高法院在2017年6月拒絕對聯邦法令-廠房之啟動,停工,與故障之許可證取得(Startup, Shutdown, Malfunction, SSM)底下之州際執行計畫(State Implementation Plans,SIPs)免責條款的上訴聽案,即各州對於SSM的污染物超標限制,無權力訂定免責條款。1聯邦法令SSM規定公司廠房等所有者或營運者需對於初始營運、日後關閉、中間故障等作業程序與維護措施做成報告以獲得並定期更新營業許可證,報告中需對於預測與計畫中的污染物排放與災難可能做說明,並以遵守聯邦法規對污染物排放相關規定為前提。2 聯邦政府當時以美國聯邦法規(Code of Federal Regulation)以及空氣清潔法案(The Clean Air Act)裡的國家周遭空氣品質標準(National Ambient Air Quality Standards) 為準則,授予各州訂定SIP的權限,因此才有各州多以促進經濟、展業發展為由而自行訂定免責條款的產生。 在原本的SSM機制下,計畫中的污染物超標可能適用各州的免責條款,而非計畫或預測中的污染物超標則會依是否有正當辯護,而可能被下禁治令。隨後,因美國前總統歐巴馬十分重視環境保護,而與美國環境保護總局(Environmental Protection Agency,EPA)頒佈新政策,下令各州把其SIP裡對於污染物超標的免責條款全部刪去。 這樣的大動作使各州政府與企業主十分不開心,便開啟了一連串與EPA的訴訟。2008年D.C.巡迴法院在Sierra Club v. EPA 3判定SSM期間內的違反污染污物排放限額不得有任何免責例外。2014年D.C.巡迴法院於Natural Resources Defense Council v. EPA 4更判定EPA沒有權限給予在SSM期間內違法業者創造任何答辯。雖然美國聯邦最高法院拒絕對此爭議聽案,但目前EPA仍有與州政府及企業主訴訟案在進行。