落實完善數位資料管理機制,
有助於降低AI歧視及資料外洩風險
資訊工業策進會科技法律研究所
2023年07月07日
近年來,科技快速發展,AI(人工智慧)等技術日新月異,在公私部門的應用日益廣泛,而且根據美國資訊科技研究與顧問公司Gartner在2023年5月發布的調查指出,隨著由OpenAI開發的ChatGPT取得成功,更促使各領域對於AI應用的高度重視與投入[1],與此同時,AI歧視及資料外洩等問題,亦成為社會各界的重大關切議題。
壹、事件摘要
目前AI科技發展已牽動全球經濟發展,根據麥肯錫公司近期發布的《生成式人工智慧的經濟潛力:下一個生產力前沿(The next productivity frontier)》研究報告指出,預測生成式AI(Generative AI)有望每年為全球經濟增加2.6兆至4.4兆的經濟價值[2]。同時在美國資訊科技研究與顧問公司Gartner對於超過2500名高階主管的調查中,45%受訪者認為ChatGPT問世,增加其對於AI的投資。而且68%受訪者認為AI的好處大於風險,僅有5%受訪者認為風險大於好處[3]。然而有社會輿論認為AI的判斷依賴訓練資料,將可能複製人類偏見,造成AI歧視問題,而且若程式碼有漏洞或帳戶被盜用時,亦會造成資料外洩問題。
貳、重點說明
首先,關於AI歧視問題,以金融領域為例,近期歐盟委員會副主席Margrethe Vestager強調若AI用於可能影響他人生計的關鍵決策時,如決定是否能取得貸款,應確保申請人不受性別或膚色等歧視[4],同時亦有論者認為若用於訓練AI的歷史資料,本身存有偏見問題,則可能導致系統自動拒絕向邊緣化族群貸款,在無形之中加劇,甚至永久化對於特定種族或性別的歧視[5]。
其次,關於資料外洩問題,資安公司Group-IB指出因目前在預設情況下,ChatGPT將保存使用者查詢及AI回應的訊息紀錄,若帳戶被盜,則可能洩露機敏資訊。據統計在2022年6月至2023年5月間,在亞太地區有近41000個帳戶被盜,而在中東和非洲地區有近25000個帳戶被盜,甚至在歐洲地區也有近17000個帳戶被盜[6]。另外在2023年3月時,ChatGPT除了發生部分用戶能夠檢視他人聊天紀錄標題的問題外,甚至發生個人資料外洩問題,即用戶可能知悉他人的姓名、電子郵件,付款地址,信用卡到期日及號碼末四碼等資料[7]。
參、事件評析
對於AI歧視及資料外洩等問題,應透過落實完善數位資料治理與管理機制,以降低問題發生的風險。首先,在收集訓練資料時,為篩選適合作為模型或演算法基礎的資料,應建立資料評估或審查機制,減少或避免使用有潛在歧視問題的資料,以確保分析結果之精確性。
其次,不論對於訓練資料、分析所得資料或用戶個人資料等,均應落實嚴謹的資料保密措施,避免資料外洩,如必須對於資料進行標示或分類,並依照不同標示或分類,評估及採取適當程度的保密措施。同時應對於資料進行格式轉換,以無法直接開啟的檔案格式進行留存,縱使未來可能不慎發生資料外洩,任意第三人仍難以直接開啟或解析資料內容。甚至在傳送帳戶登入訊息時,亦應採取適當加密傳送機制,避免遭他人竊取,盜取帳戶或個人資料。
財團法人資訊工業策進會科技法律研究所長期致力於促進國家科技法制環境完善,於2021年7月發布「重要數位資料治理暨管理制度規範(Essential Data Governance and Management System,簡稱EDGS)」,完整涵蓋數位資料的生成、保護與維護,以及存證資訊的取得、維護與驗證的流程化管理機制,故對於不同公私部門的AI相關資料,均可參考EDGS,建立系統性數位資料管理機制或強化既有機制。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1]Gartner, Gartner Poll Finds 45% of Executives Say ChatGPT Has Prompted an Increase in AI Investment (May 3, 2023), https://www.gartner.com/en/newsroom/press-releases/2023-05-03-gartner-poll-finds-45-percent-of-executives-say-chatgpt-has-prompted-an-increase-in-ai-investment (last visited June 30, 2023).
[2]McKinsey, The economic potential of generative AI: The next productivity frontier (June 14, 2023), https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-AI-the-next-productivity-frontier#introduction (last visited June 30, 2023).
[3]Gartner, supra note 1.
[4]Zoe Kleinman, Philippa Wain & Ashleigh Swan, Using AI for loans and mortgages is big risk, warns EU boss (June 14, 2023), https://www.bbc.com/news/technology-65881389 (last visited June 30, 2023).
[5]Ryan Browne & MacKenzie Sigalos, A.I. has a discrimination problem. In banking, the consequences can be severe (June 23, 2023), https://www.cnbc.com/2023/06/23/ai-has-a-discrimination-problem-in-banking-that-can-be-devastating.html (last visited June 30, 2023).
[6]Group-IB, Group-IB Discovers 100K+ Compromised ChatGPT Accounts on Dark Web Marketplaces; Asia-Pacific region tops the list (June 20, 2023), https://www.group-ib.com/media-center/press-releases/stealers-chatgpt-credentials/ (last visited June 30, 2023).
[7]OpenAI, March 20 ChatGPT outage: Here’s what happened (Mar. 24, 2023),https://openai.com/blog/march-20-chatgpt-outage (last visited June 30, 2023).
歐盟將2014年1月28日定為「2014個人資料保護日」(Data Protection Day 2014),倡議推動個人資料修法及規範革新,主要係位因應數位化時代,個人資料權利保護越形重要,並且為了強化保護線上隱私權利,歐盟執委會首於2012年1月25日所提出個人資料保護指令的修正草案─「保護個人關於個人資料處理及此等資料自由流通規章(一般資料保護規章)」(Proposal for a REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL(General Data Protection Regulation));該修正草案於2013年6月進入歐洲議會、理事會及執委會的三方協商,同年10月21日歐洲議會公民、司法與內政委員會(Committee on Civil Liberties, Justice and Home Affairs)審議通過,若進程順利預計將於2014年獲得通過,並於2016年生效施行。 歐盟「2014個人資料保護日」會議中,特別提到此次修法,係為歐盟跨時代的個人資料保護規範革新工作,具有特別重要意義,並且倡議應對於資料可攜權(Right to Data Portability),明文法制化加以落實保障,包括加強資料當事人控制及近取個人資料的權利,資料當事人更容易近取(aceess)個人資料(第14、15條);資料當事人有資料可攜的權利(第18條),當資料處理是以電子化方法,且使用結構性、通用的格式時,資料當事人有權利可以取得該結構性、通用格式下的個人資料(第18條(1)),且更容易自不同服務提供者間移轉個人資料。 國際間對於「資料可攜」議題,正反意見均陳,並未達成共識。歐盟執委會提出個人資料保護指令的修正草案第18條,倡議將「資料可攜性」明文法制化,並要求資料蒐集、處理與利用者對以電子化方法持有的個人資料,需使用結構性、通用的格式,以便利並確保後續個人資料可攜性。此修正草案一提出,隨即引發國際間各重要國家的熱烈探討:有反對者認為,此舉無異將形成未來國際間貿易障礙;有贊成者從確保使用者權益觀點,認為未來智慧聯網(IoT)環境下,資料可攜性是不可避免的趨勢,賦予資料當事人法律權利,有助於個人資料的保護。各重要國家對歐盟修正草案立場及意見,值得加以探究,以觀察未來法制發展趨勢。
美國廣告網路平台服務提供業者針對抑制網路侵權發佈作業準則Google、Microsoft、Yahoo、AOL、24/7 Media、Adtegrity、Condé Nast、SpotXchange數個以美國為主要營運基地的廣告網路平台服務提供者於7月中針對抑制網路侵權聯合發佈一套最佳作業準則,規劃透過減少涉嫌侵權、盜版網站的廣告收益分配,達到抑制網路侵權的效果。 在這個自發性參與的準則中,廣告網路平台服務業者將維持並公告其遏阻與避免販售盜版物品、侵害著作權網站的政策,根據該作業準則,廣告網路平台業者將接受並處理來自權利人有關有疑慮的網站通知、提供合適的通知內容參考指引、指定負責收受侵權通知的窗口,並針對相關控訴採取適當的調查,相關業者將確保其內部處理程序能落實此一作業準則要求。 針對此一發展,著作權產業團體如美國唱片業協會、美國電影協會對此一準則皆大表贊成與歡迎,而公益團體Public Knowledge亦讚許此一準則相當明智,同時也呼籲內容產業團體可以發展其保護網路使用者與媒介的相關作業準則。
泰國計畫拍賣下世代行動通訊頻譜根據外電報導,泰國政府目前正在規劃,將越過3G標準,直接以拍賣方式釋出3張執照給更先進、俗稱3.9G的行動通訊技術,可能的時間點為今年9月。 泰國國家電信委員會(National Telecommunications Commission)委員 Pana Thongmeearkom於2010年5月27日表示,相較於3G技術,3.9G的技術可以提供消費者更好的資料傳輸服務;規劃釋出的執照將以15MHz為單位,期限為15年,規劃釋出的頻段主要為2.3GHz,但2.5GHz亦為另一個可能釋出的頻段。 2.3GHz目前由國營的電信業者TOT&CAT與軍方使用中,2.5GHz則由廣播電視業者使用;泰國政府預計於年底提出清空頻譜方案。 各界評估新的頻譜將允許業者佈建以LTE為基礎的電信設備。泰國三家主要行動電信業者Advanced Info Service(AIS)、Total Access Communication(DTAC)與True Move早已表態將參與競標。 泰國政府之前曾多次宣布將展開3G執照競標計畫,惟時程不斷被推遲,外界歸咎於欠缺一個整合性的獨立頻譜監理機構。對此,Pana被迫給予保證,目前泰國的政治紛亂不會影響國家電信委員會的時間表,但如果設立一個可同時監管廣電與電信頻譜的獨立機關的草案未能通過國會立法程序,釋照程序確實有可能被中斷。 LTE行動通訊技術爭取應用的頻段,在歐洲主要為2.1GHz、2.5GHz、900MHz、與800MHz,在北美為700MHz,在日本為2.1GHz。根據國際電信聯合會ITU的頻譜分配建議,相關頻段多為傳統被劃歸為廣電用途的頻段;對沒有獨立頻譜監理機制的國家而言,相關頻譜的收回與再釋出均可能面臨如泰國政府一樣的挑戰。
什麼是「先進製造夥伴2.0」(Advanced Manufacturing Partnership 2.0, AMP2.0)?為重塑美國先進製造技術領導地位,發展創新研發與就業,美國總統歐巴馬陸續啟動先進製造國家戰略計畫、先進製造夥伴計畫(Advanced Manufacturing Partnership, AMP)與國家製造創新網絡(National Network of Manufacturing Innovation, NNMI)等框架計畫,並於2014年10月由美國總統執行辦公室和科技顧問委員會發布「先進製造夥伴2.0」(Advanced Manufacturing Partnership 2.0, AMP2.0)。 其中新版的先進製造夥伴計畫,除續行原先之計畫目標,例如:對於「研發技術政策形成」、「區域創新機構」與「全國製造創新網絡」等要項外,「先進製造夥伴2.0」框架強調「製造業資源如何有效匯集」,另透過「組織角度設計」、「法制環境建構」與「商業化運用促進」等面向提出具體執行建議。