落實完善數位資料管理機制,
有助於降低AI歧視及資料外洩風險
資訊工業策進會科技法律研究所
2023年07月07日
近年來,科技快速發展,AI(人工智慧)等技術日新月異,在公私部門的應用日益廣泛,而且根據美國資訊科技研究與顧問公司Gartner在2023年5月發布的調查指出,隨著由OpenAI開發的ChatGPT取得成功,更促使各領域對於AI應用的高度重視與投入[1],與此同時,AI歧視及資料外洩等問題,亦成為社會各界的重大關切議題。
壹、事件摘要
目前AI科技發展已牽動全球經濟發展,根據麥肯錫公司近期發布的《生成式人工智慧的經濟潛力:下一個生產力前沿(The next productivity frontier)》研究報告指出,預測生成式AI(Generative AI)有望每年為全球經濟增加2.6兆至4.4兆的經濟價值[2]。同時在美國資訊科技研究與顧問公司Gartner對於超過2500名高階主管的調查中,45%受訪者認為ChatGPT問世,增加其對於AI的投資。而且68%受訪者認為AI的好處大於風險,僅有5%受訪者認為風險大於好處[3]。然而有社會輿論認為AI的判斷依賴訓練資料,將可能複製人類偏見,造成AI歧視問題,而且若程式碼有漏洞或帳戶被盜用時,亦會造成資料外洩問題。
貳、重點說明
首先,關於AI歧視問題,以金融領域為例,近期歐盟委員會副主席Margrethe Vestager強調若AI用於可能影響他人生計的關鍵決策時,如決定是否能取得貸款,應確保申請人不受性別或膚色等歧視[4],同時亦有論者認為若用於訓練AI的歷史資料,本身存有偏見問題,則可能導致系統自動拒絕向邊緣化族群貸款,在無形之中加劇,甚至永久化對於特定種族或性別的歧視[5]。
其次,關於資料外洩問題,資安公司Group-IB指出因目前在預設情況下,ChatGPT將保存使用者查詢及AI回應的訊息紀錄,若帳戶被盜,則可能洩露機敏資訊。據統計在2022年6月至2023年5月間,在亞太地區有近41000個帳戶被盜,而在中東和非洲地區有近25000個帳戶被盜,甚至在歐洲地區也有近17000個帳戶被盜[6]。另外在2023年3月時,ChatGPT除了發生部分用戶能夠檢視他人聊天紀錄標題的問題外,甚至發生個人資料外洩問題,即用戶可能知悉他人的姓名、電子郵件,付款地址,信用卡到期日及號碼末四碼等資料[7]。
參、事件評析
對於AI歧視及資料外洩等問題,應透過落實完善數位資料治理與管理機制,以降低問題發生的風險。首先,在收集訓練資料時,為篩選適合作為模型或演算法基礎的資料,應建立資料評估或審查機制,減少或避免使用有潛在歧視問題的資料,以確保分析結果之精確性。
其次,不論對於訓練資料、分析所得資料或用戶個人資料等,均應落實嚴謹的資料保密措施,避免資料外洩,如必須對於資料進行標示或分類,並依照不同標示或分類,評估及採取適當程度的保密措施。同時應對於資料進行格式轉換,以無法直接開啟的檔案格式進行留存,縱使未來可能不慎發生資料外洩,任意第三人仍難以直接開啟或解析資料內容。甚至在傳送帳戶登入訊息時,亦應採取適當加密傳送機制,避免遭他人竊取,盜取帳戶或個人資料。
財團法人資訊工業策進會科技法律研究所長期致力於促進國家科技法制環境完善,於2021年7月發布「重要數位資料治理暨管理制度規範(Essential Data Governance and Management System,簡稱EDGS)」,完整涵蓋數位資料的生成、保護與維護,以及存證資訊的取得、維護與驗證的流程化管理機制,故對於不同公私部門的AI相關資料,均可參考EDGS,建立系統性數位資料管理機制或強化既有機制。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1]Gartner, Gartner Poll Finds 45% of Executives Say ChatGPT Has Prompted an Increase in AI Investment (May 3, 2023), https://www.gartner.com/en/newsroom/press-releases/2023-05-03-gartner-poll-finds-45-percent-of-executives-say-chatgpt-has-prompted-an-increase-in-ai-investment (last visited June 30, 2023).
[2]McKinsey, The economic potential of generative AI: The next productivity frontier (June 14, 2023), https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-AI-the-next-productivity-frontier#introduction (last visited June 30, 2023).
[3]Gartner, supra note 1.
[4]Zoe Kleinman, Philippa Wain & Ashleigh Swan, Using AI for loans and mortgages is big risk, warns EU boss (June 14, 2023), https://www.bbc.com/news/technology-65881389 (last visited June 30, 2023).
[5]Ryan Browne & MacKenzie Sigalos, A.I. has a discrimination problem. In banking, the consequences can be severe (June 23, 2023), https://www.cnbc.com/2023/06/23/ai-has-a-discrimination-problem-in-banking-that-can-be-devastating.html (last visited June 30, 2023).
[6]Group-IB, Group-IB Discovers 100K+ Compromised ChatGPT Accounts on Dark Web Marketplaces; Asia-Pacific region tops the list (June 20, 2023), https://www.group-ib.com/media-center/press-releases/stealers-chatgpt-credentials/ (last visited June 30, 2023).
[7]OpenAI, March 20 ChatGPT outage: Here’s what happened (Mar. 24, 2023),https://openai.com/blog/march-20-chatgpt-outage (last visited June 30, 2023).
美國眾議院於2013/10/22提出法案(Sensible Oversight for Technology which Advances Regulatory Efficiency Act of 2013,簡稱Software Act,HR3303),擬限制食品藥物管理局 (Food and Drug Administration,FDA)在與健康醫療有關軟體制訂規範的權限。 根據美國聯邦法典第21編第301條以下(21 U.S.C. § 301)規定,FDA對醫療器材擁有法定職權進行規範。FDA近來亦開始嘗試對醫療軟體APP制訂規範,包括附有生物識別裝置(如血壓監視器和照相機)、讓消費者可以蒐集資料、供醫生可遠距離進行部分檢測行為的行動設備。這項法案的支持者以為,FDA此舉將阻礙醫療創新,故擬透過Software Act界定FDA的規管權限。 這項法案主要增加了3個定義:醫療軟體(medical software)、臨床軟體(clinical software)和健康軟體(health software)。醫療軟體仍在FDA的管轄範圍內,但其他2類則否。惟本法案只確立FDA無權對資料蒐集類軟體進行規範,但對此類軟體得使用的範圍、或是否需另授與執照等議題並沒有著墨。提案者以為,後續應由總統和國會應共同努力,對臨床軟體和健康軟體制訂和頒佈立法,建立以風險為基礎的管制架構,降低管制負擔,促進病患安全與醫療創新。 所謂醫療軟體,指涉及改變身體(changing the body)的軟體。包括意圖透過市場銷售、供消費者使用,直接改變人體結構或功能的軟體;或,意圖透過市場銷售、供消費者使用,以提供臨床醫療行為建議的藥物、器材或治療疾病的程序;或其他不需要健康照護提供者參與的情境,但實施後會直接改變人體結構或功能的藥物、器材或程序。 僅從人體蒐集資料者,被歸類為臨床軟體(由醫療院所、健康照護提供者裝設)或健康軟體(由民眾自為)。兩者的區別,主要在由誰提供並裝設。 所謂臨床軟體,是醫療院所或健康照護提供者在提供服務時使用,提供臨床決策支援目的之軟體,包括抓取、分析、改變或呈現病患或民眾臨床數據相關的硬體和流程,但不會直接改變人體結構或任何功能。 根據Research2Guidance於2013年2月發表的調查報告(Mobile Health Market Report 2013-2017),目前在APPLE的APP Store上已有97,000個行動健康類的APP程式,有3百萬個免費、30萬個付費下載使用者。15%的APP是專門設計給健康照護提供者;與去年相比,已有超過6成的醫生使用平板提供服務。預測消費者使用智慧型手機上的醫療APP的數量,在2015年將達5億。這個法案的出現,外界以為,提供了科技創新者較明確的規範指引,允許醫療的進步和創新。
德國2015年12月3日通過數位健康法(e-Health Gesetz)德國聯邦議會於2015年12月3日通過「健康制度安全數位通訊與應用法」 (下稱數位健康法,Gesetz für sichere digitale Kommunikation und Anwendungen im Gesundheitswesen, e-Health-Gesetz),本法無須經過聯邦參議院同意,最快將於2016 年初生效。 該法係以患者的權益和隱私為中心而制定。其中安全的數位基礎設施將改善健康照護、加強病患的自我決定權。數位健康法要求於全德範圍內,從2016 年中期開始至 2018年中,依法定之資訊技術基礎設施的時間表引進相關技術與設施,在醫療診所和醫院之間全面進行電信基礎設施的連結。 本法案要點摘要如下: • 最新一代的主資料管理(Stammdatenmanagement) (被保險人主資料(Versichertenstammdaten)的測試及更新) 將提供醫生最新資料和防止醫療給付濫用。這個數位健康卡第一個線上應用,將在2018 年中全面引進。而 2018 年 7 月 1 日起未參加線上被保險人主資料驗證之醫生,其補貼亦將削減。 • 醫療用緊急資料(Notfalldaten)應從 2018 年開始依被保險人意願在數位健康卡上儲存,以避免危險藥物的交互作用。因此,從2016 年 10 月開始,使用三種以上藥物患者,將收到藥物治療計畫(Medikationsplan)。而藥劑師自始即有義務在被保險人變更處方時更新之。從 2018 年開始,用藥計畫可以以電子傳輸方式從數位健康卡卡中檢索。 • 數位健康法將促進電子病歷(Arztbriefe)的推動。病患可以對其主治者告知其最重要的健康資料,並以數位資料形式儲存使用。另外,病患的權益和自主決定是本法重點,患者不僅可自行決定何種醫療資料應以卡片儲存,並可決定誰有權查閱。病患亦得提取卡片中儲存之資料。如血糖測量值、從可穿戴裝置或隨身手圈所量測的資料。 • 為提倡遠距醫療(Telemedizin),從 2017 年4 月開始遠距 x 光診斷評估和從 2017年7 月起,線上視訊諮詢時段納入醫療合約給付中。使病患更易獲取醫療訊息,同時在預後諮詢和監控諮詢中亦能得到醫療服務。 • 為進入遠端醫療時代,必須確保各種 IT 系統可以進行溝通,故須在 2017 年 6 月 30 日前提出互通性指引(Interoperabilitätsverzeichnis),使衛生部門不同的 IT 系統所採用的標準簡明化。 • 智慧手機和其他行動裝置使用健康APP已漸普及,到 2016 年底前應確認,被保險人是否可以使用相關設備來行使他們的醫療資料存取權限以及資料是否能夠相互連結進行傳輸。
美國白宮發布《晶片與科學法》實施一周年總結美國白宮(The White House,以下簡稱白宮)於2023年8月9日發布《晶片與科學法》(CHIPS and Science Act,以下簡稱晶片法)頒布一周年之總結,說明相關補助及租稅優惠措施之實施成效。自晶片法施行以來,已吸引高達1,660億美元之私人投資,並有50所以上大學宣布將開設半導體人力培訓課程,顯示晶片法對半導體生產製造在地化已有相當成效。晶片法施行後推動之措施如下: 1.說明半導體補助申請流程及條件 美國國家標準及技術研究院(National Institute of Standards and Technology)於2023年2月28日分別發布「半導體製造補助之申請指引」(Funding Opportunit–Commercial Fabrication Facilities)與「半導體製造補助願景」(Vision for Success: Commercial Fabrication Facilities),說明晶片法補助目的、申請流程、條件以及注意事項,並於同年6月23日更新相關內容。 2.說明柵欄條款之運作方式 美國商務部(Department of Commerce)與財政部(Department of Treasury)2023年3月23日於美國聯邦公報(Federal Register)發布法規預告(proposed rules),詳細說明晶片法內柵欄條款(guardrails)之運作方式。根據法規預告之內容,受補助人於受補助後的10年內若未經美國商務部與財政部同意,不得於中國等特定國家進行半導體製造設施「實質擴廠」之「重大交易」,避免受補助人將晶片法提供之補助用於中國,進而侵害美國國家安全。 3.強化半導體研發創新 美國商務部於2022年9月6日發布「美國晶片補助戰略」(A Strategy for the CHIPS for America Fund),說明商務部將與國家科學基金會(National Science Foundation)等建立「國家半導體科技中心與執行國家先進封裝製造計畫」(National Advanced Packaging Manufacturing Program),協助美國維持半導體研發之領先地位,並大幅縮短研發成果商用化之時程。 4.保障區域經濟發展與創新 美國商務部於2023年5月發布第1期「科技中心計畫」(Tech Hubs Program)申請指引,協助區域製造、商業化和部署關鍵技術;並於2023年6月發布第1期「重新競爭領航計畫」(Recompete Pilot Porgram),為長期處於經濟困境的美國社區提供就業機會。
歐盟執委會提出「歐盟開放資訊戰略」為達成歐盟數位議程(Digital Agenda)中的單一數位市場(Digital Single Market)目標,歐盟執委會(EU Commission)提出了「開放資訊戰略」(Open Data Strategy for Europe)措施,預計可為歐洲地區創造出每年超過400億歐元的產值。 此方案係利用歐盟各會員國政府已蒐集的大量資訊,藉由免費或低收費的方式,提供全歐洲任意目的使用。目前英國、法國已完成相關整備,蓄勢待發 。 歐盟此目標包含三個具體措施:a.歐盟執委會將率先開始,利用新網站(data portals)免費開放資訊;b.建立全歐洲開放資訊的公平競爭環境;c.從2011至2013年投入共1億歐元,以進行資料處理研究。 此外執委會建議修正2003年公共部門資訊再利用指令(2003/98/EC),包含:a.所有公部門蒐集的資訊,在無妨礙著作權情形下,應開放予所有人任何目的使用;b.除了必要成本外,不得收取其他費用;c.任何機器均可使用,以確保資料有效重新利用;d.引入監管機制;e.擴展指令覆蓋範圍,包含博物館與圖書館等。 歐盟執委會現已著手建立新的專屬公開網站,未來該網站將可連結到歐盟各會員國公開資訊。該網站預計於2012年春季正式推出。