落實完善數位資料管理機制,
有助於降低AI歧視及資料外洩風險
資訊工業策進會科技法律研究所
2023年07月07日
近年來,科技快速發展,AI(人工智慧)等技術日新月異,在公私部門的應用日益廣泛,而且根據美國資訊科技研究與顧問公司Gartner在2023年5月發布的調查指出,隨著由OpenAI開發的ChatGPT取得成功,更促使各領域對於AI應用的高度重視與投入[1],與此同時,AI歧視及資料外洩等問題,亦成為社會各界的重大關切議題。
壹、事件摘要
目前AI科技發展已牽動全球經濟發展,根據麥肯錫公司近期發布的《生成式人工智慧的經濟潛力:下一個生產力前沿(The next productivity frontier)》研究報告指出,預測生成式AI(Generative AI)有望每年為全球經濟增加2.6兆至4.4兆的經濟價值[2]。同時在美國資訊科技研究與顧問公司Gartner對於超過2500名高階主管的調查中,45%受訪者認為ChatGPT問世,增加其對於AI的投資。而且68%受訪者認為AI的好處大於風險,僅有5%受訪者認為風險大於好處[3]。然而有社會輿論認為AI的判斷依賴訓練資料,將可能複製人類偏見,造成AI歧視問題,而且若程式碼有漏洞或帳戶被盜用時,亦會造成資料外洩問題。
貳、重點說明
首先,關於AI歧視問題,以金融領域為例,近期歐盟委員會副主席Margrethe Vestager強調若AI用於可能影響他人生計的關鍵決策時,如決定是否能取得貸款,應確保申請人不受性別或膚色等歧視[4],同時亦有論者認為若用於訓練AI的歷史資料,本身存有偏見問題,則可能導致系統自動拒絕向邊緣化族群貸款,在無形之中加劇,甚至永久化對於特定種族或性別的歧視[5]。
其次,關於資料外洩問題,資安公司Group-IB指出因目前在預設情況下,ChatGPT將保存使用者查詢及AI回應的訊息紀錄,若帳戶被盜,則可能洩露機敏資訊。據統計在2022年6月至2023年5月間,在亞太地區有近41000個帳戶被盜,而在中東和非洲地區有近25000個帳戶被盜,甚至在歐洲地區也有近17000個帳戶被盜[6]。另外在2023年3月時,ChatGPT除了發生部分用戶能夠檢視他人聊天紀錄標題的問題外,甚至發生個人資料外洩問題,即用戶可能知悉他人的姓名、電子郵件,付款地址,信用卡到期日及號碼末四碼等資料[7]。
參、事件評析
對於AI歧視及資料外洩等問題,應透過落實完善數位資料治理與管理機制,以降低問題發生的風險。首先,在收集訓練資料時,為篩選適合作為模型或演算法基礎的資料,應建立資料評估或審查機制,減少或避免使用有潛在歧視問題的資料,以確保分析結果之精確性。
其次,不論對於訓練資料、分析所得資料或用戶個人資料等,均應落實嚴謹的資料保密措施,避免資料外洩,如必須對於資料進行標示或分類,並依照不同標示或分類,評估及採取適當程度的保密措施。同時應對於資料進行格式轉換,以無法直接開啟的檔案格式進行留存,縱使未來可能不慎發生資料外洩,任意第三人仍難以直接開啟或解析資料內容。甚至在傳送帳戶登入訊息時,亦應採取適當加密傳送機制,避免遭他人竊取,盜取帳戶或個人資料。
財團法人資訊工業策進會科技法律研究所長期致力於促進國家科技法制環境完善,於2021年7月發布「重要數位資料治理暨管理制度規範(Essential Data Governance and Management System,簡稱EDGS)」,完整涵蓋數位資料的生成、保護與維護,以及存證資訊的取得、維護與驗證的流程化管理機制,故對於不同公私部門的AI相關資料,均可參考EDGS,建立系統性數位資料管理機制或強化既有機制。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1]Gartner, Gartner Poll Finds 45% of Executives Say ChatGPT Has Prompted an Increase in AI Investment (May 3, 2023), https://www.gartner.com/en/newsroom/press-releases/2023-05-03-gartner-poll-finds-45-percent-of-executives-say-chatgpt-has-prompted-an-increase-in-ai-investment (last visited June 30, 2023).
[2]McKinsey, The economic potential of generative AI: The next productivity frontier (June 14, 2023), https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-AI-the-next-productivity-frontier#introduction (last visited June 30, 2023).
[3]Gartner, supra note 1.
[4]Zoe Kleinman, Philippa Wain & Ashleigh Swan, Using AI for loans and mortgages is big risk, warns EU boss (June 14, 2023), https://www.bbc.com/news/technology-65881389 (last visited June 30, 2023).
[5]Ryan Browne & MacKenzie Sigalos, A.I. has a discrimination problem. In banking, the consequences can be severe (June 23, 2023), https://www.cnbc.com/2023/06/23/ai-has-a-discrimination-problem-in-banking-that-can-be-devastating.html (last visited June 30, 2023).
[6]Group-IB, Group-IB Discovers 100K+ Compromised ChatGPT Accounts on Dark Web Marketplaces; Asia-Pacific region tops the list (June 20, 2023), https://www.group-ib.com/media-center/press-releases/stealers-chatgpt-credentials/ (last visited June 30, 2023).
[7]OpenAI, March 20 ChatGPT outage: Here’s what happened (Mar. 24, 2023),https://openai.com/blog/march-20-chatgpt-outage (last visited June 30, 2023).
美國食藥署(US Food and Drug Administration, FDA)於2022年2月23日提出「醫療器材品質系統規則修正草案(Medical Devices; Quality System Regulation Amendments proposed rule)」。本次修正旨在釐清現行條文與國際標準ISO13485醫療器材品質管理系統之異同,並進行適度調和。 根據修正說明,草案就現行條文與ISO13485一致之處將予保留,不一致者若屬落實授權母法「美國聯邦食品藥粧法(US Federal Food, Drug and Cosmetics Act, FD&C Act)」之必要內容,將斟酌條文用詞明確性調整後予以保留,其餘將予刪除。此外,草案也透過名詞解釋界定不同用語之定義範疇,嫁接現行條文與ISO13485落差處。對於現行條文中,與ISO13485性質相同但內容產生衝突之條文,基於依授權母法意旨,以現行條文為準。 FDA注意到,部分FD&C Act所重視的品質管理系統要求,在ISO13485中並未被重點凸顯,如記錄控管(control of records)、醫材標示(device labeling)及包裝控管(packaging controls)。本次修正特別針對此三部分保留並增補較ISO13485要求更為詳細的規範內容。在記錄控管部分,除依照ISO13485要求,記錄標的應為日期及簽署確認外,進一步依據FD&C Act規定,要求特定的服務及執行紀錄應予以紀錄,以作為醫材報告之內容。此外,也規定應詳實記錄醫療器材單一識別碼(Unique Device Identification, UDI)。在醫材標示及包裝控管部分,由於ISO13485僅指出產品應標示及包裝,但未詳述細節要求。因此,本次修正保留現行條文對於標示及包裝的細節性規定,以確保產品安全性及有效性。 本草案目前進入意見徵集期間,時間自2022年3月25日起至2022年5月24日止。後續FDA將視所徵集之意見,決定是否調整草案內容或公告施行。本次修定將使醫療器材品質系統規則與ISO13485趨於一致,預計可減輕廠商行政作業及支出負擔。
美國專利標示不實之罰金計算美國聯邦巡迴上訴法院在2009年底於The Forest Group Inc. v. Bon Tool Co. 一案中將美國專利法35 U.S.C. § 292中關於不實專利標示(false patent marking)的懲罰金計算方式認定為罰金之計算是以每一個標示錯誤專利資訊的產品為基礎。美國專利法35 U.S.C. § 292中要求法院對專利資訊標示不實或錯誤之產品或包裝處以最高美金$500的罰金。在此案之前,許多地方法院將35 U.S.C. § 292解釋為罰金之計算是以每一次被告”決定”將產品標示不實專利資訊為基礎 (single penalty for each “decision” to falsely mark products),不論此決定是包含一個或一整批產品。在本案中,聯邦巡迴上訴法院同意地方法院的看法認定被告Forest Group意圖藉不實專利標示企圖欺騙大眾但撤銷地方法院將罰金定為$500之判定,而將目前專利法35 U.S.C. § 292 解釋為罰金是以”每一個”標示錯誤專利資訊的產品為基礎 (penalty for false marking on a per article basis)。 為了防範日後因此案罰金計算方式而造成所謂”標示流氓”(marking trolls) 之興起,聯邦法院於其判決中特別說明其解釋並非要求法院必須將每一標示錯誤專利資訊的產品處以$500美元的罰金。因法條中之罰金是以美金$500為上限,法院有權利權衡各案例背景決定罰款金額。例如,針對大量製造但價錢低廉的產品, 法院可對每一個產品處以極少的罰金。 The Forest Group 一案是美國聯邦巡迴上訴法院第一次針對不實專利標示之罰金提出解釋,直得關注其後續引發反應。廠商也應重新檢視其產品專利標示是否有不實或錯誤之狀況以避免被控標示不實專利資訊而被處以罰款。
Rosetta Stone對Google提起商標侵權訴訟Rosetta Stone是以製作語言學習軟體,教導顧客學習外國語言為主的一家公司,其總部是設立在美國之Virginia州。於2009年7月10日在總部所在地之地方法院對Google提起商標侵權訴訟,宣稱上個月Google之AdWords廣告政策的變更,其中針對商標的部份,會使得購買Google廣告之客戶包括盜版軟體業者等,可以使用未經實際商標權人許可之商標或近似之標語於其廣告內容中。 在Google搜尋引擎中之刊登廣告者可以選擇特定關鍵字來引出他們的廣告,一但顧客輸入這些關鍵字時,這些Google之廣告刊登者及讚助商連結等,也會出現在搜尋結果之中,讓顧客連上他們網頁,Google以此模式從中獲利。 Rosetta Stone表示Google此舉如同協助第三人”劫持”顧客去妨害其銷售及其商業行為。 Rosetta Stone之總顧問Michael Wu表示:「Google搜尋引擎幫助第三人去誤導顧客及不當使用Rosetta Stone之商標成為一個關鍵字使用在其廣告內文或是標題,導致於誤導顧客連結至他們的網站,而從此廣告刊登之業務中獲利。」Rosetta Stone擁有美國註冊之商標及標語如「global traveler」、「language library」、「dynamic immersion」、「the fastest way to learn a language guaranteed」而Google卻促使顧客對Rosetta Stone之商標造成混淆誤認甚至盜用於廣告上。 除Rosetta Stone之外,目前已有American Airlines及Geico等公司同樣對Google這樣的政策變更提起訴訟。 另一方面,Google之發言人表示:「尚未接到訴訟相關文件,不予置評」。
開放臍帶血移植 再等等林口長庚醫院透過專案申請,已經完成10例「非親屬臍帶血移植」手術,病人術後狀況良好,都不需再輸血,有2人連抗排斥藥物都不需要。目前學界草擬的「臍帶血移植草案」已出爐,將放寬為常規手術,不過須審慎訂定符合手術的資格,開放與否還得再等。 林口長庚原本預計在2年內完成4例手術,結果半年內就完成,再度以專案申請,1年2個月下來共完成10例。參與的兒童醫院血液腫瘤科醫師江東和表示,參與試驗的病童,多為重度海洋性貧血,在臍帶血配對上,不那麼嚴格,術後恢復情形良好,加上家長口耳相傳,所以不斷有人希望透過此一途徑,救自己的孩子。 不過,林口長庚暫時無法再繼續「加班」,江東和表示經費是主因,這10例由於是試驗性質,醫療費用、門診追蹤費用,全由長庚的研究經費支付,不可能無限量供應。江東和表示院方對於臍帶血移植手術,累積的信心度很高,未來須視手術開放的程度,列為常規醫療還是專案申請,才能決定如何繼續這項治療方法。