落實完善數位資料管理機制,
有助於降低AI歧視及資料外洩風險
資訊工業策進會科技法律研究所
2023年07月07日
近年來,科技快速發展,AI(人工智慧)等技術日新月異,在公私部門的應用日益廣泛,而且根據美國資訊科技研究與顧問公司Gartner在2023年5月發布的調查指出,隨著由OpenAI開發的ChatGPT取得成功,更促使各領域對於AI應用的高度重視與投入[1],與此同時,AI歧視及資料外洩等問題,亦成為社會各界的重大關切議題。
壹、事件摘要
目前AI科技發展已牽動全球經濟發展,根據麥肯錫公司近期發布的《生成式人工智慧的經濟潛力:下一個生產力前沿(The next productivity frontier)》研究報告指出,預測生成式AI(Generative AI)有望每年為全球經濟增加2.6兆至4.4兆的經濟價值[2]。同時在美國資訊科技研究與顧問公司Gartner對於超過2500名高階主管的調查中,45%受訪者認為ChatGPT問世,增加其對於AI的投資。而且68%受訪者認為AI的好處大於風險,僅有5%受訪者認為風險大於好處[3]。然而有社會輿論認為AI的判斷依賴訓練資料,將可能複製人類偏見,造成AI歧視問題,而且若程式碼有漏洞或帳戶被盜用時,亦會造成資料外洩問題。
貳、重點說明
首先,關於AI歧視問題,以金融領域為例,近期歐盟委員會副主席Margrethe Vestager強調若AI用於可能影響他人生計的關鍵決策時,如決定是否能取得貸款,應確保申請人不受性別或膚色等歧視[4],同時亦有論者認為若用於訓練AI的歷史資料,本身存有偏見問題,則可能導致系統自動拒絕向邊緣化族群貸款,在無形之中加劇,甚至永久化對於特定種族或性別的歧視[5]。
其次,關於資料外洩問題,資安公司Group-IB指出因目前在預設情況下,ChatGPT將保存使用者查詢及AI回應的訊息紀錄,若帳戶被盜,則可能洩露機敏資訊。據統計在2022年6月至2023年5月間,在亞太地區有近41000個帳戶被盜,而在中東和非洲地區有近25000個帳戶被盜,甚至在歐洲地區也有近17000個帳戶被盜[6]。另外在2023年3月時,ChatGPT除了發生部分用戶能夠檢視他人聊天紀錄標題的問題外,甚至發生個人資料外洩問題,即用戶可能知悉他人的姓名、電子郵件,付款地址,信用卡到期日及號碼末四碼等資料[7]。
參、事件評析
對於AI歧視及資料外洩等問題,應透過落實完善數位資料治理與管理機制,以降低問題發生的風險。首先,在收集訓練資料時,為篩選適合作為模型或演算法基礎的資料,應建立資料評估或審查機制,減少或避免使用有潛在歧視問題的資料,以確保分析結果之精確性。
其次,不論對於訓練資料、分析所得資料或用戶個人資料等,均應落實嚴謹的資料保密措施,避免資料外洩,如必須對於資料進行標示或分類,並依照不同標示或分類,評估及採取適當程度的保密措施。同時應對於資料進行格式轉換,以無法直接開啟的檔案格式進行留存,縱使未來可能不慎發生資料外洩,任意第三人仍難以直接開啟或解析資料內容。甚至在傳送帳戶登入訊息時,亦應採取適當加密傳送機制,避免遭他人竊取,盜取帳戶或個人資料。
財團法人資訊工業策進會科技法律研究所長期致力於促進國家科技法制環境完善,於2021年7月發布「重要數位資料治理暨管理制度規範(Essential Data Governance and Management System,簡稱EDGS)」,完整涵蓋數位資料的生成、保護與維護,以及存證資訊的取得、維護與驗證的流程化管理機制,故對於不同公私部門的AI相關資料,均可參考EDGS,建立系統性數位資料管理機制或強化既有機制。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1]Gartner, Gartner Poll Finds 45% of Executives Say ChatGPT Has Prompted an Increase in AI Investment (May 3, 2023), https://www.gartner.com/en/newsroom/press-releases/2023-05-03-gartner-poll-finds-45-percent-of-executives-say-chatgpt-has-prompted-an-increase-in-ai-investment (last visited June 30, 2023).
[2]McKinsey, The economic potential of generative AI: The next productivity frontier (June 14, 2023), https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-AI-the-next-productivity-frontier#introduction (last visited June 30, 2023).
[3]Gartner, supra note 1.
[4]Zoe Kleinman, Philippa Wain & Ashleigh Swan, Using AI for loans and mortgages is big risk, warns EU boss (June 14, 2023), https://www.bbc.com/news/technology-65881389 (last visited June 30, 2023).
[5]Ryan Browne & MacKenzie Sigalos, A.I. has a discrimination problem. In banking, the consequences can be severe (June 23, 2023), https://www.cnbc.com/2023/06/23/ai-has-a-discrimination-problem-in-banking-that-can-be-devastating.html (last visited June 30, 2023).
[6]Group-IB, Group-IB Discovers 100K+ Compromised ChatGPT Accounts on Dark Web Marketplaces; Asia-Pacific region tops the list (June 20, 2023), https://www.group-ib.com/media-center/press-releases/stealers-chatgpt-credentials/ (last visited June 30, 2023).
[7]OpenAI, March 20 ChatGPT outage: Here’s what happened (Mar. 24, 2023),https://openai.com/blog/march-20-chatgpt-outage (last visited June 30, 2023).
華盛頓橄欖球隊(Washington Football Team,簡稱D.C. NFL)原名為華盛頓紅皮隊(Washington Redskins),其名稱”Redskins”因具有種族歧視含意,一直以來都充滿爭議,雖然在漫長的法律程序中,成功的維護了他們的”Redskins”商標,然最終仍不敵輿論的壓力,在2020年7月放棄了這個已使用87年之久的商標。 如何為球隊重新命名一個品牌名稱以替代那悠久且著名的原品牌名稱,且新名稱要能夠讓球迷具有認同感,對球隊來說本就不是件容易的事,何況還需要考慮到9月即將開始的NFL(The National Football League)賽季,這更名時程看來就顯得更加緊迫。除了考量到NFL為全球性的賽事,商標命名時所需考量的市場變成全球市場而使這任務更顯艱鉅之外,現在球隊將因為其球迷的行為,使得其新品牌的命名橫添變數。 自1980年來即是球隊粉絲的菲利浦•馬丁•麥考利(Philip Martin McCaulay),已經留意到球隊更名的可能性,近年將可能的名稱先申請商標,除了華盛頓勇士隊(Washington Warriors)外,還包含華盛頓紅狼(Washington Red Wolves)、華盛頓紀念碑(Washington Monuments)、華盛頓熊貓(Washington Pandas)等多達40個商標,而且從美國專利商標局(United States Patent and Trademark Office)資料,麥考利顯然不是唯一一位這樣做的人,究竟是要取得他人的授權,或是經過漫長的命名流程,面對9月就要到來的賽季,已經沒有太多時間留給球隊考慮。 隨著時間變遷,商標法中妨害公序良俗的認定亦會改變,因此品牌長期經營亦須時時檢視該商標在當下的涵義,及早變更因應的方向。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」
利用安裝SPYWARE擅自寄送廣告,挨告美國紐約州律師 Eliot Spitzer 4 月 4 日 表示, 他已經 對 Direct Revenue LLC 這家網路公司提出告訴。控訴其秘密安裝上百萬之間諜軟體( Spyware )至網路使用者的電腦中,或利用已安裝於使用者硬碟中之間諜軟體,以彈出視窗方式進行廣告,而其中有很多都屬於色情廣告;這些程式具追蹤網路使用者活動之功能,且一經下載,使用者就極難移除甚至不易察覺。 Spitzer 將此訴訟上訴到紐約州之最高法院,認為 Spitzer 應該為未經使用者同意秘密安裝間諜軟體,或透過已存在的間諜軟體寄送廣告之行為負責。 Spitzer 同時要求 Direct Revenue ,應對其所受之利益和不特定的金錢損害,負擔賠償責任。 去年( 2005 ), Spitzer 也對在洛杉磯的 Intermix Media Inc. 提起告訴。這家公司擁有一個相當受歡迎的 MySpace 的社交網絡網站,卻將間諜軟體隱藏附隨在上百萬的免費程式中,最後 Intermix Media Inc. 因而付了 750 萬美元。 Spitzer 表示這種詐欺的行為對消費者極不公平,且將對利用正當管道行銷的企業以及需要消費者信任的小型網路商家造成損害。 Spitzer 也說到,他將會繼續的與消費者站在同一陣線,與消費者共同為他們的掌控權而戰。 Direct Revenue 網站說明指出,他們已事先取得消費者之同意,而其提供之內容資訊和免費軟體,目的在交換傳遞廣告之功能。
把生物廢棄物變黃金—英國智庫建議政府應提供更多的財務協助當前科學家正極力從廢棄的生物物質(biomass)中,尋找可以做為燃料使用的資源(biofuel)。使用生物燃料的概念與全球氣候變遷以及石油價格一再攀高有關,生物燃料是指在不影響食物供應的前提下,使用木材、稻桿或麥桿、庭園廢棄物等作為第二代的燃料來源。不過在鼓勵發展生物燃料之餘,發展此一領域之技術卻亦有不可忽略的問題有待解決。 以英國為例,英國法律規定在2010年以前,英國政府必須確保所有公路運輸使用的燃料中,至少有5%是使用生物燃料;而最近英國的能源檢視報告則建議,在2015年前,此項生物燃料使用的門檻值應達10%。英國國家非食用作物研究中心(National Non-Food Crops Centre, NNFCC)近期也提出報告,指出英國每年農作收成後皆剩餘大量的小麥、甜菜,若能輔以更多的政府促進措施,例如租稅減免,則達成2010年5%的門檻指標,並非難事。不過若想要達成2015年10%的指標,英國政府則必須另外從國外進口生物燃料。 生物廢棄物的利用指的是把各地方的廢棄物以及非食用作物拿來轉化成為生物燃料。使用生物燃料最大的缺點是建置成本(start-up costs)過高,舉例來說,使用甜菜或黃豆來生產生質柴油(biodiesel)的成本,每英噸約為700至800歐元,其中把生物廢棄物液態化的過程(biomass to liquids (BTL) process),約需每英噸450至500歐元;而要建置一個第一代生物燃料廠乃至運作,其投資費用高達5千萬歐元,第二代生物燃料的生產所需建置成本,則可能為前述數字的五至十倍。有鑑於此,NNFCC透過經濟模式的運算,建議英國政府應對第二代生物燃料廠提供每公升至少35%的租稅減免優惠(目前英國政府僅給予每公升20%的租稅減免優惠),始能鼓勵民間部門進行相關投資。 另一項發展生物燃料的隱憂則是,由於生物燃料與食物的來源都是取自於自然界的同一資源,發展生物燃料是否反而可能造成食物與燃料的爭戰中,侵蝕自然界的資源,最後反而導致各種價格的上升。