「巨量資料應用」


  當工業的製造生產過程經過一連串自動化、產量化以及全球化之變革歷程之後,智慧工廠的發展已經成為未來各國的重點目標。生產力4.0的設計中,巨量資料(Big Data)是重要的一環,以製造業為例,傳統上將製造生產取得的數據僅用於追蹤目的使用,鮮少做為改善整體操作流程的基礎,但在生產力4.0推進之後,則轉變為如何藉由巨量資料來提升生的效率、利用多元資源的集中化與分類處理,並經過分析取得改善行動方式,使生產最佳化,再結合訂單需求預期分析,依市場變化調整製造產量,達成本控制效果。

  在我國104年9月公布之「2015行政院產力4.0科技發展方案」,亦提及智慧機械、智慧聯網、巨量資料、雲端運作等技術開發,使製造業、商業服務業、農業產品服務等,提升其附加價值。除此之外,經濟部積極規劃佈建巨量資料自主技術研發能力並且促成投資,落實應用產業智慧化與巨量資料產業化之目標。然而,巨量資料的應用因涉及大量的資料蒐集與利用,因此,未來應著重於如何將資料去辨識化,顧及隱私與個人資料之保護。目前,針對此部分,法務部將研擬個人資料保護法修正案,制訂巨量資料配套法規。

本文為「經濟部產業技術司科技專案成果」

※ 「巨量資料應用」, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=7289&no=55&tp=5 (最後瀏覽日:2025/11/24)
引註此篇文章
你可能還會想看
德國與愛爾蘭對於個人資料處理是否須明示同意之見解不同

  德國與愛爾蘭資料保護局對於資料保護指令所規定個人資料(以下簡稱個資)的處理(process),是否須取得資料當事人明示同意,表示不同的見解。德國資料保護局認為臉書網站所提供之人臉辨識(預設加入)選擇退出(opt out consent)的設定,並不符合資料保護指令(Data Protection Directive)對於同意(consent)的規範,且有違資訊自主權(self-determination);然而,愛爾蘭資料保護局則認為選擇退出的機制並未牴觸資料保護指令。   德國資料保護局委員Johannes Caspar教授表示,預設同意蒐集、使用與揭露,再讓資料當事人可選擇取消預設的作法,其實已經違反資訊自主權(self-determination)。並主張當以當事人同意作為個人資料處理之法律依據時,必須取得資料當事人對其個資處理(processing)之明示同意(explicit consent)。對於部長理事會(Council of Ministers)認同倘資料當事人未表達歧見(unambiguous),則企業或組織即可處理其個人資料的見解,Caspar教授亦無法予以苟同。他認為部長理事會的建議,不但與目前正在修訂的歐盟資料保護規則草案不符,更是有違現行個資保護指令的規定。   有學者認為「同意」一詞雖然不是非常抽象的法律概念,但也不是絕對客觀的概念,尤其是將「同意」單獨分開來看的時候,結果可能不太一樣;對於「同意」的理解,可能受到其他因素,特別文化和社會整體,的影響,上述德國和愛爾蘭資料保護局之意見分歧即為最好案例。   對於同意(consent)的落實是否總是須由資料當事人之明示同意,為近來資料保護規則草案(The Proposed EU General Data Protection Regulation)增修時受熱烈討論的核心議題。資料保護規則草案即將成為歐盟會員國一致適用的規則,應減少分歧,然而對於企業來說,仍需要正視即將實施的規則有解釋不一致的情況,這也是目前討論資料保護規則草案時所面臨的難題之一。

德國第二部開放資料法案簡介

德國第二部開放資料法案簡介 資訊工業策進會科技法律研究所 2023年03月25日 壹、前言 德國聯邦政府於2021年7月16日通過「第二部開放資料法案」(Zweiten Open-Data-Gesetz),包含修正《電子政務促進法(電子化政府法)》(E-Government-Gesetz,EGovG)第12a條,以及修正《資訊再利用法》(Informationsweiterverwendungsgesetz,IWG)並更名為《公部門資料使用法》(Datennutzungsgesetz - DNG),並於同年月23日生效。 修正目的係為充分發揮資料開放政策之潛力,建立一個初步的監管框架,改善資料提供、提高標準化及互通性的問題,以進一步提高資料之可用性。另外,也為轉換歐盟於2019年6月修正《開放資料與公部門資訊再利用指令》(DIRECTIVE (EU) 2019/1024,Open Data and the re-use of Public Sector Information Directive,下稱開放資料指令)[1]。 資料來源:作者自繪 圖一 「德國第二部開放資料法案」立法沿革 以下分別介紹電子化政府法第12a條及《公部門資料使用法》的修法內容: 貳、修法內容 一、電子化政府法第12a條 2017年7月13日,德國在《電子化政府法》新增第12a條「聯邦直接行政機關開放資料」(Offene Daten der Behörden der unmittelbaren Bundesverwaltung)規定,做為「聯邦政府」進行開放政府資料的法源[2]。本次修法法案,調整電子化政府法第12a條的部分條文,並改稱標題為「聯邦開放資料授權命令」,課予聯邦政府之政府資料開放義務(但仍未賦權民眾依據本法要求開放特定之政府資料)。以下簡介新舊規範比較: (一)受規範主體範圍:所有聯邦機關 舊法限於「直接從屬於聯邦政府的行政機關」,不包含自治團體(如邦政府)、公立機構、公立法人、公立基金會、公立大學等[3]。 新法則擴大主體範圍,不限於「直接從屬於聯邦政府的行政機關」,而涵蓋所有「聯邦機關」(Die Behörden des Bundes)(第1條),包含公營造物、公法社團法人及公法財團法人等[4];這些新適用主體開放資料的緩衝期,為法規生效後12個月內應首次提供。不過,適用主體仍不包含自治團體(如邦政府)與公權力受託人[5]。 (二)受規範客體範圍 同舊法,本法所稱的資料,仍為「由聯邦機關為完成公共任務所蒐集,或由受委託之第三方代表聯邦機關所蒐集之資料」,且包含「研究資料」,並應符合以下5款條件: 1.以電子方式儲存、以集合形式結構化(尤其適用於列表和表格)。 2.存在於該機關之外的事實,但與該機關有關者 3.非由聯邦機關處理其他資料所產生的結果 4.調查後未經過處理者 但有以下情形時可以處理後再開放:(1)為糾正錯誤而處理;(2)基於法律或事實原因而處理,例如依個資法規定匿名)。 5.資料涉及個人時,匿名化且無法再識別個資者。 舊法中,以負面表述的方式,提及涉及個資保護事由時,不開放資料;新法則增加正面表述,資料雖涉及個人,但若已去識別化且無法再識別者,即可作為開放客體。 (三)開放原則及例外 與舊法相同,採取「預設開放原則」(Open by Default),即已經完成電子化,且不具例外理由時,聯邦機關即須開放這些資料。 例外則是符合以下情形者,聯邦機關不須提供資料: 1.資訊自由法規定不公開之政府資料 根據資訊自由法(Informationsfreiheitsgesetz,IFG)第3、4及6條(涉及特殊公共利益的資料、保護官方決策程序的資料、保護智慧財產權及營業秘密),不具取用權(Zugangsrecht,right of access)或僅具有限取用權的資料(與舊法相同)。 2.只有在第三方參與後,取用權才存在的資料(與舊法相同) 例如依據相關法規規定,須經過聽取第三方意見的程序(如聽證會),或須衡量第三人利益,才能提供資料的情形。[6] 3.資料由非受公權力委託之第三方建置,且非法律規定有傳輸義務者(與舊法相同) 4.已透過其他管道開放之研究資料(新法新增) 基於研究目的所蒐集之資料,且已透過開放取用(open access)的網路免費提供者,無須再提供;但仍可自願於國家詮釋資料入口網站(GovData)開放。 此為新法新增,不同於舊法,「基於研究目的所蒐集之資料」應開放提供,但法規特別規定如果已經基於其他原因已可開放取用者,即依照原先狀態繼續開放取用,機關無義務再透過其他管道提供[7]。 5.受銀行保密義務保護之資料(新法新增) 6.含有個人資料的資料集 特別從前款「資訊自由法規定不公開之政府資料」拉出,單獨成項(新增於電子化政府法第12a條第3a項)作為強調。 (四)資料提供方式 1.原則蒐集後立即提供,但研究資料可延後 新法新增為研究目的所蒐集之資料的提供時點彈性,研究資料若要提供,則應於研究計畫完成且研究目的完成後才能提供[8]。 2.以機器可讀格式提供 3.提供詮釋資料於「國家詮釋資料入口網站」(GovData) 4.免費、隨時、無須理由、不須註冊、透過公開使用網路提供資料檢索 5.可不受限制的再利用 (五)各部門設立協調員與中央辦公室聯繫 聯邦政府應設立中央辦公室,負責就聯邦機關提供資料作為開放資料時給予建議,並作為各邦負責開放資料辦公室的聯絡點。 聯邦各機關也應任命一名開放資料協調員,作為各部門與中央辦公室聯繫的聯絡人,並致力於識別、提供及再利用其所屬部門之開放資料。 (六)推行開放資料 與舊法相同,聯邦政府應每2年提出研究報告,向聯邦眾議院報告透過聯邦機關(不包含公營事業)開放資料的進展。 新法另增訂兩項事宜: 1.聯邦政府應評估開放資料法之適用主體擴展到自治團體、邦政府、受委託行使公權力的自然人與法人的可能性。 2.授權聯邦內政部與其他聯邦權責單位及聯邦政府專員達成協議,訂定法規命令規範開放資料之具體作法。 (七)公務員免責 聯邦機關沒有義務檢查所提供的資料的正確性、完整性、可信性。 (八)第12a條不能作為提供資料的請求權依據 電子化政府法於第12a條第1項後段明文該條不能作為提供資料的請求權依據,因此人民未被賦予得以請求政府開放資料之權利。[9] 二、公部門資料使用法 德國於2006年轉換2003年版的歐盟《公部門資訊再利用指令》(Directive 2003/98/EC,下稱PSI指令),制定《資訊再利用法》(Informationsweiterverwendungsgesetz,IWG),並隨著PSI指令於2013年的修正(Directive 2013/37/EU)而於2015年修正。本次再基於PSI指令於2019年修正為開放資料指令,《資訊再利用法》隨之全部修正,並更名為《公部門資料使用法》(Datennutzungsgesetz - DNG),以下簡介規範內容: (一)立法目的 《公部門資料使用法》的立法目的為「政府資訊再利用」、「改善公部門資料在商業目的之使用」,而統一政府資料的格式、授權、開放原則、收費原則及非歧視原則等內容。公部門資料使用法第1條第2項明文強調,本法未課予提供資料之義務或賦予近用資料之權利。 另外,本法係用以統一國內各相關法規之規範標準,使聯邦及各邦的資料,都能順利被用於商業及非商業利用[10]。 (二)適用主體 1.公部門機構 包含聯邦機關、地方自治團體(如邦政府),及公營造物、公法社團法人及公法財團法人等。 2.提供公共服務之公營事業 本次修法,納入提供公共服務(例如能源及交通)之公營事業,這些公共服務公營事業包含獨佔事業及處於競爭市場者。 3.提供研究資料的大學、研究機構及研究資助機構 (三)適用客體 1.一般政府資料 公部門機構與公共服務依法有義務提供之資料、依法有近用權之人可近用之資料。 2.高價值資料集 公部門機構與公共服務,若要提供歐盟開放資料指令之6種主題類別高價值資料集時,須透過適當之API、機器可讀、可批量下載的方式提供。 3.研究資料 研究資料係指,由公共資助的科學研究活動中所蒐集,或作為證據使用,或用以驗證研究成果的數位形式紀錄。且已透過大學、研究機構、研究資助機構、所屬研究人員或計畫資料庫開放取用(open access)。 若研究資料與合法商業利益、知識轉移活動或第三方智慧財產權等原因相衝突,則不適用本法方式提供。 4.不適用客體 與個資保護相衝突的資料、與商業秘密相衝突的資料、國家安全及公共安全資料、關鍵基礎設施保密資訊、保密統計資料、涉及第三人智慧財產權資料、不屬公部門機關公務範圍之資料、標誌及徽章、公共節目及廣播、文化機構資料、中學以下教育機構資料、中學以上教育機構非研究資料。 (四)提供格式 1.提供既有之可利用格式資料 聯邦機關或公營事業,只須提供既有的、已電子化、機器可讀、FAIR資料原則(可近用、可搜尋、可再利用、可互通格式)、符合開放標準(確保可互通)的資料。 2.詮釋資料 機器可讀的詮釋資料,應透過國家詮釋資料入口網站(GovData)提供。 3.動態資料 如果資料具有波動性或時效性的特性,而須頻繁或即時更新時,則聯邦機關或公營事業應透過API及批量下載方式,在資料蒐集後立即提供。 (五)授權提供 原則上不一定要以授權方式提供資料,但一般公立圖書館、大學圖書館、博物館及檔案館中具有智慧財產權的資料,以及提供公共服務的公營事業的資料,皆應以授權方式提供。使用授權條款時,應盡可能使用開放授權,或不做非必要的使用限制。 (六)資料原則 1.「概念上與標準化之開放」原則 應盡可能依據「概念上與標準化之開放」原則(der Grundsatz „konzeptionell und standardmäßig offen“)建置本法規範範圍的資料。立法理由稱,依此原則,本法適用之資料應盡可能以「預設開放」方式提供[11]。 2.收費原則 一般聯邦機關,應免費提供資料,但允許因以下原因收取邊際成本補償費用,且收費標準應透明公開:a.資料複製、提供及傳輸;b.個資匿名化措施;c.營業秘密保護措施。 例外可收取費用的機關則有以下3類,且收費標準亦應透明公開:a.須自籌財源履行公務委託之機關;b.一般公立圖書館、大學圖書館、博物館及檔案館;c.提供公共服務的公營事業。 所有聯邦機關及提供公共服務的公營事業,提供高價值資料與研究資料時,應免費且不得收取邊際成本補償費。但一般公立圖書館、大學圖書館、博物館及檔案館提供高價值資料與研究資料時,可收取費用。 3.非歧視原則及禁止排他原則(不得與他人訂定專屬授權) 參、法律適用關係 (一)電子化政府法之法律適用通則規定 電子化政府法第12a條與其他相關法規涉及「資料」規定之間的關係,須依據電子化政府法第1條第4項法律適用通則規定處理,該條項規定「當有相同內容的規定或相衝突的規定存在時,不適用本法」,因此在電子化政府法第12a條與其他相關法規的適用優先順序上,僅在沒有聯邦法律對於「資料提供」有相同或相矛盾的規定情況下,才能適用電子化政府法第12a條,反之,當有任何其他法規涉及「資料提供」時,電子化政府法第12a條就退居於次位,以使其他法規的立法目的仍可實現,也能避免與國際標準或歐盟法規的要求重複、矛盾或衝突[12]。 (二)電子化政府法第12a條與公部門資料使用法之適用關係 雖然公部門資料使用法未課予提供資料之義務或賦予近用資料之權利,但由於仍規範資料之標準及格式,使政府資料能再利用,所以仍被認為涉及「資料提供」,而有法律適用優先順序問題。 因此,電子化政府法第12a條開放資料法的適用主體及客體,基本上適用公部門資料使用法的相關規定,包含政府資料的格式、授權、開放原則、收費原則及非歧視原則等內容。例如:圖書館所藏資料,若涉及高價值資料的提供時,圖書館可收取費用。 肆、評析 德國聯邦政府透過於電子化政府法制定開放資料法相關規範,除了促使聯邦政府機關將政府資料全部改以電子化、機器可讀方式建置以外,也促使政府資料以「預設開放」為原則建置,使政府資料能更被加值活化再利用。 而2021年的修正,更將「基於執行政府出資研究計畫目的所蒐集之資料」,以及「公營造物、公法社團法人及公法財團法人等主體所建置的政府資料」納入開放客體,擴大開放政府資料的範圍。 保護機敏資料部分,除了原先規範得不開放具第三方智慧財產權之資料,以及具國家安全、特殊公共利益等資料以外,新修正法案也加強規定個資保護(含有個人資料之資料集不開放,僅開放已匿名化資料),以及增列「受銀行保密義務保護之資料」為不須開放資料。 另外新修正的法案,也加上許多推行開放資料的措施,包含「聯邦各部門應任命一名開放資料協調員」、「開始評估政府開放資料義務要求,擴展到邦政府及受委託行使公權力的可能性」,以及「授權政府開放資料主管機關聯邦內政部,訂定法規命令規範開放資料之具體作法」等。 綜上,德國透過開放政府資料專法及公部門資料使用法,建立開放資料的格式標準及開放原則,帶頭推動國內的資料開放環境,以促進資料的進一步活化再利用。 [1]Council Directive 2019/1024, art. 17, 2019 O.J. (L 172) 56, 77. [2]立法理由A、IV、第1段:「聯邦行政對提供資料開放之監管,就其性質而言,屬於聯邦之獨立事務,因此僅能由聯邦政府本身監管。」Deutscher Bundestag, BT-Drucksache 19/27442 (Gesetzentwurf der Bundesregierung), S. 19, https://dserver.bundestag.de/btd/19/274/1927442.pdf (last visited Mar. 21, 2023). [3]Wiss. Mit. Heiko Richter, „Open Government Data“ für Daten des Bundes - Die Open-Data-Regelung der §§ 12 a, 19 E-Government-Gesetz, NVwZ, 2017(19), 1408, 1409 (2017). [4]立法理由A、II、第1段。Deutscher Bundestag (Fn. 2), S. 17. https://dserver.bundestag.de/btd/19/274/1927442.pdf (last visited Mar. 21, 2023). [5]Deutscher Bundestag (Fn. 2), S. 2. [6]Von Dr. Ralf Schnieders, Die neue Open-(Government)-Data-Gesetzgebung in Frankreich und in Deutschland, Die Öffentliche Verwaltung, 2018(5), 175, 183 (2018); Deutscher Bundestag, Drucksache 18/11614 (Gesetzentwurf der Bundesregierung), S. 20, http://dipbt.bundestag.de/dip21/btd/18/116/1811614.pdf (last visited Mar. 21, 2023) [7]Deutscher Bundestag (Fn. 2), S. 30. [8]Deutscher Bundestag (Fn. 2), S. 30-31. [9]Wiss. Mit. Heiko Richter (Fn.3), S. 1412. [10]Deutscher Bundestag (Fn. 2), S. 18. [11]Deutscher Bundestag (Fn. 2), S. 33. [12]Deutscher Bundestag, Drucksache 18/11614 (Gesetzentwurf der Bundesregierung), S. 17, http://dipbt.bundestag.de/dip21/btd/18/116/1811614.pdf (last visited Mar. 21, 2023); Wiss. Mit. Heiko Richter (Fn.3), S. 1412.

歐洲資料保護監督官12月7日發表正式意見,針對歐盟執委會就AFSJ大型資訊技術系統設立作業管理機構之立法計畫,提出隱私保護法律要求

  歐洲資料保護監督官(European Data Protection Supervisor, EDPS)於2009年12月7日,針對歐盟執委會(European Commission)近年所提出關於設立歐盟「自由、安全及司法領域」(area of freedom, security and justice, AFSJ)大型資訊技術系統(IT System)作業管理機構之立法計畫,基於個人資料保護之立場提出正式法律意見。如此一立法計畫順利通過,該機構預計將擔負起包括「申根資訊系統」(Schengen Information System, SIS II)、「簽證資訊系統」(Visa Information System, VIS)、「歐洲指紋系統」(European Dactylographic System, Eurodac)及其他歐盟層級之大規模資訊技術系統之作業管理(operational management)任務。   根據EDPS首長Peter Hustinx表示,由於前述各項系統之資料庫中均包含諸如護照內容、簽證及指紋等大量敏感個人資料,因此儘管設立單一之作業管理機構,可以在相當程度上釐清歐盟各部門職責歸屬及準據法適用之問題,但如此一機構欲取得合法性,其活動範圍及相關責任即必須在立法中獲得明確界定,否則即可能產生個人資料濫用(misuse of personal data)及資料庫「功能潛變」(function creep)之風險。而基於此一分析,Hustinx認為目前執委會之機構立法計畫尚未符合個人資料保護要求。   此外,針對後續立法進程,EDPS建議除應確實釐清該管理機構之活動範圍是否包括整體AFSJ,亦或僅限於邊境檢查及難民與移民事務;執委會與該機構之關聯性與責任等重要問題外,是否可在缺乏相關經驗及實證評估下,即直接將所有歐盟層級之大型資訊技術系統與資料庫歸入該機構管轄,顯然亦有商榷餘地。EDPS就此認為,透過立法界定「大型資訊系統」之範圍,並且採取資料庫分次進入該管理機構責任範圍之方式,應係日後執委會可以努力之方向。

通用人工智慧的透明揭露標準--歐盟通用人工智慧模型實踐準則「透明度 (Transparency)」章

通用人工智慧的透明揭露標準--歐盟通用人工智慧模型實踐準則「透明度 (Transparency)」章 資訊工業策進會科技法律研究所 2025年08月06日 歐盟人工智慧辦公室(The European AI Office,以下簡稱AIO) 於2025年7月10日提出《人工智慧法案》(AI Act, 以下簡稱AIA法案)關於通用型人工智慧實作的準則[1] (Code of Practice for General-Purpose AI Models,以下簡稱「GPAI實踐準則」),並於其中「透明度 (Transparency)」章節[2],針對歐盟AIA法案第53條第1項(a)、(b)款要求GPAI模型的提供者必須準備並提供給下游的系統整合者 (integrator) 或部署者 (deployer) 足夠的資訊的義務,提出模型文件(Model Documentation)標準與格式,協助GPAI模型提供者制定並更新。 壹、事件摘要 歐盟為確保GPAI模型提供者遵循其AI法案下的義務,並使AIO能夠評估選擇依賴本守則以展現其AI法案義務合規性的通用人工智慧模型提供者之合規情況,提出GPAI實踐準則。當GPAI模型提供者有意將其模型整合至其AI系統的提供者(以下稱「下游提供者」)及應向AIO提供相關資訊,其應依透明度章節要求措施(詳下述)提出符合內容、項目要求的模型文件,並予公開揭露且確保已記錄資訊的品質、安全性及完整性 (integrity)。 由於GPAI模型提供者在AI價值鏈 (AI value chain) 中具有特殊角色和責任,其所提供的模型可能構成一系列下游AI系統的基礎,這些系統通常由需要充分了解模型及其能力的下游提供者提供,以便將此類模型整合至其產品中並履行其AIA法案下的義務。而相關資訊的提供目的,同時也在於讓AIO及國家主管機關履行其AI法案職責,特別是高風險AI的評估。 AIO指出完整填寫與定期更新模型文件,是履行AIA法案第53條義務的關鍵步驟。GPAI模型提供者應建立適當的內部程序,確保資訊的準確性、時效性及安全性。模型文件所含資訊的相關變更,包括同一模型的更新版本,同時保留模型文件的先前版本,期間至模型投放市場後10年結束。 貳、重點說明 一、制定並更新模型文件(措施1.1) 透明度 (Transparency)章節提供模型文件的標準表格,做為GPAI實踐準則透明度章節的核心工具,協助GPAI模型提供者有系統性的整理並提供AIA法案所要求的各項資訊。表格設計考量了不同利害關係人的資訊需求,確保在保護商業機密的同時,滿足監管透明度的要求。 前揭記錄資訊依其應提供對象不同,各欄位已有標示區分該欄資訊係用於AI辦公室 (AIO)、國家主管機關 (NCAs) 或下游提供者 (DPs)者。適用於下游提供者的資訊,GPAI模型提供者應主動提供(公開揭露),其他則於被請求時始須提供(予AIO或NCAs)。 除基本的文件最後更新日期與版本資訊外,應提供的資訊分為八大項,內容應包括: (一)、一般資訊General information 1.模型提供者法律名稱(Legal name) 2.模型名稱(Model name):模型的唯一識別碼(例如 Llama 3.1-405B),包括模型集合的識別碼(如適用),以及模型文件涵蓋之相關模型公開版本的名稱清單。 3.模型真實性(Model authenticity):提供明確的資訊例如安全雜湊或URL端點,來幫助使用者確認這個模型的來源 (Provenance)、是否真實性未被更動 (Authenticity)。 4.首次發布日(Release date)與首次投放歐盟市場的日期(Union market release date)。 5.模型依賴(Model dependencies):若模型是對一個或多個先前投放市場的GPAI模型進行修改或微調的結果,須列出該等模型的名稱(及相關版本,如有多個版本投放市場)。 (二)、模型屬性(Model properties) 1.Model architecture 模型架構:模型架構的一般描述,例如轉換器架構 (transformer architecture)。 2.Design specifications of the model 模型設計規格:模型主要設計規格的一般描述,包括理由及所作假設。 3.輸出/入的模式與其最大值(maximum size):說明係文字、影像、音訊或視訊模式與其最大的輸出/入的大小。 4.模型總參數量(model size)與其範圍(Parameter range):提供模模型參數總數,記錄至少兩個有效數字,例如 7.3*10^10 參數,並勾選參數(大小)所在範圍的選項,例如:☐>1T。 (三)、發佈途徑與授權方式(Methods of distribution and licenses) 1.發佈途徑Distribution channels:列舉在歐盟市場上使用模型的採用法,包括API、軟體套裝或開源倉庫。 2.授權條款License:附上授權條款鏈結或在要求時提供副本;說明授權類型如: 開放授權、限制性授權、專有授權;列出尚有提供哪些相關資源(如訓練資料、程式碼)與其存取方式、使用授權。 (四)、模型的使用(Use) 1.可接受的使用政策Acceptable Use Policy:附上可接受使用政策連結或副本或註明無政策。 2.預期用途或限制用途Intended uses:例如生產力提升、翻譯、創意內容生成、資料分析、資料視覺化、程式設計協助、排程、客戶支援、各種自然語言任務等或限制及/或禁止的用途。 3.可整合AI系統之類型Type and nature of AI systems:例如可能包括自主系統、對話助理、決策支援系統、創意AI系統、預測系統、網路安全、監控或人機協作。 4.模型整合技術方式Technical means for integration:例如使用說明、基礎設施、工具)的一般描述。 5.所需軟硬體資源Required hardware與software:使用模型所需任何軟硬體(包括版本)的描述,若不適用則填入「NA」。 (五)、訓練過程(Training process) 1.訓練過程設計規格(Design specifications of the training process):訓練過程所涉主要步驟或階段的一般描述,包括訓練方法論及技術、主要設計選擇、所作假設及模型設計最佳化目標,以及不同參數的相關性(如適用)。例如:「模型在人類偏好資料集上進行10個輪次的後訓練,以使模型與人類價值觀一致,並使其在回應使用者提示時更有用」。 2.設計決策理由(Decision rationale):如何及為何在模型訓練中做出關鍵設計選擇的描述。 (六)、用於訓練、測試及驗證的資料資訊(Information on the data used for training, testing, and validation) 1.資料類型樣態Data type/modality:勾選樣態包括文字、影像、音訊、視訊或說明有其他模態。 2.資料來源Data provenance:勾選來源包括網路爬蟲、從第三方取得的私人非公開資料集、使用者資料、公開資料集、透過其他方式收集的資料、非公開合成(Synthetic )資料等。 3.資料取得與選取方式(How data was obtained):取得及選擇訓練、測試及驗證資料使用方法的描述,包括用於註釋資料的方法及資源,以及用於生成合成資料的模型及方法。從第三方取得的資料,如果權利取得方式未在訓練資料公開摘要中披露,應描述該方式。 4.資料點數量Number of data points:說明訓練、測試及驗證資料的大小(資料點數量),連同資料點單位的定義(例如代幣或文件、影像、視訊小時或幀)。 5.資料範疇與特性(Scope and characteristics):指訓練、測試及驗證資料範圍及主要特徵的一般描述,如領域(例如醫療保健、科學、法律等)、地理(例如全球、限於特定區域等)、語言、模式涵蓋範圍。 6.資料清理處理方法(Data curation methodologies):指將獲取的資料轉換為模型訓練、測試及驗證資料所涉及的資料處理一般描述,如清理(例如過濾不相關內容如廣告)、資料擴增。 7.不當資料檢測措施(Measures for unsuitability):在資料獲取或處理中實施的任何方法描述(如有),以偵測考慮模型預期用途的不適當資料源,包括但不限於非法內容、兒童性虐待材料 (CSAM)、非同意親密影像 (NCII),以及導致非法處理的個人資料。 8.可識別偏誤檢測措施(Measures to detect identifiable biases):描述所採取的偵測與矯正訓練資料存在偏誤的方法。 (七)、訓練期間的計算資源(Computational resources (during training)) 1.訓練時間(Training time):所測量期間及其時間的描述。 2.訓練使用的計算量(Amount of computation used for training):說明訓練使用的測量或估計計算量,以運算表示並記錄至其數量級(例如 10^24 浮點運算)。 3.測量方法論(Measurement methodology):描述用於測量或估計訓練使用計算量的方法。 (八)、訓練及推論的能源消耗(Energy consumption (during training and inference)) 1.訓練耗能(Amount of energy used for training)及其計量方法:說明訓練使用的測量或估計能源量,以百萬瓦時表示(例如 1.0x10^2 百萬瓦時)。若模型能源消耗未知,可基於所使用計算資源的資訊估計能源消耗。若因缺乏計算或硬體提供者的關鍵資訊而無法估計訓練使用能源量,提供者應披露所缺乏的資訊類型。 2.推論運算耗能的計算基準 (Benchmarked amount of computation used for inference1)及其方法:以浮點運算表示方式(例如 5.1x10^17 浮點運算)說明推論運算的基準計算量,並提供計算任務描述(例如生成100000個代幣Token)及用於測量或估計的硬體(例如 64個Nvidia A100)。 二、提供GPAI模型相關資訊(措施1.2) 通用人工智慧模型投放市場時,應透過其網站或若無網站則透過其他適當方式,公開揭露聯絡資訊,供AIO及下游提供者請求取得模型文件中所含的相關資訊或其他必要資訊,以其最新形式提供所請求的資訊。 於下游提供者請求時,GPAI模型提供者應向下游提供者提供最新模型文件中適用於下游提供者的資訊,在不影響智慧財產權及機密商業的前提下,對使其充分了解GPAI模型的能力及限制,並使該等下游提供者能夠遵循其AIA法案義務。資訊應在合理時間內提供,除特殊情況外不得超過收到請求後14日。且該資訊的部分內容可能也需要以摘要形式,作為GPAI模型提供者根據AIA法案第53條第1項(d)款必須公開提供的訓練內容摘要 (training content summary) 的一部分。 三、確保資訊品質、完整性及安全性(措施1.3) GPAI模型提供者應確保資訊的品質及完整性獲得控制,並保留控制證據以供證明遵循AIA法案,且防止證據被非預期的變更 (unintended alterations)。在制定、更新及控制資訊及記錄的品質與安全性時,宜遵循既定協議 (established protocols) 及技術標準 (technical standards)。 參、事件評析 一、所要求之資訊完整、格式標準清楚 歐盟AGPAI實踐準則」的「透明度 (Transparency)」提供模型文件的標準表格,做為GPAI實踐準則透明度章節的核心工具,從名稱、屬性、功能等最基本的模型資料,到所需軟硬體、使用政策、散佈管道、訓練資料來源、演算法設計,甚至運算與能源消秏等,構面完整且均有欄位說明,而且部分欄位直接提供選項供勾選,對於GPAI模型提供者提供了簡明容易的AIA法案資訊要求合規做法。 二、表格設計考量不同利害關係人的資訊需求 GPAI實踐準則透明度章節雖然主要目的是為GPAI模型提供者對由需要充分了解模型及其能力的下游提供者提供資訊,以便其在產品履行AIA法案下的義務。但相關資訊的提供目的,同時也在於讓AIO及國家主管機關履行其AI法案職責,特別是高風險AI的評估。因此,表格的資訊標示區分該欄資訊係用於AI辦公室 (AIO)、國家主管機關 (NCAs) 或下游提供者 (DPs)者,例如模型的訓練、資料清理處理方法、不當內容的檢測、測試及驗證的資料來源、訓練與運算的能秏、就多屬AIO、NCAs有要求時始須提供的資料,無須主動公開也兼顧及GPAI模型提供者的商業機密保護。 三、配套要求公開並確保資訊品質 該準則除要求GPAI模型提供者應記錄模型文件,並要求於網站等適當地,公開提供下游提供者請求的最新的資訊。而且應在不影響智慧財產權及機密商業的前提下,提供其他對使其充分了解GPAI模型的能力及限制的資訊。同時,為確保資訊的品質及完整性獲得控制,該準則亦明示不僅應落實且應保留證據,以防止資訊被非預期的變更。 四、以透明機制落實我國AI基本法草案的原則 我國日前已由國科會公告人工智慧基本草案,草案揭示「隱私保護與資料治理」、「妥善保護個人資料隱私」、「資安與安全 」、「透明與可解釋 」、「公平與不歧視」、「問責」原則。GPAI實踐準則透明度章節,已提供一個重要的啟示—透過AI風險評測機制,即可推動GPAI模型資訊的揭露,對相關資訊包括訓練資料來源、不當內容防止採取做一定程度的揭露要求。 透過相關資訊揭露的要求,即可一定程度促使AI開發提供者評估認知風險,同時採取降低訓練資料、生成結果侵權或不正確的措施。即便在各領域作用法尚未能建立落實配套要求,透過通過評測的正面效益,運用AI風險評測機制的資訊提供要求,前揭草案揭示的隱私、著作、安全、問責等原則,將可以立即可獲得一定程度的實質落實,緩解各界對於AI侵權、安全性的疑慮。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw) [1]The European AI Office, The General-Purpose AI Code of Practice, https://digital-strategy.ec.europa.eu/en/policies/contents-code-gpai 。(最後閱覽日:2025/07/30) [2]The European AI Office, Code of Practice for General-Purpose AI Models–Transparency Chapter, https://ec.europa.eu/newsroom/dae/redirection/document/118120 。(最後閱覽日:2025/07/30)

TOP