日本公布資料管理框架,促進資料加值應用

  日本經濟產業省2022年4月8日公布「協調性資料加值運用之資料管理框架-透過確保資料可信度創造資料價值之新路徑」(協調的なデータ利活用に向けたデータマネジメント・フレームワーク~データによる価値創造の信頼性確保に向けた新たなアプローチ),提示確保資料可信度之方法。經濟產業省於2019年7月31日設立「第3層︰網路空間信賴性確保之安全對策檢討工作小組」(『第3層:サイバー空間におけるつながり』の信頼性確保に向けたセキュリティ対策検討タスクフォース」,以下簡稱工作小組),討論確保資料可信度之要件,以利資料在網路空間內自由流通,並藉由資料創造出新的附加價值。

  工作小組為確保資料可信度,首先定義資料管理為「將資料屬性依據其所涉之法令或組織規章,以及因蒐集、處理、利用、移轉等活動而改變之過程,視為一個生命週期加以管理」,並認為資料管理會受到屬性(資料性質,如內容、揭露範圍、利用目的、資料管理主體、資料權利者等)、場域(針對資料之特定規範,如各國、地區法令、組織內部規定、組織間契約等)及事件(產生、改變及維持資料屬性之事件,如生產、蒐集、處理、移轉、提供、儲存、刪除)等三大要素影響,並據此建立資料管理模型。

  工作小組期待藉由上述三大要素,依序透過讓資料處理流程(事件)處於容易被觀察的狀態、整理所涉及之相關規範(場域),以及判斷資料屬性等步驟,讓利害關係人之間可更容易進行資料共享及資料治理。

本文為「經濟部產業技術司科技專案成果」

相關連結
你可能會想參加
※ 日本公布資料管理框架,促進資料加值應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8821&no=64&tp=1 (最後瀏覽日:2026/04/30)
引註此篇文章
科法觀點
你可能還會想看
美國政府部門共同推動多項鼓勵住宅節能優惠措施

  美國能源部於去年 (2012) 12月21日宣布將投入九百萬美元挹注數項住屋節能科技。除此之外,美國國會亦於今年元旦通過美國納稅人緩稅法案 (American Taxpayer Relief Act of 2012),而其中第四章能源稅延展的第408款將2005年能源政策法案 (Energy Policy Act of 2005) 第1332條所創設的能源效率新屋抵免 (Credit for Energy-efficient New Homes),展期到2013年年底。   據美國能源部長朱隸文 (Steven Chu) 表示,該國家庭平均每戶每年花費近兩千美元於能源相關開銷,而其中有大部分皆因諸如住屋的屋頂、閣樓或牆壁間的空氣洩漏而流失浪費。相關研究並顯示,百分之四十二的能源都喪失於建築外殼(building envelope),包括門、屋頂、閣樓、牆、地板和地基之中。該部於是決定投資建築圍護科技 (building envelope technology)的改進,包涵有高效能的窗戶、屋頂及冷暖器設備。   另方面,國會所通過的美國納稅人緩稅法案展延了包括能源效率新屋抵免(Credit for Energy-efficient New Homes)等十二項能源相關抵免或獎勵措施。其中第408條的展延將使美國國民得其於就其符合能源之星(Energy Start)認證標準之隔熱保溫工程、外部窗戶及門等2005年後所產生裝修支出 (含勞務承攬) 的百分之十,申報最高五百美元的賦稅減免。   2005 能源政策法法案所創設的能源效率新屋賦稅減免原定於2007年終止,之後由2006年的稅收抵免與醫療保健法案 (Tax Relief and Health Care Act of 2006) 延長至2008,再由08年的能源改進與延長法案 (The Energy Improvement and Extension Act of 2008) 展延至2009。其後,10年的減稅、失業保險再授權及工作機會增進法 (The Tax Relief, Unemployment Insurance Reauthorization, and Job Creation Act of 2010) 將其延伸至2011年年底,而目前通過美國納稅人緩稅法案再將其延至2013年12月31日。

美國參議院提出促進生技學名藥競爭法案

  生技藥品是植基於活體生物的原理所開發出來的治療藥品,自第一批生技藥品上市以來,其專利在最近幾年已陸續到期,因此生技業者對於推出這些生物製品的學名藥版本(generic versions of biologics,以下簡稱生技學名藥),躍躍欲試。然而,美國當前的學名藥法規—藥品價格競爭及專利回復法(Drug Price Competition and Patent Restoration Act, 又名Hatch-Waxman Act, HWA),乃是針對化學藥品的學名藥版本所制定的法規,此類學名藥與生技學名藥並不相同,因此既有的學名藥法規並不能適用於生技學名藥,生技業者無不引頸企盼政府部門通過新的法規,以使生技學名藥儘速上市。   美國參議院最近提出一項生技學名藥法案—生技製品價格競爭與創新法(Biologics Price Competition and Innovation Act, BPCIA),一如HWA,BPCIA的內容也呈現出各種利益折衝的色彩,法案一方面賦予FDA對生技學名藥進行審核的新權限,並藉由減少臨床試驗之進行,加速生技學名藥的上市;另一方面,為避免低價的生技學名藥會對品牌藥的銷售產生衝擊,法案也有針對生技研發公司的研發誘因設計,以鼓勵其持續投入資金,開發更多的生技治療藥品。未來生技學名藥廠需要配合FDA所規劃的風險管理計劃(該計劃的相關立法目前尚待眾議院審議),故生技學名藥廠於其生技學名藥上市後,仍有進行臨床試驗之義務。   法案中最具爭議的條文在於,究竟應給予生技研發公司多長的銷售獨家銷售權(market exclusivity),始得允許生技學名藥廠加入市場競爭,生技研發公司與生技學名藥廠對此的歧見甚大,前者主張十四年,後者則認為五年的時間已足,目前法案訂為十二年。另一個不易處理的議題,則是藥師如何處理此類的生技學名藥,根據目前的法案內容,未來藥師亦可不經徵詢醫師而以生技學名藥代替之。

自動駕駛車輛之分級與責任

  所謂自動駕駛(autopilot),原來是指一個用來控制載具軌道而無需人工一直干預的系統,亦即無須人類持續干預,但人類仍須於關鍵時刻介入進行決定或作為,此時機器僅作為輔助。   而自動駕駛汽車或稱全自動駕駛,則只完全無須人類干預,由機器自動感應偵測,自動做成決策控制車輛行駛。故由人類的介入程度區別究竟是駕駛輔助或自動駕駛。美國國家公路交通安全管理局(NHTSA)於2016年已提出正式的分類系統,除手動駕駛(0級)外,區分弱駕駛輔助(1級)、部分自動駕駛(2級)、有條件全自動(3級)、高度/完全自動化(4級)不同程度的自動駕駛。其他國家如德國,在聯邦政府的「自動駕駛圓桌會議」也對自動駕駛有類似的四等級區分。   德國聯邦政府也在於2017年1月25日提出規範自動駕駛之法律草案,亦即道路交通法修正法(Änderung des Straßenverkehrsgesetzes),核心在於賦予電腦與人類駕駛者法律上同等地位。亦即,駕駛人的定義未來擴張延伸到「使用不同程度自動駕駛系統者」。根據草案將來在車輛行駛中,人類可以在特定時間與特定狀況下接管整個行駛。而最重要的修正:人類始終應該負使用電腦的最終責任。   故在行駛中駕駛人將會被輔助機器替代,更要求自駕系統應該具備“隨時可以由駕駛人接手操控或停俥”的功能。 分類中,駕駛人的角色只有到全自動駕駛實現時才退場,屆時才會發生無駕駛人只有乘客的狀況。   修法也重視自駕技術失敗並導致事故所生責任分擔的問題。對於責任的調查將採用如同飛航安全中之「黑盒子」的方式,該裝置會記錄行駛中的所有基本資料。這將有助於發生事故後澄清,查明究竟是技術上原因、製造商或駕駛員的過失,以確保駕駛人無法將責任全部推給自動化系統的故障。

美國聯邦法官裁決AI「訓練」行為可主張合理使用

美國聯邦法官裁決AI「訓練」行為可主張合理使用 資訊工業策進會科技法律研究所 2025年07月07日 確立我國資料創新利用的法制基礎,建構資料開放、共享和再利用的各項機制,滿足民間及政府取得高品質、可信任且易於利用資料的需求,以資料提升我國數位發展的價值,並強化民眾權利的保障,我國於2025年6月16日預告「促進資料創新利用發展條例」,擬推動資料基礎建設,促進更多資料的釋出。 AI發展領先國際的美國,近日首次有聯邦法院對AI訓練資料表達肯定合理使用看法,引發各界關注[1]。我國已開始著力於AI發展所需的資料流通與有效利用,該判決將有助於啟示我國個人資料、著作資料合法使用之法制因應研析。 壹、事件摘要 2025年6月23日美國加州北區聯邦地方法院(United States District Court for the Northern District of California),威廉·阿爾斯法官(Judge William Alsup)針對Andrea Bartz、Charles Graeber、Kirk Wallace Johnson這三位美國作家,對Anthropic公司訓練大型語言模型(Large Language Model, LLM)時使用受其等著作權保護書籍一案,作出指標性的簡易裁決(summary judgment)[2]。 此案被告掃描所購買的實體書籍,以及從盜版網站複製取得的受著作權保護的書籍,儲存在其數位化、可搜尋的檔案中,用來訓練其正在開發的各種大型語言模型。原告主張被當開發Claude AI模型,未經授權使用大量書籍作為訓練資料的行為,為「大規模未經授權利用」。法院則以四要素分析架構,支持合理使用抗辯(Fair Use Defense),強調AI訓練屬於技術發展過程中不可或缺的資料利用,AI公司於模型訓練階段使用著作權書籍,屬於「合理使用」(Fair Use),且具「高度轉化性」(Highly Transformative),包括將購買的實體圖書數位化,但不包括使用盜版,也不及於建立一個永久性的、通用目的的「圖書館(library)」(指訓練資料集)。 貳、重點說明 依美國著作權法第107條(17 U.S.C. § 107)規定,合理使用需綜合考量四要素,法官於本案中認為: 一、使用的目的與性質—形成能力具高度轉化性 AI模型訓練的本質在於學習語言結構、語意邏輯,而非單純複製或重現原著作。AI訓練過程將大量內容作為輸入,經由演算法解析、抽象化、向量化,最終形成轉個彎創造出不同的東西 (turn a hard corner and create something different) 的能力,屬於一種「學習」與「再創造」過程。AI訓練的目的並非為了重現原著作內容,而是為了讓模型具備生成新內容的能力。這種「轉化性」(transformative use)極高,與單純複製或替代原著作的行為有明顯區隔[3]。 另外訓練過程對資料做格式變更本身並未增加新的副本,簡化儲存並實現可搜尋性 (eased storage and enabled searchability),非為侵犯著作權人合法權益目的而進行,亦具有轉化性 (transformative)。原告就所購買的紙本圖書,有權按其認為合適的方式「處置 (dispose)」,將這些副本保存在其資料集中,用於所有一般用途[4]。 二、受保護作品的性質--高度創作性非關鍵因素 法院認同原告所主張的書籍是具有高度創意(creative)的作品理應享有較強的保護。但法院亦認為合理使用的四個要素,須為整體衡量,儘管作品本身具有較高的創意性,但由於使用行為的高度轉化性以及未向公眾直接重製原作表達,整體而言,法院認定用於訓練 LLM 的行為構成合理使用[5]。 三、使用的數量與實質性--巨大數量係轉化所必要 法院認為AI模型訓練需大量內容資料,甚至必須「全書」輸入,看似「大量使用」,但這正是AI技術本質所需。AI訓練是將內容進行抽象化、數據化處理,最終在生成新內容時,並不會原封不動重現原作。所以,雖然訓練過程涉及全部作品,但AI模型的輸出並不會重現原作的具體表達,這與單純複製、重製作品的行為有本質區別[6]。 四、對潛在市場或價值的影響 本案法院明確指出,人工智慧模型(特別是原告的Claude服務)的輸出內容,通常為全新生成內容,並非原作的精確重現或實質模仿冒,而且Claude服務在大型語言模型(LLM)與用戶之間加入額外功能,以確保沒有侵權輸出提供予用戶。因此,此類生成內容不構成對原作的替代,不會削弱原作的銷售市場,也不會造成市場混淆,而且著作權法保護的是原創而非保護作者免於競爭[7]。 不過即便法院支持被告的合理使用主張,肯定AI訓練與著作權法「鼓勵創作、促進知識流通」的立法目的相符。但仍然指出提供AI訓練的合理使用(Fair Use)不代表資料來源的適法性(Legality of Source)獲得合法認定。沒有任何判決支持或要求,盜版一本本來可以在書店購買的書籍對於撰寫書評、研究書中的事實或創建大型語言模型 (LLM) 是合理必要 (reasonably necessary) 的。此類對原本可(合法)取得的圖書進行盜版的行為,即使用於轉化性使用並立即丟棄,「本質上」、「無可救藥地」(inherently、irredeemably)構成侵害[8]。 參、事件評析 一、可能影響我國未來司法判決與行政函釋 我國於現行著作權法第65條規定下,須於個案交予我國法院認定合理使用主張是否能成立。本案判決為美國首個AI訓練行為可主張合理使用的法院見解,對於我國法院未來就對AI訓練資料取得的合法使用看法,顯見將會產生關鍵性影響。而且,先前美國著作權局之報告認為AI訓練過程中,使用受著作權保護作品可能具有轉化性,但利用結果(訓練出生成式AI)亦有可能影響市場競爭,對合理使用之認定較為嚴格,而此裁定並未採取相同的見解。 二、搜取網路供AI訓練資料的合理使用看法仍有疑慮 依據本會科法所創智中心對於美國著作權法制的觀察,目前美國各地法院中有多件相關案件正在進行審理,而且美國著作權局的合理使用立場較偏向有利於著作權利人[9]。相同的是,均不認同自盜版網站取得的資料可以主張合理使用。然而AI訓練所需資料,除來自於既有資料庫,亦多來自網路搜取,如其亦不在可主張範圍,那麼AI訓練的另一重要資料來源可能會受影響,後續仍須持續觀察其他案件判決結果。 三、有效率的資料授權利用機制仍是關鍵 前揭美國著作權局報告認為授權制度能同時促進產業發展並保護著作權,產業界正透過自願性授權解決作品訓練之方法,雖該制度於AI訓練上亦尚未為一完善制度。該裁決也指出,可合理使用資料於訓練AI,並不代表盜版取得訓練資料可以主張合理使用。這對於AI開發而言,仍是須要面對的議題。我國若要發展主權AI, 推動分散串接資料庫、建立權利人誘因機制,簡化資料查找與授權流程,讓AI訓練資料取得更具效率與合法性,才能根本打造台灣主權AI發展的永續基礎。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw) [1]相關新聞、評論資訊,可參見:Bloomberg Law, "Anthropic’s AI Book-Training Deemed Fair Use by US Judge", https://news.bloomberglaw.com/ip-law/ai-training-is-fair-use-judge-rules-in-anthropic-copyright-suit-38;Anthropic wins a major fair use victory for AI — but it’s still in trouble for stealing books, https://www.theverge.com/news/692015/anthropic-wins-a-major-fair-use-victory-for-ai-but-its-still-in-trouble-for-stealing-books;Anthropic Scores a Landmark AI Copyright Win—but Will Face Trial Over Piracy Claims, https://www.wired.com/story/anthropic-ai-copyright-fair-use-piracy-ruling/;Anthropic Wins Fair Use Ruling In Authors' AI Copyright Suit, https://www.thehindu.com/sci-tech/technology/anthropic-wins-key-ruling-on-ai-in-authors-copyright-lawsuit/article69734375.ece., (最後閱覽日:2025/06/25) [2]Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417-WHA, Doc. 231, (N.D. Cal. June 23, 2025),https://cdn.arstechnica.net/wp-content/uploads/2025/06/Bartz-v-Anthropic-Order-on-Fair-Use-6-23-25.pdf。(最後閱覽日:2025/06/25) [3]Id. at 12-14. [4]Id. at 14-18. [5]Id. at 30-31. [6]Id. at 25-26. [7]Id. at 28. [8]Id. at 18-19. [9]劉家儀,美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?https://stli.iii.org.tw/article-detail.aspx?no=0&tp=1&d=9352。

TOP