開放政府資料(Open Government Data)從2009年美國發起開放政府倡議開始,在全球颳起一陣的旋風,主張公民享有政府資料的權利。這開放資料的浪潮,在2013年由G8工業國簽署開放政府資料憲章(Open Data Charter),約定將以開放為預設(open by default)推動開放政府資料,承諾致力於開放公部門資料、以不收取費用,並採用可再利用格式提供。隨後,G20工業經濟體於2014年跟進,以推動開放政府資料做為反貪腐的利器;聯合國也同時認知,現時亟需資料革命(Data Revolution)以做為實現全球發展的目標。
然而,依據網際網路基金會(World Wide Web Foundation)繼2013年所發布的Open Data Barometer(第一版),於2015年1月再度發布Open Data Barometer(第二版),以開放政府資料的整備、落實、與影響程度三大要素,來檢視與評估86個國家於2014年間對於開政府資料推動的狀況,結果發現仍有90%的資料還是閉鎖在政府機關。
從在資料內容方面來看,僅8%的國家採用開放格式與開放授權釋出核心資料,例如政府預算支出、公共服務執行資料集等,大部分國家仍未真正釋出多數核心資料集,不然就是雖已釋出但卻很難使用;更不用提用得以打擊貪腐和促進公平競爭的資料,如公司註冊、政府契約、土地所有權資料等。在法制與政策規範面,僅17%的國家具有公民對於資料主張權利(the right to information)的相關法制,大多數國家尚未以法律或政策做為課與機關主動積極(proactive)釋出資料的義務(mandated)、實現公民對於資料主張權利的依據,而且多數國家在開放政府資料的規範與程序上,對於個資隱私的保護仍然不足,或仍處於非常不確定的狀態。
為確保資料革命達成通透度和政府的性能,Open Data Barometer研究報告提出下列關鍵步驟,提供各國政府參採:
‧由政府高層承諾將主動積極釋出公部門資料,尤其是得促進問責(accountability)的關鍵資料
‧持續投入支援與提供培訓,使多數公民社會與企業理解與有效率地使用資料
‧因應各國需求開發開放資料的工具和方法,例如於在識字率較低的國家,採用視覺化方式呈現資料
‧支持地方層級開放資料的倡議,以補強國家層級開放政府資料的方案
‧進行法規調適,以確保公民對於資料主張權利,並於開放資料倡議中加強對於個資隱私保護的基礎
網路發明者與網路基金會創始人Sir Tim Berners-Lee依Open Data Barometer的調查結果,批評政府仍持續迴避開放可用於增強問責與信任的資料,並強調開放資料的強大力量,在於資訊的權利還給公民。
備註:
Open Data Barometer群組排名如下:
|
已開發國家 |
新興市場國家 |
開發中國家 |
|
1)英國 |
21)巴西 |
36)印尼 |
|
2)美國 |
22)墨西哥 |
39)印度 |
|
3)瑞典 |
33)匈牙利 |
46)迦納 |
|
4)紐西蘭 |
33)秘魯 |
46)盧安達 |
|
4)法國 |
36)阿根廷 |
49)肯亞 |
本文為「經濟部產業技術司科技專案成果」
日本經濟產業省於2022年8月31日公布「伊藤報告3.0版」(伊藤レポート3.0)和「為協力創造價值之綜合揭露、對話指南2.0版」(価値協創のための統合的開示・対話ガイダンス2.0,簡稱價值協創指南),強調企業永續轉型重要性。所謂永續轉型,係指社會永續發展與企業永續發展必須「同步」,及企業為此需要在經營面和產業面進行之改革。 「伊藤報告3.0版」整理企業推動永續轉型應採取之措施,包括必須根據社會永續性擘畫未來方向,並制定可實現長期價值之企業戰略、關鍵績效指標(Key Performance Indicators, KPI)、治理目標等。此外,伊藤報告也指出供應鏈全體(包含中堅、中小企業和新創企業等)和投資鏈上之參與者,都需要推動企業永續轉型。 為強化企業經營以實現永續轉型,經濟產業省同步修正「價值協創指南2.0版」,調整企業資訊揭露及對話方式,讓過程可以更有效率及建設性。指南修正重點包括:(1)全部項目都強調為實現永續社會,企業長期且持續提供價值的重要性及因應方向;(2)新設長期戰略項目;(3)確保「氣候相關財務揭露(Task Force on Climate-related Financial Disclosures, TCFD)」所提出之治理、戰略、風險管理、指標與目標之揭露架構與整合性;(4)於項目「實施戰略(中期經營戰略等)」中,強調人才戰略和人才投資重要性;(5)新設實質對話、約定項目。
美國白宮公布「聯邦政府與私部門提升智慧電力市場再生能源與儲能現況簡報」美國白宮在2016年6月16日舉行「提升智慧電力市場再生能源與儲能行動方案高峰會」,並於會後公布「聯邦政府與私部門提升智慧電力市場再生能源與儲能現況簡報」(Federal and Private Sector Actions on Scaling Renewable Energy and Storage with Smart Markets)等全美在此領域所採的各項措施。 白宮指出:目前透過新的行政部門行動措施與33州政府及私部門的承諾,除了將加速再生能源與儲能的電網整合,並預計在未來5年增加1.3GW的儲能採購與部署。 在聯邦政府方面,相關的行動包括白宮經濟顧問委員會(White House Council of Economic Advisers)就整合再生能源的電網技術與經濟面向發佈新報告、聯邦政府承諾進行增加聯邦與軍事基地的儲能與微電網的計畫,並提供偏鄉社群微電網建置資金,與能源部(DOE)促進能源資料的使用與標準化。 在私部門方面,相關的行動則有16家電業在至少8州公布未來5年的儲能採購與部署目標、投資人承諾在能源儲存領域投入1億3千萬美元資金,和電力公司與開發商承諾部署智慧熱水器、智慧電表,與需量反應計畫。 在上述措施中,加州公共事業委員會(California Public Utilities Commission, CPUC)承諾為更可靠的電網建立管制架構,並使用戶可從不同的分散型能源資源選擇,同時促進智慧電表與電網運作情形資料的蒐集、分析與散佈。 而綠色按鈕聯盟(Green Button Alliance)則宣布將以示範計畫提供聚集、匿名的能源使用資訊供研究與公益使用。目前規劃此示範計畫將由參與的電業透過智慧電表部署所提供的匿名能源使用資訊建立資料庫。
美國聯邦法官裁決AI「訓練」行為可主張合理使用美國聯邦法官裁決AI「訓練」行為可主張合理使用 資訊工業策進會科技法律研究所 2025年07月07日 確立我國資料創新利用的法制基礎,建構資料開放、共享和再利用的各項機制,滿足民間及政府取得高品質、可信任且易於利用資料的需求,以資料提升我國數位發展的價值,並強化民眾權利的保障,我國於2025年6月16日預告「促進資料創新利用發展條例」,擬推動資料基礎建設,促進更多資料的釋出。 AI發展領先國際的美國,近日首次有聯邦法院對AI訓練資料表達肯定合理使用看法,引發各界關注[1]。我國已開始著力於AI發展所需的資料流通與有效利用,該判決將有助於啟示我國個人資料、著作資料合法使用之法制因應研析。 壹、事件摘要 2025年6月23日美國加州北區聯邦地方法院(United States District Court for the Northern District of California),威廉·阿爾斯法官(Judge William Alsup)針對Andrea Bartz、Charles Graeber、Kirk Wallace Johnson這三位美國作家,對Anthropic公司訓練大型語言模型(Large Language Model, LLM)時使用受其等著作權保護書籍一案,作出指標性的簡易裁決(summary judgment)[2]。 此案被告掃描所購買的實體書籍,以及從盜版網站複製取得的受著作權保護的書籍,儲存在其數位化、可搜尋的檔案中,用來訓練其正在開發的各種大型語言模型。原告主張被當開發Claude AI模型,未經授權使用大量書籍作為訓練資料的行為,為「大規模未經授權利用」。法院則以四要素分析架構,支持合理使用抗辯(Fair Use Defense),強調AI訓練屬於技術發展過程中不可或缺的資料利用,AI公司於模型訓練階段使用著作權書籍,屬於「合理使用」(Fair Use),且具「高度轉化性」(Highly Transformative),包括將購買的實體圖書數位化,但不包括使用盜版,也不及於建立一個永久性的、通用目的的「圖書館(library)」(指訓練資料集)。 貳、重點說明 依美國著作權法第107條(17 U.S.C. § 107)規定,合理使用需綜合考量四要素,法官於本案中認為: 一、使用的目的與性質—形成能力具高度轉化性 AI模型訓練的本質在於學習語言結構、語意邏輯,而非單純複製或重現原著作。AI訓練過程將大量內容作為輸入,經由演算法解析、抽象化、向量化,最終形成轉個彎創造出不同的東西 (turn a hard corner and create something different) 的能力,屬於一種「學習」與「再創造」過程。AI訓練的目的並非為了重現原著作內容,而是為了讓模型具備生成新內容的能力。這種「轉化性」(transformative use)極高,與單純複製或替代原著作的行為有明顯區隔[3]。 另外訓練過程對資料做格式變更本身並未增加新的副本,簡化儲存並實現可搜尋性 (eased storage and enabled searchability),非為侵犯著作權人合法權益目的而進行,亦具有轉化性 (transformative)。原告就所購買的紙本圖書,有權按其認為合適的方式「處置 (dispose)」,將這些副本保存在其資料集中,用於所有一般用途[4]。 二、受保護作品的性質--高度創作性非關鍵因素 法院認同原告所主張的書籍是具有高度創意(creative)的作品理應享有較強的保護。但法院亦認為合理使用的四個要素,須為整體衡量,儘管作品本身具有較高的創意性,但由於使用行為的高度轉化性以及未向公眾直接重製原作表達,整體而言,法院認定用於訓練 LLM 的行為構成合理使用[5]。 三、使用的數量與實質性--巨大數量係轉化所必要 法院認為AI模型訓練需大量內容資料,甚至必須「全書」輸入,看似「大量使用」,但這正是AI技術本質所需。AI訓練是將內容進行抽象化、數據化處理,最終在生成新內容時,並不會原封不動重現原作。所以,雖然訓練過程涉及全部作品,但AI模型的輸出並不會重現原作的具體表達,這與單純複製、重製作品的行為有本質區別[6]。 四、對潛在市場或價值的影響 本案法院明確指出,人工智慧模型(特別是原告的Claude服務)的輸出內容,通常為全新生成內容,並非原作的精確重現或實質模仿冒,而且Claude服務在大型語言模型(LLM)與用戶之間加入額外功能,以確保沒有侵權輸出提供予用戶。因此,此類生成內容不構成對原作的替代,不會削弱原作的銷售市場,也不會造成市場混淆,而且著作權法保護的是原創而非保護作者免於競爭[7]。 不過即便法院支持被告的合理使用主張,肯定AI訓練與著作權法「鼓勵創作、促進知識流通」的立法目的相符。但仍然指出提供AI訓練的合理使用(Fair Use)不代表資料來源的適法性(Legality of Source)獲得合法認定。沒有任何判決支持或要求,盜版一本本來可以在書店購買的書籍對於撰寫書評、研究書中的事實或創建大型語言模型 (LLM) 是合理必要 (reasonably necessary) 的。此類對原本可(合法)取得的圖書進行盜版的行為,即使用於轉化性使用並立即丟棄,「本質上」、「無可救藥地」(inherently、irredeemably)構成侵害[8]。 參、事件評析 一、可能影響我國未來司法判決與行政函釋 我國於現行著作權法第65條規定下,須於個案交予我國法院認定合理使用主張是否能成立。本案判決為美國首個AI訓練行為可主張合理使用的法院見解,對於我國法院未來就對AI訓練資料取得的合法使用看法,顯見將會產生關鍵性影響。而且,先前美國著作權局之報告認為AI訓練過程中,使用受著作權保護作品可能具有轉化性,但利用結果(訓練出生成式AI)亦有可能影響市場競爭,對合理使用之認定較為嚴格,而此裁定並未採取相同的見解。 二、搜取網路供AI訓練資料的合理使用看法仍有疑慮 依據本會科法所創智中心對於美國著作權法制的觀察,目前美國各地法院中有多件相關案件正在進行審理,而且美國著作權局的合理使用立場較偏向有利於著作權利人[9]。相同的是,均不認同自盜版網站取得的資料可以主張合理使用。然而AI訓練所需資料,除來自於既有資料庫,亦多來自網路搜取,如其亦不在可主張範圍,那麼AI訓練的另一重要資料來源可能會受影響,後續仍須持續觀察其他案件判決結果。 三、有效率的資料授權利用機制仍是關鍵 前揭美國著作權局報告認為授權制度能同時促進產業發展並保護著作權,產業界正透過自願性授權解決作品訓練之方法,雖該制度於AI訓練上亦尚未為一完善制度。該裁決也指出,可合理使用資料於訓練AI,並不代表盜版取得訓練資料可以主張合理使用。這對於AI開發而言,仍是須要面對的議題。我國若要發展主權AI, 推動分散串接資料庫、建立權利人誘因機制,簡化資料查找與授權流程,讓AI訓練資料取得更具效率與合法性,才能根本打造台灣主權AI發展的永續基礎。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw) [1]相關新聞、評論資訊,可參見:Bloomberg Law, "Anthropic’s AI Book-Training Deemed Fair Use by US Judge", https://news.bloomberglaw.com/ip-law/ai-training-is-fair-use-judge-rules-in-anthropic-copyright-suit-38;Anthropic wins a major fair use victory for AI — but it’s still in trouble for stealing books, https://www.theverge.com/news/692015/anthropic-wins-a-major-fair-use-victory-for-ai-but-its-still-in-trouble-for-stealing-books;Anthropic Scores a Landmark AI Copyright Win—but Will Face Trial Over Piracy Claims, https://www.wired.com/story/anthropic-ai-copyright-fair-use-piracy-ruling/;Anthropic Wins Fair Use Ruling In Authors' AI Copyright Suit, https://www.thehindu.com/sci-tech/technology/anthropic-wins-key-ruling-on-ai-in-authors-copyright-lawsuit/article69734375.ece., (最後閱覽日:2025/06/25) [2]Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417-WHA, Doc. 231, (N.D. Cal. June 23, 2025),https://cdn.arstechnica.net/wp-content/uploads/2025/06/Bartz-v-Anthropic-Order-on-Fair-Use-6-23-25.pdf。(最後閱覽日:2025/06/25) [3]Id. at 12-14. [4]Id. at 14-18. [5]Id. at 30-31. [6]Id. at 25-26. [7]Id. at 28. [8]Id. at 18-19. [9]劉家儀,美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?https://stli.iii.org.tw/article-detail.aspx?no=0&tp=1&d=9352。
IBM嘗試新方法支持開放原始碼IBM公司在2日拉斯維加斯舉行世界夥伴(PartnerWorld)會議時,宣布提倡開放原始碼創新的新措施,包括成立求職應徵者資料庫,以及一項電子學習計畫。這座資料庫預定今年第三季推出,屆時會把具有開放原始碼技術的大學生所投的履歷表一一編列成目錄。想被納入資料庫的資格,包括曾經參加IBM校園人才培訓計畫(Academic Initiative)中級程度以上,並通過IBM開放原始碼專業資格考試的人士。該資料庫提供IBM的企業客戶與商業夥伴檢索。起初,此資料庫只涵蓋北美洲地區,但IBM打算將來擴大推廣到世界其他地區。 該公司也將透過提供IBM校園人才培訓計畫,提供各校所需的中介軟體及硬體,而Hubs計畫本身不打算收費,或只酌收少許費用。第一座這種中心預定春季在德州A&M大學成立。 IBM另外在PartnerWorld宣布,計劃今年與商業夥伴共同成立100座新的「創新中心」( innovation centers)。藍色巨人先前已承諾投資1.5億美元開辦這類中心,讓系統整合業者、獨立軟體公司、附加價值流通業者以及解決方案服務提供者藉此取得IBM的技術與設備,以協助他們測試並最佳化自家產品。其構想是協助這些夥伴加速產品上市,並降低產品開發費用。自2004年推出以來,IBM已在北美和歐洲成立大約40座這種中心。