美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?

美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?

資訊工業策進會科技法律研究所

2025年06月04日

美國著作權局於2025年5月發布著作權與AI第三部分報告之預出版本 (Copyright and Artificial Intelligence Part 3: Generative AI Training pre-publication version)[1],該報告重點為生成式AI訓練資料與著作權之關係,彙整各方意見並分析現行法制之挑戰及修改方向,目前發布之版本為預出版本,該報告說明將於近期發布最終確認版,預期其結論與實質內容並不會有修改。

壹、事件摘要

美國著作權局自2023年起即開始對AI所引發之著作權法律及政策問題進行研究,同年8月著作權局發布著作權及AI諮詢通知(Comments on Artificial Intelligence Notice of Inquiry, NOI),徵集各界對AI著作權議題之意見,著作權局亦針對相關議題舉辦多場公聽會及研討會協助意見之蒐集[2]。NOI發布後蒐集到之意見經著作權局整理分析,於2024年7月起發布AI著作權報告,第一部分為數位仿造,第二部分於2025年1月發布為就AI作品之著作可保護性之分析,而同年5月所發布之第三部分則聚焦於生成式AI之訓練。

生成式AI於訓練過程可能大量使用受著作權保護之作品,此份報告針對訓練過程可能涉及之著作權問題進行分析,主要說明AI模型訓練過程中使用受著作權保護作品是否可構成合理使用。

貳、重點說明

一、生成式AI模型訓練及模型權重對重製權之侵害

使用受著作權保護作品進行AI模型訓練涉及著作權中之重製,除非開發者能提出授權或其他合理抗辯如合理使用等,否則可能對一項或多項著作權利構成初步侵權(Prima Facie Infringement)。AI開發者於模型訓練階段會進行多次作品複製,包含下載作品、於儲存媒介間轉換、將作品進行格式化或製作副本等[3],模型訓練過程中暫時複製之作品亦有可能因其存在於時間足夠而構成重製權之侵害[4]

在特定情形下,模型權重(model weights)[5]之複製亦可能構成重製權之侵害。訓練過程可能使模型權重包含著作權作品,而若第三方複製了包含著作權作品之模型權重,即便其未參與模型之訓練,亦可能構成初步侵權[6]。若模型能在未經外部輸入之情形下產出與訓練範例相似之內容時,表示此範例必以某種形式存在於模型權重中,故此模型權重之複製極有可能侵犯著作重製權[7]。換言之,不僅開發者有可能因模型權重之複製侵害著作權人之權利,部署、使用等第三方若複製模型權重亦有可能構成對重製權之侵害。

著作權局指出,模型權重究竟是否會構成重製權或甚至衍生作品之侵權,須判斷該模型權重是否保留與作品受權利保護部分實質相似之內容,僅有在實質相似之情形下,模型權重之複製才可能構成侵權[8]

二、合理使用

對著作權作品之合理使用可做為作品重製權的抗辯,著作權局於報告中就不同因素分析AI使用著作權作品進行訓練是否得主張合理使用。AI於訓練過程中會有多次複製行為,惟在判斷AI模型訓練是否為對作品之合理使用,仍須視整體使用情境進行判斷[9]

(1) 作品轉化性須視模型目的及佈署判斷

報告中分析作品之轉化性(transformativeness)[10],AI訓練使用作品是否具有轉化性並非絕對,而是依據模型最終之功能及佈署有程度上之區別,須依個案判斷。若模型之訓練目的為用於研究或封閉系統,則該模型具高轉化性;若其目的是生成與訓練用作品實質相似之結果時,不具轉化性。多數模型之轉化程度會落在前述兩極端之中間,如模型使用特定類型之作品進行訓練,用以生成使用目的與原作相同之內容時,即便其生成內容未有實質相似,頂多僅為有限度之轉化(modestly transformative)[11]。AI開發商得於其系統設置防護措施,限制模型複製受著作權保護作品之節錄內容,使生成內容之目的與原作品不同,此措施能使模型訓練更具轉化性[12]

有論者認為,使用受著作權保護作品進行AI模型訓練並非出於表達目的,且近似人類學習,因此實質上應是具有轉化性的,著作權局否定了前述兩種說法。報告中說明,語言模型於訓練時所吸收的內容包含文句、段落及文件之排列選擇,並非單純僅吸收其單字含意,且所生成之模型是被用作創造表達性內容,故不得謂AI模型為非表達性目的[13]。其次,針對人類學習觀點,報告首先闡明,學生基於學習目的亦不得以合理使用為由複製整本著作,因此人類學習並不得直接作為合理使用之抗辯。生成式AI之訓練能迅速分析並生成完美之作品,此非如同人類經學習後會產出具個別人格特質之結果,故著作權局不同意AI模型之訓練為與人類學習相同具有轉化性之論點[14]

(2) 受著作權保護作品之表達性

AI訓練所使用之受著作權保護作品若具較高創作或表達性,如小說、電影等,其著作權比其他作品如電腦編碼等功能性作品更接近著作權之保護核心。而AI模型訓練來源多元,因此判斷上仍須視個案模型及作品而定。

(3) 使用作品之合理比例

AI模型訓練需大量複製受著作權保護作品,於判斷其複製比例是否合理時,係判斷模型訓練所複製之部分對於受著作權保護作品之數量及重要性使否合理[15]。作品使用之合理性,須考量重要性以及數量,若模型僅使用小部分作品做訓練,但該部分為著作權作品之核心部分,此使用並不一定合理。

在使用完整作品層面,生成式AI較一般搜尋引擎更不具合理性,生成式AI所提供之資訊並非僅限於其訓練資料庫中所複製作品資料。然而,許多生成式AI之訓練方式必須使用完整作品進行訓練,因此,著作權局指出,雖開發者使用完整作品進行訓練與合理使用相悖,但若其訓練具有轉化性目的(transformative purpose),並且有必要透過大量作品之訓練以提升模型效能時,則使用整部作品進行訓練可能被認為合理[16]。換言之,使用完整作品進行訓練合理與否須連同其使用必要性及訓練目的一併考量。

(4) 影響原作品之潛在市場或價值

報告中點出三項生成式AI訓練可能造成的市場危害。

A 銷售損失(lose sale):權利人因潛在消費者選擇AI複製創作取代原作,而失去收入。

B 市場稀釋 (market dilution):AI生成內容之速度以及規模對訓練資料中同類作品之市場造成稀釋風險,原作者將更難銷售其作品亦將使消費者更難找到真人創作之作品[17]。AI所生成風格相似之作品亦會導致市場稀釋,風格非為著作權所保障之方為,惟若AI生成與作品風格相似之內容,即便未有實質相似,但消費者可能因此難以分辨AI創作與真人作者,將使AI作品與原作者之作品於市場上直接競爭而影響原市場[18]

C 喪失授權收入機會 (lost licensing opportunities):權利人本可就其作品於市場上有授權收入之機會,但因AI未經授權使用作品進行訓練而喪失該部分收入[19]

三、 授權使用

對於AI自願授權之情形於近年越來越普遍,報告亦肯認自願授權之可行性,雖自願授權可行,且已有開發商開始實施,惟對於完全滿足AI產業之需求仍存有疑義[20]。該報告認為,即便現階段自願性授權仍為發展中之制度,但該制度確實能避免使用著作權作品之不確定性。著作權局認為應讓自願性授權制度於授權市場於無政府干預情形下繼續發展,若未來於特定類型作品中出現失靈情形時,再考慮進行擴大集體授權等干預措施[21]

參、事件評析

AI訓練使用著作權保護作品是否可以合理使用作為抗辯為近年AI發展下著作權高度討論問題之一。目前美國各地法院中有40多件相關案件正在進行審理,然就此報告之結論觀之,其並未對AI訓練是否可作為合理使用給予統一解答,合理使用與否仍須視個案而定。如同報告結論所提及,AI訓練過程中,使用受著作權保護作品可能具有轉化性,但是否足以構成合理使用,仍須視其所使用之作品、來源以及目的等個案因素而定[22]。AI訓練於著作權仍存在一定程度之不確定性。

值得注意的是,雖報告並未明示AI訓練使否為合理使用著作權作品,惟其立場似乎更偏向有利於著作權利人。例如報告中於轉化性認定具有灰色地帶,開發商是否能主張合理使用仍需於後續由法院個案認定。此外,報告中提及市場稀釋理論,目前尚未有法院採用,對合理使用之認定較為嚴格,即使未有實質相似之生成內容亦有可能因影響市場競爭被視為非合理使用,可見該理論對著作權利人之權利保障。

同時著作權局亦正向看待產業界透過自願性授權進行作品訓練之方法,雖該制度於AI訓練上尚未為一完善制度,但確實地授權制度能同時促進產業發展並保護著作權[23]。目前實務上亦是以此種作法解決合理使用之困境,但授權制度仍有待市場持續發展完善制度以確保能符合AI訓練之需求。

美國著作權局之報告雖對AI使用著作權保護作品進行訓練進行分析及說明,惟其結論仍是認為判斷上需依照個案分析。目前國際上尚未有對AI合理使用之實際定論,自願性授權仍為產業界所使用之方法。我國著作權法亦未對AI訓練之合理使用有說明,國際上將會如何發展仍有待觀察。

資策會科法所創智中心致力於著作權相關科技法律研究,本中心將持續關注相關議題並更新動態。

本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。

[1]U.S. Copyright Office Copyright and Artificial Intelligence, Part 3: Generative AI Training pre-publication version, https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf

[2]U.S. Copyright Office, Copyright Office Issues Notice of Inquiry on Copyright and Artificial Intelligence, https://www.copyright.gov/newsnet/2023/1017.html (last viewed: 2025/05/19)

[3]supra note 1, at 26.

[4]Id. at 27.

[5]AI模型之建立仰賴神經網,主要功能為將輸入資料轉換為輸出資料。神經網路之運作方式係透過大量於訓練過程中產生之參數進行運案,而該些參數即為「權重」(weights)。

[6]Id. at 28.

[7]Id.

[8]Id. at 30.

[9]Id. at 36-37.

[10]轉化性係指新作品加入新元素,具有與原作不同目的或性質,且以新表達、意義或訊息改造原作。並且新作品於市場上較不會取代原作。

[11]Id. at 46.

[12]Id.

[13]Id. at 47.

[14]Id. at 48.

[15]Id. at 54.

[16]Id. at 60.

[17]Id. at 65.

[18]Id. at 65-66.

[19]Id. at 66-67.

[20]Id. at 85.

[21]Id. at 106.

[22]Id. at 107.

[23]Id.

本文同步刊登於TIPS網站(https://www.tips.org.tw

※ 美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=9352&no=65&tp=1 (最後瀏覽日:2025/12/08)
引註此篇文章
你可能還會想看
歐盟針對體外診療器材提出新管制架構,預期將於2015年正式實施

  歐盟對於體外診療器材(In Vitro Diagnostic Medical Devices,以下簡稱IVDs)之管制,最早起始於1998年的體外診療器材指令(Directive 98/79/EC on In Vitro Diagnostic Medical Devices,以下簡稱「1998年IVDD指令」),該指令依IVDs是否具有侵入性、接觸病人的時間長短及是否需要能源加以驅動等條件,進一步區分為四種風險等級:第1級(Class I)-低風險性、第2a級(Class IIa)-低至中風險性、第2b級(Class IIb)-中至高風險性、第3級(Class III)-高風險性。Class I因風險性最低,故1998年IVDD指令僅要求廠商建立品管系統、保留產品技術檔案、並自為符合性聲明後,即得於市場上流通;Class IIa與Class IIb則由於風險略高,所建立之品管系統需經過「符合性評鑑」;而Class III的風險最高,故其品管系統除須符合前述要求外,更應由經歐盟認證的代檢機構(Notified Body)進行審查,通過前述評鑑及審查後,始可於歐洲市場流通使用。   然而,隨著科學及技術的進步,市場上不斷出現創新性的產品,使得1998年IVDD指令已逐漸無法滿足管理需求,輔以各會員國對於指令的解釋和實施各有不同,致使歐盟內部在病患及公共健康的保護上有程度不一的落差,為歐盟單一市場的運作埋下隱憂。因此,歐盟執委會(European Commission)於2012年9月26日提出新的管制架構(Proposal for a Regulation of the European Parliament and of the Council on in vitro diagnostic devices),其主要變革包括: 1. 擴大IVDs的定義:將IVDs的範圍擴及用以獲取醫療狀況或疾病罹患傾向資訊(如基因檢測)的器材及醫療軟體(medical software)等。 2. 新的分類標準及評估程序:將診療器材重新分為A、B、C、D四類,A類為風險最低,D類為風險最高。A類維持原先1998年IVDD指令中的廠商自我管控機制,但當A類器材欲進行臨床測試(near-patient testing)、具備評量功能或用於殺菌者,須先由代檢機構就其設計、評量功能及殺菌過程進行驗證。B類器材因風險略高,故須通過代檢機構之品管系統審查;C類產品除品管系統審查外,需再提交產品樣本的技術文件;而D類由於風險最高,除前述品管系統審查外,需經過核准使能進入市場。至於A、B、C、D類產品進入市場後,代檢機構會定期進行上市後(the post-market phase)監控。 3. 導入認證人員(qualified person,簡稱GP):診療器材製造商應於組織內導入GP人員,負責確保製造商組織內部的一切法令遵循事宜。 4. 落實提升透明度(transparency)之相關措施:為確保醫療器材的安全性和效能,要求:(1) 歐盟市場內之經濟經營商(economic operator)應能夠辨認IVDs的供應者及被供應者;(2) 製造商應將單一裝置辨識碼(Unique Device Identification)導入產品中,以利日後之追蹤;(3) 歐盟單一市場中的所有製造商及進口商,應將其企業及產品資訊於歐洲資料庫(European database)中進行註冊;(4) 製造商有義務向大眾公開高風險性裝置的安全性與效能等相關說明資訊。   歐盟執委會已提交新管制架構予歐洲議會,若順利通過將可望於2015年起正式實施,未來將對歐洲IVDs產業有何影響,值得持續觀察之。

美國FCC廢除網路中立法規

  2017年12月14日美國聯邦通信委員會(Federal Communications Commission, FCC)以3票對2票表決通過,廢止自2015年來所採取網路寬頻服務的高壓監管規定,並恢復了原來所採取低管制監管框架。支持者與反對者分別來自兩個不同的黨派。   經過詳細的分析以及對消費者和利益相關者的評論廣泛審查後,委員會認為自2015年來對網路寬頻服務採取的高壓規定,對整個網路生態系統施加了巨大的成本。為了取代這個嚴格的框架,FCC重新採用2015年之前的傳統低管制監管框架。   FCC 特別要求行動寬頻服務業者應公開揭露其網路管理政策例如:如何處理網路安全與壅塞問題、服務內容與商業條款等,以利於消費者與業者進行有效選擇,並促進政府對寬頻業者的行為進行有效的監督。此外 ,FCC恢復了聯邦貿易委員會(Federal Trade Commission, FTC)的管轄權,以便在寬頻業者從事反競爭、不公平或欺騙行為時採取行動。   在對消費者的影響方面,自由市場的支持者認為,付費優先的作法,意味在寬頻基礎建設上會有更多投資,使得上網和整體資料傳輸速度大為增加。   為達上述目標,委員會所採取之具體措施如下: 將寬頻接取服務(包括固定與行動寬頻服務)重新歸類為資訊服務。 將行動寬頻接取服務恢復歸類為私人行動服務。 將網路服務提供者有關隱私保護、不公平、詐欺和反競爭行為之管轄權回歸由聯邦貿易委員會負責。 要求網路服務提供者向消費者、企業和委員會揭露有關其做法的訊息,包括阻止,限制,支付優先次序或附屬優先次序。   此外FCC又禁止各州限制擴建寬頻網路服務的法律。據FCC統計,大約20個州有限制社區寬頻網路服務活動的法律,這些州的法律不公平地限制政府部門與有線電視和電信寬頻服務提供商的競爭。 FCC通過該案後引發不少如Google、Facebook及Netflix等科技公司,與消費者保護環體齊力撻伐,認為ISP業者在FCC力挺下,將可隨意限制民眾上網瀏覽的內容,大企業因此具優先權,不利新創網路公司生存發展,且投下反對票的政黨表示,將率領各州對聯邦傳播委員會這項決定提出法律挑戰,透過訴訟尋求翻盤機會。

日本內閣府公布生成式AI初步意見彙整文件,提出風險因應、應用及開發兩大關注重點

日本內閣府於2023年5月26日召開第2次「AI戰略會議」(AI戦略会議),並公布「AI相關論點之初步整理」(AIに関する暫定的な論点整理)。鑒於AI對於改善國人生活品質、提高生產力無疑有相當助益,考量生成式AI甫問世,社會大眾對其潛在風險尚心存疑慮,內閣府遂以生成式AI為核心,延續先前已公布之「AI戰略2022」(AI 戦略 2022)、「以人為中心的AI社會原則」(人間中心の AI 社会原則),以「G7廣島峰會」(G7広島サミット)所提出之願景—「符合共同民主價值的值得信賴AI」為目標,提出「風險因應」及「應用與開發」兩大關注重點,供政府有關部門參考之同時,並期待可激起各界對於生成式AI相關議題之關注與討論: 一、風險因應:AI開發者、服務提供者與使用者應自行評估風險並確實遵守法規及相關指引;政府則應針對風險應對框架進行檢討,對於已知的風險,應先以現有的法律制度、指引與機制進行處理,假如現有法制等無法完全因應這些風險,則應參考各國作法盡速對現行制度進行修正。 AI的透明度與可信賴度於風險因應至關重要。若能掌握AI學習使用哪些資料、所學習資料之來源、AI如何產生結果等,就能針對使用目的選擇適合的AI,也較易因應發生之問題,並避免AI產生錯誤結果或在對話中洩漏機密資訊等。對此,本文件呼籲AI開發者及服務提供者依據現行法令和指引主動揭露資訊,政府則應對透明度和可信賴度相關要求進行檢討,並應依普及程度及各國動向對既有的指引進行必要之修正。 二、應用與開發:本文件建議政府部門積極使用生成式AI於業務工作上,找出提升行政效率同時不會洩漏機密之方法,並向民眾宣導AI應用之益處與正確的使用方式,以培養民眾AI相關技能與素養,藉以更進一步建構AI應用與開發之框架,如人才培育、產業環境準備、相關軟硬體開發等。

ICANN將增加網域名稱的選擇性

  掌管網域名稱規則的組織—ICANN,於2008年6月底透過總裁Paul Twomey表示,其將計畫提出新的通用型網域名稱(Top-level domains, “TLD”),以為增加網域名稱的選擇性做準備,並且讓想透過網域名稱表現自我的使用者,有更多選擇模式。目前為止,網域名稱使用者可選擇的通用型網域名稱限於21種,例如.com、.org、.info等。     根據ICANN新的規劃,申請新的通用型網域名稱者,可以自己選擇其網域名稱,並且進行登記。所有的新申請者不但可以專屬使用其所選擇的網域名稱,也可以將該網域名稱透過登記移轉來進行買賣。     從ICANN的聲明來看,其預估申請者將會以群組做為主要的選擇,例如現有旅遊業者的.travel,另外以城市作為通用型網域名稱的需求也相當高,例如.nyc、.paris。     ICANN目前計畫限定一個期間來接受全世界的團體來申請通用型網域名稱,預估第一輪的申請期限截止後,ICANN將會透過預計9個月的評選程序,來處理所有的通用型網域名稱申請。目前ICANN的新計畫預計於2009年第二季開始接受申請。

TOP