美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?
資訊工業策進會科技法律研究所
2025年06月04日
美國著作權局於2025年5月發布著作權與AI第三部分報告之預出版本 (Copyright and Artificial Intelligence Part 3: Generative AI Training pre-publication version)[1],該報告重點為生成式AI訓練資料與著作權之關係,彙整各方意見並分析現行法制之挑戰及修改方向,目前發布之版本為預出版本,該報告說明將於近期發布最終確認版,預期其結論與實質內容並不會有修改。
壹、事件摘要
美國著作權局自2023年起即開始對AI所引發之著作權法律及政策問題進行研究,同年8月著作權局發布著作權及AI諮詢通知(Comments on Artificial Intelligence Notice of Inquiry, NOI),徵集各界對AI著作權議題之意見,著作權局亦針對相關議題舉辦多場公聽會及研討會協助意見之蒐集[2]。NOI發布後蒐集到之意見經著作權局整理分析,於2024年7月起發布AI著作權報告,第一部分為數位仿造,第二部分於2025年1月發布為就AI作品之著作可保護性之分析,而同年5月所發布之第三部分則聚焦於生成式AI之訓練。
生成式AI於訓練過程可能大量使用受著作權保護之作品,此份報告針對訓練過程可能涉及之著作權問題進行分析,主要說明AI模型訓練過程中使用受著作權保護作品是否可構成合理使用。
貳、重點說明
一、生成式AI模型訓練及模型權重對重製權之侵害
使用受著作權保護作品進行AI模型訓練涉及著作權中之重製,除非開發者能提出授權或其他合理抗辯如合理使用等,否則可能對一項或多項著作權利構成初步侵權(Prima Facie Infringement)。AI開發者於模型訓練階段會進行多次作品複製,包含下載作品、於儲存媒介間轉換、將作品進行格式化或製作副本等[3],模型訓練過程中暫時複製之作品亦有可能因其存在於時間足夠而構成重製權之侵害[4]。
在特定情形下,模型權重(model weights)[5]之複製亦可能構成重製權之侵害。訓練過程可能使模型權重包含著作權作品,而若第三方複製了包含著作權作品之模型權重,即便其未參與模型之訓練,亦可能構成初步侵權[6]。若模型能在未經外部輸入之情形下產出與訓練範例相似之內容時,表示此範例必以某種形式存在於模型權重中,故此模型權重之複製極有可能侵犯著作重製權[7]。換言之,不僅開發者有可能因模型權重之複製侵害著作權人之權利,部署、使用等第三方若複製模型權重亦有可能構成對重製權之侵害。
著作權局指出,模型權重究竟是否會構成重製權或甚至衍生作品之侵權,須判斷該模型權重是否保留與作品受權利保護部分實質相似之內容,僅有在實質相似之情形下,模型權重之複製才可能構成侵權[8]。
二、合理使用
對著作權作品之合理使用可做為作品重製權的抗辯,著作權局於報告中就不同因素分析AI使用著作權作品進行訓練是否得主張合理使用。AI於訓練過程中會有多次複製行為,惟在判斷AI模型訓練是否為對作品之合理使用,仍須視整體使用情境進行判斷[9]。
(1) 作品轉化性須視模型目的及佈署判斷
報告中分析作品之轉化性(transformativeness)[10],AI訓練使用作品是否具有轉化性並非絕對,而是依據模型最終之功能及佈署有程度上之區別,須依個案判斷。若模型之訓練目的為用於研究或封閉系統,則該模型具高轉化性;若其目的是生成與訓練用作品實質相似之結果時,不具轉化性。多數模型之轉化程度會落在前述兩極端之中間,如模型使用特定類型之作品進行訓練,用以生成使用目的與原作相同之內容時,即便其生成內容未有實質相似,頂多僅為有限度之轉化(modestly transformative)[11]。AI開發商得於其系統設置防護措施,限制模型複製受著作權保護作品之節錄內容,使生成內容之目的與原作品不同,此措施能使模型訓練更具轉化性[12]。
有論者認為,使用受著作權保護作品進行AI模型訓練並非出於表達目的,且近似人類學習,因此實質上應是具有轉化性的,著作權局否定了前述兩種說法。報告中說明,語言模型於訓練時所吸收的內容包含文句、段落及文件之排列選擇,並非單純僅吸收其單字含意,且所生成之模型是被用作創造表達性內容,故不得謂AI模型為非表達性目的[13]。其次,針對人類學習觀點,報告首先闡明,學生基於學習目的亦不得以合理使用為由複製整本著作,因此人類學習並不得直接作為合理使用之抗辯。生成式AI之訓練能迅速分析並生成完美之作品,此非如同人類經學習後會產出具個別人格特質之結果,故著作權局不同意AI模型之訓練為與人類學習相同具有轉化性之論點[14]。
(2) 受著作權保護作品之表達性
AI訓練所使用之受著作權保護作品若具較高創作或表達性,如小說、電影等,其著作權比其他作品如電腦編碼等功能性作品更接近著作權之保護核心。而AI模型訓練來源多元,因此判斷上仍須視個案模型及作品而定。
(3) 使用作品之合理比例
AI模型訓練需大量複製受著作權保護作品,於判斷其複製比例是否合理時,係判斷模型訓練所複製之部分對於受著作權保護作品之數量及重要性使否合理[15]。作品使用之合理性,須考量重要性以及數量,若模型僅使用小部分作品做訓練,但該部分為著作權作品之核心部分,此使用並不一定合理。
在使用完整作品層面,生成式AI較一般搜尋引擎更不具合理性,生成式AI所提供之資訊並非僅限於其訓練資料庫中所複製作品資料。然而,許多生成式AI之訓練方式必須使用完整作品進行訓練,因此,著作權局指出,雖開發者使用完整作品進行訓練與合理使用相悖,但若其訓練具有轉化性目的(transformative purpose),並且有必要透過大量作品之訓練以提升模型效能時,則使用整部作品進行訓練可能被認為合理[16]。換言之,使用完整作品進行訓練合理與否須連同其使用必要性及訓練目的一併考量。
(4) 影響原作品之潛在市場或價值
報告中點出三項生成式AI訓練可能造成的市場危害。
A 銷售損失(lose sale):權利人因潛在消費者選擇AI複製創作取代原作,而失去收入。
B 市場稀釋 (market dilution):AI生成內容之速度以及規模對訓練資料中同類作品之市場造成稀釋風險,原作者將更難銷售其作品亦將使消費者更難找到真人創作之作品[17]。AI所生成風格相似之作品亦會導致市場稀釋,風格非為著作權所保障之方為,惟若AI生成與作品風格相似之內容,即便未有實質相似,但消費者可能因此難以分辨AI創作與真人作者,將使AI作品與原作者之作品於市場上直接競爭而影響原市場[18]。
C 喪失授權收入機會 (lost licensing opportunities):權利人本可就其作品於市場上有授權收入之機會,但因AI未經授權使用作品進行訓練而喪失該部分收入[19]。
三、 授權使用
對於AI自願授權之情形於近年越來越普遍,報告亦肯認自願授權之可行性,雖自願授權可行,且已有開發商開始實施,惟對於完全滿足AI產業之需求仍存有疑義[20]。該報告認為,即便現階段自願性授權仍為發展中之制度,但該制度確實能避免使用著作權作品之不確定性。著作權局認為應讓自願性授權制度於授權市場於無政府干預情形下繼續發展,若未來於特定類型作品中出現失靈情形時,再考慮進行擴大集體授權等干預措施[21]。
參、事件評析
AI訓練使用著作權保護作品是否可以合理使用作為抗辯為近年AI發展下著作權高度討論問題之一。目前美國各地法院中有40多件相關案件正在進行審理,然就此報告之結論觀之,其並未對AI訓練是否可作為合理使用給予統一解答,合理使用與否仍須視個案而定。如同報告結論所提及,AI訓練過程中,使用受著作權保護作品可能具有轉化性,但是否足以構成合理使用,仍須視其所使用之作品、來源以及目的等個案因素而定[22]。AI訓練於著作權仍存在一定程度之不確定性。
值得注意的是,雖報告並未明示AI訓練使否為合理使用著作權作品,惟其立場似乎更偏向有利於著作權利人。例如報告中於轉化性認定具有灰色地帶,開發商是否能主張合理使用仍需於後續由法院個案認定。此外,報告中提及市場稀釋理論,目前尚未有法院採用,對合理使用之認定較為嚴格,即使未有實質相似之生成內容亦有可能因影響市場競爭被視為非合理使用,可見該理論對著作權利人之權利保障。
同時著作權局亦正向看待產業界透過自願性授權進行作品訓練之方法,雖該制度於AI訓練上尚未為一完善制度,但確實地授權制度能同時促進產業發展並保護著作權[23]。目前實務上亦是以此種作法解決合理使用之困境,但授權制度仍有待市場持續發展完善制度以確保能符合AI訓練之需求。
美國著作權局之報告雖對AI使用著作權保護作品進行訓練進行分析及說明,惟其結論仍是認為判斷上需依照個案分析。目前國際上尚未有對AI合理使用之實際定論,自願性授權仍為產業界所使用之方法。我國著作權法亦未對AI訓練之合理使用有說明,國際上將會如何發展仍有待觀察。
資策會科法所創智中心致力於著作權相關科技法律研究,本中心將持續關注相關議題並更新動態。
本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。
[1]U.S. Copyright Office Copyright and Artificial Intelligence, Part 3: Generative AI Training pre-publication version, https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf
[2]U.S. Copyright Office, Copyright Office Issues Notice of Inquiry on Copyright and Artificial Intelligence, https://www.copyright.gov/newsnet/2023/1017.html (last viewed: 2025/05/19)
[3]supra note 1, at 26.
[4]Id. at 27.
[5]AI模型之建立仰賴神經網,主要功能為將輸入資料轉換為輸出資料。神經網路之運作方式係透過大量於訓練過程中產生之參數進行運案,而該些參數即為「權重」(weights)。
[6]Id. at 28.
[7]Id.
[8]Id. at 30.
[9]Id. at 36-37.
[10]轉化性係指新作品加入新元素,具有與原作不同目的或性質,且以新表達、意義或訊息改造原作。並且新作品於市場上較不會取代原作。
[11]Id. at 46.
[12]Id.
[13]Id. at 47.
[14]Id. at 48.
[15]Id. at 54.
[16]Id. at 60.
[17]Id. at 65.
[18]Id. at 65-66.
[19]Id. at 66-67.
[20]Id. at 85.
[21]Id. at 106.
[22]Id. at 107.
[23]Id.
本文同步刊登於TIPS網站(https://www.tips.org.tw)
英國資料倫理與創新中心(Centre for Data Ethics and Innovation, CDEI)於2019年10月發布「議題速覽-深度偽造與視聽假訊息」報告(Snapshot Paper - Deepfakes and Audiovisual Disinformation),指出深度偽造可被定義為透過先進軟體捏造特定人、主題或環境樣貌之影片或聲音等內容。除取代特定主體之臉部外,其亦具備臉部特徵重塑、臉部生成與聲音生成之功能。而隨相關技術逐漸成熟將難辨網路視聽影像之真偽,故CDEI指出有必要採取相關因應措施,包含: 一. 立法 許多國家開始討論是否透過訂立專法因應深度偽造,例如紐約州眾議院議員提出法案禁止特定能取代個人臉部數位技術之應用,美國國會亦有相關審議中草案。然而,縱有法律規範,政府仍無法輕易的辨識影片製造者,且相關立法可能抑制該技術於正當目的上之應用,並導致言論自由之侵害,故未來英國制定相關制度之制定將審慎為之。 二. 偵測 媒體鑑識方法於刑事鑑識領域已實行多年,其也可以運用於辨識深度偽造。媒體鑑識方法之一為檢查個體是否有物理上不一致之現象,以認定特定證物是否經竄改,包括拍攝過程中被拍攝對象是否眨眼,或皮膚上顏色或陰影是否閃爍。雖目前英國相關鑑識專家對於媒體鑑識方法是否可辨識深度偽造仍有疑義,惟相關單位已經著手發展相關技術。 三. 教育 教育亦為有效因應深度偽造之方法。目前許多主流媒體均開始喚起大眾對於深度偽造之意識,例如Buzzfeed於去年即點出5個方法以辨認有問題之影片。科技公司也開始投入公眾教育,提高成人網路使用者對於假訊息與深度偽造之辨識,然而報告指出其成效仍有待觀察。
歐洲及中國大陸專利效力自2018年3月1日起可延伸至柬埔寨柬埔寨於2017年1月23日與歐洲專利局(下稱EPO)在首都金邊簽署專利合作協議,該協議內容為申請人僅需提出歐洲專利申請,不論是申請案或是經核准的專利,其效力均可延伸至柬埔寨,並受柬埔寨專利法的約束。EPO局長Benoît Battistelli表示,此次合作協議將使得歐洲專利制度橫跨至亞洲市場,申請人在歐洲提出專利申請,即可在44個歐洲及非歐洲國家(包含摩洛哥、突尼西亞、柬埔寨)取得專利保護。除了可減少申請人的申請作業時間和成本,避免冗長的實質審查程序,也可提高歐洲專利權人在柬埔寨投資的意願。 柬埔寨同年9月亦與中國大陸知識產權局(SIPO)簽署性質相同的專利合作備忘錄,發明專利於中國大陸通過審查核准後,發明人可提出申請至柬埔寨取得專利權及相關保護,取得日期及保護時限20年與中國大陸相同,且申請日於2003年1月22日後的中國大陸發明專利,皆可於柬埔寨產生保護效力。 依據國際貨幣基金組織(IMF)最新預測與評估,柬埔寨在經濟持續高成長的情況下,將會是全球未來十年經濟成長最快速的國家之一。柬埔寨近年來積極規劃改革其智慧財產法制,並透過與其他國家簽署專利合作協議,來促進國內經濟及吸引外國直接投資。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」
AuthenTec被控侵權勝訴Atmel 於2006年3月美國南加州地方法院對世界首屈一指的指紋辨識功能機器的供應商AuthenTec提出告訴,宣稱AuthenTec侵害Atmel兩項專利,今年五月五日法院的即決判決中確定AuthenTec的產品並未侵害Atmel的專利。 AuthenTec 副總裁兼法律顧問 Frederick Jorgensen表示:「從一開始被起訴,對於Atmel的指控,我們十分有信心公司的產品沒有侵權,也十分樂見此次法院的判決。我們相信我們的科技及智慧財產在市場居有領先的地位,為了保護這些資產,我們將會進行保護的措施。」 AuthenTec藉著指紋辨識器增加了很多資產,目前有超過三億個指紋辨識器運用在電腦、手機、PDA及門禁系統上。所有的指紋辨識器都是依據TruePrint的技術精確判斷指紋影像,TruePrint不僅僅可以辨識人類皮膚表層,還可以辨識皮膚表層以下,此項獨一無二的技術不論在任何時間或任何指紋下,都可準確的辨識任何人。目前AuthenTec的客戶包含宏碁、華碩、惠普、三星、LG等等。 除此案之外,AuthenTec尚有許多懸而未決的案子,在三月時,AuthenTec針對Atrua網站上所秀出的智慧型觸控面板手機,提出侵害AuthenTec指紋辨識技術的訴訟。
日本數位廳發布資料治理指引,協助企業運用資料提升企業價值日本數位廳發布資料治理指引,協助企業運用資料提升企業價值 資訊工業策進會科技法律研究所 2025年09月05日 隨著AI迅速普及已成為不可逆轉的趨勢,經濟與社會產生重大變革,手機、家電及各種智慧裝置大量蒐集資料,似已成為維持經濟與社會運作不可或缺的重要要素,在國際上已出現如歐洲共同資料空間(Common European Data Space)等先進的資料運用案例,日本亦開始推動企業跨領域資料運用,藉此提升企業生產力與附加價值[1]。 壹、事件摘要 日本數位廳(デジタル庁)於2025年6月20日發布資料治理指引(データガバナンス・ガイドライン),以企業經營者為適用對象,歸納總結資料治理之必要性、應採取之做法,與實踐治理過程中應留意之要點,協助企業推動數位轉型,發揮資料最大效用,持續提升企業價值,並進一步實現超智慧社會[2](Society 5.0)願景[3]。 貳、指引重點 本指引歸納總結實踐資料治理的四大支柱,概述如下: 一、設計符合跨境傳輸資料實際狀況之業務流程 資料共享與協作的主要目的是推動數位轉型與提升企業價值,因此,運用跨境資料時,需要調查當地國家或地區法規,釐清國際規範,並預測後續法規動向,克服法規限制。為評估運用跨境資料之潛在風險,則須透過如顧問公司、諮詢公司等第三方外部機構進行調查與監控,採取適當風險因應措施。為明確責任,須事先與資料共享之利害關係人,將瑕疵擔保責任透過契約與相關規定明文化。在修改業務流程時,亦須與相關組織及利害關係人共享資訊,確保資料在生命週期中的可追溯性[4]。 二、確保資料安全(データセキュリティ) 以資料生命週期為基礎,掌握運用跨境資料可能產生之風險,並依照相關組織與利害關係人值得信賴之程度,進行風險分析制定因應策略。針對業務流程中取得的資料,應限制在資料產生者允許之範圍內,始得進行運用,以維護資料使用正當性。此外,亦須特別留意資料完整性,確保資料來源值得信賴且未受到偽冒,以及資料內容未遭到竄改或洩漏[5]。 三、提升資料成熟度(データマチュリティ) 制定並推動可提升資料成熟度[6]之方針,持續改善流程,將資料價值最大化,並將風險最小化,提升企業綜合能力。資料長(Chief Data Officer, CDO)須發揮領導能力,建立能迅速因應變化的體制,明確各組織相關負責人與其角色,並推動具備資料相關技能之人才培育招聘計畫。資料長亦須分析導入如AI等先進技術之費用效益,向經營者提出建議。除了公司自身狀況會影響資料成熟度外,亦可能受到資料共享與協作之利害關係人的資料成熟度水準影響。因此,公司亦須將採取之具體措施與相關資訊分享予利害關係人,並向社會公開公司目前資料成熟度水準,持續強化企業與利害關係人及社會之間的相互信賴程度[7]。 四、制定並定期檢討AI等先進技術運用行動方針 為使AI等先進技術發揮最大力量,並降低對社會與個人可能造成的負面影響,企業應參考經濟產業省(経済産業省)於2025年3月28日發布之AI業者指引第1.1版[8](AI事業者ガイドライン第1.1版),並考量個人資料保護、機敏資料保護、透明度、可問責等重要因素,針對涉及資料運用的各種實務運用場景,由CDO主導制定運用AI等先進技術運用行動方針(AIなどの先端技術の利活用に関する行動指針),並適時檢討持續改善內容[9]。 參、事件評析 當資料留存在企業內部未被有效運用時,不僅會成為企業和產業發展之阻礙,也將導致社會整體效率低落。本指引歸納總結實踐資料治理的四大支柱。為達成協助企業運用資料推動數位轉型,提升企業價值之目標,除了需要企業管理階層主導,亦須獲得公司內部與利害關係人之理解與支持。企業應積極與其他企業、組織和機構進行資料共享與協作,積極參與資料治理,提高產品與服務價值及企業聲譽,進而促進社會永續性發展[10]。 隨著國際上已出現先進資料運用案例,我國亦須關注資料運用國際趨勢推動創新發展,日本推動企業跨領域運用資料之做法,亦可為我國未來實踐資料治理提供借鏡。 [1]〈データガバナンス・ガイドライン〉,デジタル庁,頁2-3,https://www.digital.go.jp/assets/contents/node/information/field_ref_resources/71bf19c2-f804-488e-ab32-e7a044dcac58/b1757d6f/20250620_news_data-governance-guideline_01.pdf (最後瀏覽日:2025/09/02)。 [2]〈Society 5.0〉,内閣府,https://www8.cao.go.jp/cstp/society5_0/index.html (最後瀏覽日:2025/09/02)。 [3]前揭註1。 [4]同前註,頁13。 [5]同前註,頁15-16。 [6]資料成熟度係指企業根據其戰略或經營需求,有效運用資料的能力。可參閱同前註,頁5。 [7]同前註,頁18-19。 [8]〈AI事業者ガイドライン〉,経済産業省,https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/20240419_report.html (最後瀏覽日:2025/09/02)。 [9]前揭註1,頁20-23。 [10]同前註,頁24-25。