美國聯邦法官裁決AI「訓練」行為可主張合理使用

美國聯邦法官裁決AI「訓練」行為可主張合理使用

資訊工業策進會科技法律研究所

2025年07月07日

確立我國資料創新利用的法制基礎,建構資料開放、共享和再利用的各項機制,滿足民間及政府取得高品質、可信任且易於利用資料的需求,以資料提升我國數位發展的價值,並強化民眾權利的保障,我國於2025年6月16日預告「促進資料創新利用發展條例」,擬推動資料基礎建設,促進更多資料的釋出。

AI發展領先國際的美國,近日首次有聯邦法院對AI訓練資料表達肯定合理使用看法,引發各界關注[1]。我國已開始著力於AI發展所需的資料流通與有效利用,該判決將有助於啟示我國個人資料、著作資料合法使用之法制因應研析。

壹、事件摘要

2025年6月23日美國加州北區聯邦地方法院(United States District Court for the Northern District of California),威廉·阿爾斯法官(Judge William Alsup)針對Andrea Bartz、Charles Graeber、Kirk Wallace Johnson這三位美國作家,對Anthropic公司訓練大型語言模型(Large Language Model, LLM)時使用受其等著作權保護書籍一案,作出指標性的簡易裁決(summary judgment)[2]

此案被告掃描所購買的實體書籍,以及從盜版網站複製取得的受著作權保護的書籍,儲存在其數位化、可搜尋的檔案中,用來訓練其正在開發的各種大型語言模型。原告主張被當開發Claude AI模型,未經授權使用大量書籍作為訓練資料的行為,為「大規模未經授權利用」。法院則以四要素分析架構,支持合理使用抗辯(Fair Use Defense),強調AI訓練屬於技術發展過程中不可或缺的資料利用,AI公司於模型訓練階段使用著作權書籍,屬於「合理使用」(Fair Use),且具「高度轉化性」(Highly Transformative),包括將購買的實體圖書數位化,但不包括使用盜版,也不及於建立一個永久性的、通用目的的「圖書館(library)」(指訓練資料集)。

貳、重點說明

依美國著作權法第107條(17 U.S.C. § 107)規定,合理使用需綜合考量四要素,法官於本案中認為:

一、使用的目的與性質—形成能力具高度轉化性

AI模型訓練的本質在於學習語言結構、語意邏輯,而非單純複製或重現原著作。AI訓練過程將大量內容作為輸入,經由演算法解析、抽象化、向量化,最終形成轉個彎創造出不同的東西 (turn a hard corner and create something different) 的能力,屬於一種「學習」與「再創造」過程。AI訓練的目的並非為了重現原著作內容,而是為了讓模型具備生成新內容的能力。這種「轉化性」(transformative use)極高,與單純複製或替代原著作的行為有明顯區隔[3]

另外訓練過程對資料做格式變更本身並未增加新的副本,簡化儲存並實現可搜尋性 (eased storage and enabled searchability),非為侵犯著作權人合法權益目的而進行,亦具有轉化性 (transformative)。原告就所購買的紙本圖書,有權按其認為合適的方式「處置 (dispose)」,將這些副本保存在其資料集中,用於所有一般用途[4]

二、受保護作品的性質--高度創作性非關鍵因素

法院認同原告所主張的書籍是具有高度創意(creative)的作品理應享有較強的保護。但法院亦認為合理使用的四個要素,須為整體衡量,儘管作品本身具有較高的創意性,但由於使用行為的高度轉化性以及未向公眾直接重製原作表達,整體而言,法院認定用於訓練 LLM 的行為構成合理使用[5]

三、使用的數量與實質性--巨大數量係轉化所必要

法院認為AI模型訓練需大量內容資料,甚至必須「全書」輸入,看似「大量使用」,但這正是AI技術本質所需。AI訓練是將內容進行抽象化、數據化處理,最終在生成新內容時,並不會原封不動重現原作。所以,雖然訓練過程涉及全部作品,但AI模型的輸出並不會重現原作的具體表達,這與單純複製、重製作品的行為有本質區別[6]

四、對潛在市場或價值的影響

本案法院明確指出,人工智慧模型(特別是原告的Claude服務)的輸出內容,通常為全新生成內容,並非原作的精確重現或實質模仿冒,而且Claude服務在大型語言模型(LLM)與用戶之間加入額外功能,以確保沒有侵權輸出提供予用戶。因此,此類生成內容不構成對原作的替代,不會削弱原作的銷售市場,也不會造成市場混淆,而且著作權法保護的是原創而非保護作者免於競爭[7]

不過即便法院支持被告的合理使用主張,肯定AI訓練與著作權法「鼓勵創作、促進知識流通」的立法目的相符。但仍然指出提供AI訓練的合理使用(Fair Use)不代表資料來源的適法性(Legality of Source)獲得合法認定。沒有任何判決支持或要求,盜版一本本來可以在書店購買的書籍對於撰寫書評、研究書中的事實或創建大型語言模型 (LLM) 是合理必要 (reasonably necessary) 的。此類對原本可(合法)取得的圖書進行盜版的行為,即使用於轉化性使用並立即丟棄,「本質上」、「無可救藥地」(inherently、irredeemably)構成侵害[8]

參、事件評析

一、可能影響我國未來司法判決與行政函釋

我國於現行著作權法第65條規定下,須於個案交予我國法院認定合理使用主張是否能成立。本案判決為美國首個AI訓練行為可主張合理使用的法院見解,對於我國法院未來就對AI訓練資料取得的合法使用看法,顯見將會產生關鍵性影響。而且,先前美國著作權局之報告認為AI訓練過程中,使用受著作權保護作品可能具有轉化性,但利用結果(訓練出生成式AI)亦有可能影響市場競爭,對合理使用之認定較為嚴格,而此裁定並未採取相同的見解。

二、搜取網路供AI訓練資料的合理使用看法仍有疑慮

依據本會科法所創智中心對於美國著作權法制的觀察,目前美國各地法院中有多件相關案件正在進行審理,而且美國著作權局的合理使用立場較偏向有利於著作權利人[9]。相同的是,均不認同自盜版網站取得的資料可以主張合理使用。然而AI訓練所需資料,除來自於既有資料庫,亦多來自網路搜取,如其亦不在可主張範圍,那麼AI訓練的另一重要資料來源可能會受影響,後續仍須持續觀察其他案件判決結果。

三、有效率的資料授權利用機制仍是關鍵

前揭美國著作權局報告認為授權制度能同時促進產業發展並保護著作權,產業界正透過自願性授權解決作品訓練之方法,雖該制度於AI訓練上亦尚未為一完善制度。該裁決也指出,可合理使用資料於訓練AI,並不代表盜版取得訓練資料可以主張合理使用。這對於AI開發而言,仍是須要面對的議題。我國若要發展主權AI, 推動分散串接資料庫、建立權利人誘因機制,簡化資料查找與授權流程,讓AI訓練資料取得更具效率與合法性,才能根本打造台灣主權AI發展的永續基礎。

本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。

本文同步刊登於TIPS網站(https://www.tips.org.tw

[1]相關新聞、評論資訊,可參見:Bloomberg Law, "Anthropic’s AI Book-Training Deemed Fair Use by US Judge", https://news.bloomberglaw.com/ip-law/ai-training-is-fair-use-judge-rules-in-anthropic-copyright-suit-38;Anthropic wins a major fair use victory for AI — but it’s still in trouble for stealing books, https://www.theverge.com/news/692015/anthropic-wins-a-major-fair-use-victory-for-ai-but-its-still-in-trouble-for-stealing-books;Anthropic Scores a Landmark AI Copyright Win—but Will Face Trial Over Piracy Claims, https://www.wired.com/story/anthropic-ai-copyright-fair-use-piracy-ruling/;Anthropic Wins Fair Use Ruling In Authors' AI Copyright Suit, https://www.thehindu.com/sci-tech/technology/anthropic-wins-key-ruling-on-ai-in-authors-copyright-lawsuit/article69734375.ece.,  (最後閱覽日:2025/06/25)

[2]Bartz et al. v. Anthropic PBC, No. 3:24-cv-05417-WHA, Doc. 231, (N.D. Cal. June 23, 2025),https://cdn.arstechnica.net/wp-content/uploads/2025/06/Bartz-v-Anthropic-Order-on-Fair-Use-6-23-25.pdf。(最後閱覽日:2025/06/25)

[3]Id. at 12-14.

[4]Id. at 14-18.

[5]Id. at 30-31.

[6]Id. at 25-26.

[7]Id. at 28.

[8]Id. at 18-19.

[9]劉家儀,美國著作權局發布AI著作權報告第三部分:生成式AI訓練-AI訓練是否構成合理使用?https://stli.iii.org.tw/article-detail.aspx?no=0&tp=1&d=9352

你可能會想參加
※ 美國聯邦法官裁決AI「訓練」行為可主張合理使用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=9357&no=66&tp=1 (最後瀏覽日:2025/09/17)
引註此篇文章
你可能還會想看
Uber所使用的移動定位軟體被控侵權

  運輸公司Uber在其行動應用程式(app)中使用的移動定位技術被控侵權。原告Fall Line專利有限公司於今(2017)年7月10日美國東德州聯邦地方法院泰勒分院向Uber提起專利侵權訴訟。系爭美國專利號9,454,748(以下簡稱’748專利)的權利範圍涵蓋一種收集特定定位資料及相容於各種裝置的軟體,從而不需要再為了各種裝置重新設計新軟體。   Fall Line專利有限公司在訴狀中聲稱:「Fall Line專利有限公司是’748專利的專利權人,擁有所有實體權利。實體權利包括獨佔權及排他權,故Fall Line專利有限公司得以’748專利主張權利、對抗侵權者,對Uber的侵權行為提起訴訟。」Fall Line專利有限公司控訴Uber的行動應用程式可協助使用者以智慧型手機叫車,前往他們所在位置,侵害其’748專利。Uber的侵權行為已經造成Fall Line專利有限公司的損害,應對Fall Line專利有限公司給予適當補償,且補償金額不得低於合理權利金,及法院判決確定的利息及費用,另亦請求禁制令及陪審團審理。    此外,根據一項美國地方法院資料庫的檢索結果顯示,Fall Line專利有限公司今年到目前為止已經提起五件專利侵權訴訟,其中包括對精品國際酒店集團(Choice International Hotel)的控訴,而本案已是Uber今年第三起被控專利侵權的案件。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

何謂「三螺旋理論」

  三螺旋理論,又稱三螺旋創新模型理論(Triple Helix Theory),主要研究大學、產業以及政府以知識經濟為背景之創新系統中之型態關係,由Etzknowitz與Leydesdorff於1995年首次提出。   因應知識經濟時代來臨,三螺旋理論著重於政府、學術界與產業界(即為產、官、學)三者在創新過程中互動關係的強化。該理論探討如何協調產業、政府、學界三方於知識運用和研發成果產出上的合作;當社會動態產生改變,過去單一強大的領域將不足以帶動創新活動,推動創新也非單一方的責任,此時產業、政府、學界的三螺旋互動便隨之發生:大學透過創新育成機構孕育企業創新,而產業則扮演將研發成果商業化之要角,政府則透過研發相關政策、計畫或法規制定,鼓勵企業和大學間研究發展合作。   有別於早期經濟合作暨發展組織(OECD)將「產業」作為主要研發創新主體,三螺旋理論更重視產業、政府、學界三大主體均衡發展,三方主體各自獨立發展,且同時與其他方維持相互協力合作,共同推進經濟與社會之創新發展。   在三螺旋理論下,產、官、學因其強弱不等的互動狀態,形成不同的動態模型(例如國家干預模型、自由放任模型、平衡配置模型等等),這些動態模型被認為是產生創新的主要動力來源,對未來新知識和科技創造與擴散的能力以及績效具有決定性的影響力。

美國德州東區地方法院對Ericsson v. Samsung案發布反禁訴令,禁止援引中國法院禁訴令干擾美國法院對SEP管轄權

  美國德州東區聯邦地方法院於2021年1月11日對Ericsson v. Samsung案發布反禁訴令(anti-anti-suit injunction),禁止三星援引中國大陸湖北省武漢市中級人民法院作出之禁訴令(anti-suit injunction),以強制執行愛立信4G及5G行動通訊技術領域的標準必要專利(standards-essential patents, SEPs)。   本案源於三星與愛立信更新全球專利交叉授權契約時,雙方對於SEP授權價格是否符合公平、合理、無歧視(Fair, Reasonable and Non-discriminatory, FRAND)未能達成協議。故2020年12月11日,愛立信在美國德州東區地方法院對三星提起訴訟並為通知,請求美國法院確認愛立信的SEP授權符合FRAND;三星則於12月7日,選擇向中國大陸武漢法院提起訴訟,請求對愛立信裁定發布禁訴令,禁止愛立信在全球其他國家的法院另行提起SEP訴訟救濟,直到12月25日中國法院核准禁訴令後才通知愛立信。愛立信旋即於12月28日向美國法院提出暫時禁令和反禁訴令(禁止中國禁訴令干擾),美國法院立即同意核發暫時禁令,並於2021年1月11日核發初步禁制令,明定在美國一審判決結束前三星須遵守以下要求:(1)三星在中國武漢法院民事訴訟中的行動,不得干擾美國德州東區地院的合法管轄權;(2)禁止三星援引中國武漢法院禁訴令,剝奪或限制愛立信及其子公司在美國實施專利訴訟權利;(3)三星透過不公平的經濟影響力,迫使愛立信需繳納違反中國法院禁訴令罰款,三星應賠償愛立信因此所受損害。   另外,美國德州東區地方法院認為,本案兩法院間處理的是不同的法律爭議。三星是要求中國武漢法院針對愛立信4G及5G的SEP訂定全球授權價格;愛立信則是請求美國德州東區地方法院確認,兩家公司間的授權協商行為是否遵守FRAND。故美國法院並非要求三星撤銷中國大陸禁訴令,更無意介入中國法院的民事訴訟程序並阻止審查專利糾紛。美國法院核發反禁訴令的目的,是為了維護美國法院對訴訟的適當管轄權,以確保中國及美國二法院都能對本案進行訴訟。

FCC將電力線寬頻上網(BPL, Broadband over Power Line)服務分類為資訊服務

  FCC經過討論與投票,正式發佈命令將電力線寬頻上網服務分類為跨州資訊服務(interstate information service),而非電信服務,其他寬頻上網科技包括DSL、有線電纜線數據機寬頻上網亦被FCC分類為資訊服務。   過去幾年來,FCC一直大力支持電力線寬頻上網服務,期望電力線寬頻上網服務可以進入寬頻服務市場,與DSL和有線電視纜線數據機寬頻上網服務競爭,以增加寬頻服務市場之競爭,提高美國之寬頻普及率。而就此次所發佈之命令,FCC認為,將電力線寬頻上網分類為資訊服務將可使電力線寬頻上網服務受到較低的管制,有助於達成隨時隨地提供所有美國民眾寬頻接取之目標。其次,FCC在數位匯流時代之管制乃是期望能對於各種不同技術之寬頻接取平台給予一致的管制措施,並且對於相同之服務採取相同的管制方式。基於上述原因,FCC此次將電力線寬頻上網分類為資訊服務並不讓人感到意外。   FCC主席Kevin J. Martin進一步在其聲明中表示,雖然目前電力線寬頻上網人口並不多,然在2005年其成長率卻將近200%,顯見電力線寬頻上網服務之市場潛力不容忽視,將可幫助達成美國總統定下於2007年底前隨時隨地提供全國民眾寬頻網路接取之目標。

TOP