日本文化廳發布《人工智慧著作權檢核清單和指引》
資訊工業策進會科技法律研究所
2024年08月21日
日本文化廳為降低生成式人工智慧所產生的著作權風險,保護和行使著作權人權利,於2024年7月31日以文化廳3月發布的《人工智慧與著作權的思考》、內閣府5月發布的《人工智慧時代知識產權研究小組中期報告》,以及總務省和經濟產業省4月份發布的《人工智慧事業指引(1.0版)》的資料為基礎,制訂發布《人工智慧著作權檢核清單和指引》[1]。
壹、事件摘要
日本文化廳的《人工智慧著作權檢核清單和指引》主要分成兩部分,第一部分是「人工智慧開發、提供和使用清單」,依循總務省和經濟產業省4月份發布的《人工智慧事業指引(1.0版)》的區分方式,分為「AI開發者」、「AI提供者」、「AI(業務)使用者(事業利用人)」和「業務外利用者(一般利用人)」四個利害關係人,依不同的身份分別說明如何降低人工智慧開發前後的資料處理和學習等智慧財產權侵權風險的措施,以及提供和使用人工智慧系統和服務時,安全、適當地使用人工智慧的技術訣竅。
第二部分則是針對著作權人及依著作權法享有權利的其他權利人(例如表演人)的權益保護,從權利人的思考角度,建議正確理解生成式AI可能會出現什麼樣的(著作權)法律上利用行為[2]。其次,說明近似侵權的判斷要件、要件的證明、防止與賠償等可主張的法律上請求、可向誰主張侵權、權利主張的限制;於事先或發現後可採取的防止人工智慧侵權學習的可能措施;最後對侵權因應建議權利人可發出著作權侵權警告、進行訴訟、調解等糾紛解決,並提供可用的法律諮詢窗口資訊。
貳、重點說明
日本文化廳於此指引中,針對不同的角色提出生成式AI與著作權之間的關係,除更具體的對「AI開發者」、「AI提供者」、「AI(事業與一般利用人)」,提醒其應注意的侵權風險樣態、可能的合法使用範圍,並提供如何降低風險的對策。同時,從權利人角度提供如何保護權益的指引,並提供可用的法律諮詢窗口資訊。重點說明如下:
一、不符合「非享受目的」的非法AI訓練
日本著作權法第30條之4規定適用於以收集人工智慧學習資料等為目的而進行的著作權作品的複製,無需獲得權利人的授權,但是,該指引特別明確指出「為了輸出AI學習資料中包含的既有作品的內容,而進行額外學習;為讓AI產出學習資料庫中所包含的既有作品的創作表現;對特定創作者的少量著作權作品進行額外個別學習」,這三個情況係同時存有「享受」著作目的,不適用無須授權的規定[3]。
二、不能「不當損害著作權人利益」
從已經採取的措施和過去的銷售紀錄可以推斷,資料庫著作權作品計劃有償作為人工智慧學習的資料集。在這種情況下,未經授權以人工智慧學習為目的進行複製時,屬於「不當損害著作權人利益」的要求,將不適用(日本)著作權法第30條之4規定[4]。在明知某個網站發布盜版或其他侵害著作權的情況下收集學習資料,則使用該學習資料開發的人工智慧也會造成著作權侵權,人工智慧開發者也可能被追究著作權責任[5]。不應使用以原樣輸出作為學習資料的著作權作品的學習方法,如果該已訓練模型處於高概率生成與學習資料中的著作物相似的生成結果的狀態等情況下,則該已訓練模型可能被評價為「學習資料中著作物的複製物」, 對銷毀該模型的請求即有可能會被同意[6]。
三、使用生成式AI即可能被認定為可能有接觸被侵害著作[7]
權利人不一定必須證明「生成所用生成AI的學習資料中包含權利人的作品。如有下述AI使用者認識到權利人的作品的情況之一,權利人亦可透過主張和證明符合「依賴性(依拠性)」要件,例如:AI使用者將現有的著作物本身輸入生成AI、輸入了現有著作物的題名(標題)或其他特定的固有名詞、AI生成物與現有著作物高度類似等。
四、開發與提供者也可能是侵權責任主體[8]
該指引指出,除利用人外,開發或提供者亦有負侵權責任的可能,特別是--人工智慧頻繁產生侵權結果,或已意識到人工智慧很有可能產生侵權結果,但沒有採取措施阻止。於其應負侵權責任時,可能被請求從訓練資料集中刪除現有的著作權作品,甚至是刪除造成侵權的人工智慧學習創建的訓練模型。即便人工智慧學習創建的訓練模型一般並非訓練資料的重製物,不過如果訓練後的模型處於產生與作為訓練資料的著作權作品相似的產品的機率很高的狀態,該指引認為可能會被同意[9]。
參、事件評析
人工智慧(AI)科技迎來契機,其生成內容隨著科技發展日新月異,時常可以看見民眾在網路上分享AI技術生成的圖像和影音。是否能將AI生成的圖案用在馬克杯或衣服販售,或是將Chat GPT內容當作補習班教材,均成為日常生活中的訓練AI的資料與運用AI的產出疑義。
各國固然就存有人類的「創造性貢獻」是人工智慧生成結果是否受著作權法保護、可受著作權保護的條件,單純機械性的AI自動生成,基本上欠缺「人的創造性」,非著作權保護對象,已有明確的共識。如何以明確的法令規範降低AI開發過程的侵權風險或處理成本?賦予AI訓練合法使用既有著作,應有的界限?衡平(賦予)既有著作的著作權人權益?AI服務提供者應負那些共通義務?是否合理課予AI服務提供者應負之侵權損害責任?AI使用者之侵權責任是否須推定符合「接觸」要件?等等諸此進一步的疑義,則仍在各國討論、形成共識中。
而從日本文化廳的《人工智慧著作權檢核清單和指引》,我們可以清楚的看出,在樹立成為AI大國的國家發展政策下,其著作權法雖已賦予AI訓練資料合法的重製,但在指引是明列已屬「享受」目的訓練行為、不合理損害著作權利用的情況、明示開發服務者應負的揭露義務與可能承擔侵權責任,彰顯其對權利人權益平衡保護的努力。值得於我國將來推動落實AI基本法草案中維護著作權人權益原則時,做為完善相關法令機制的重要參考。
本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
[1] 文化庁著作権課,「AI著作権チェックリスト&ガイダンス」,令和6年7月31日,https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/seisaku/r06_02/pdf/94089701_05.pdf,最後閱覽日:2024/08/20。
[2] 詳見前註,頁31。
[3] 詳見前註,頁7。
[4] 詳見前註,頁8。
[5] 詳見前註,頁9。
[6] 詳見前註,頁9。
[7] 詳見前註,頁35。
[8] 詳見前註,頁36。
[9] 詳見前註,頁42。
英國國家統計局(Office for National Statistics)轄下之政府資料品質中心(Government Data Quality Hub)為實踐英國數位、文化、媒體暨體育部(Department for Digital, Culture, Media & Sport)發布之《國家資料戰略》(National Data Strategy),於2020年12月3日釋出《政府資料品質框架》(The Government Data Quality Framework),以達成國家資料戰略中「資料基礎(Data Foundation)」之核心目標。該框架提出「資料品質原則」(Data quality principles),旨在解決目前政府資料品質低落的問題。該原則包含以下五點: 一、確保資料品質:機關內部應建立有效的資料治理機制,例如培訓員工具備管理資料的能力、持續改進資料品質等。 二、了解使用者需求:機關應將使用者對資料品質的需求視為優先處理事項。 三、評估資料於資料生命週期各階段之品質:機關應密切關注資料於生命週期各階段之品質,並與使用者及利益關係人交換意見。 四、持續溝通資料品質:機關應持續與使用者交流資料品質現況,提供使用者有效的文件及中繼資料(metadata)。 五、了解造成資料品質低落的主因:分析造成資料品質低落的根本原因,從源頭徹底解決資料品質問題。 英國國家統計局政府資料品質中心希望藉由本框架揭示的資料品質原則,提升政府機關人員主動辨別及解決資料品質問題的能力,以改善政府資料品質、為人民帶來更高品質的資料,釋放資料價值並促進社會經濟發展。
美國傳播通訊委員會發動推展國家寬頻計劃美國聯邦通訊傳播委員會(FCC)於2009年04月08日宣佈開始推展國家寬頻計劃進程,以達到能使每位美國民眾均有能力負擔與使用寬頻網路的服務。 此項引發廣大爭議的寬頻計畫係植基於2009年的「美國經濟復甦與再投資法」(American Recovery and Reinvestment Act of 2009)─即眾所周知的「振興經濟方案」。在此之前,FCC曾於2007年04月根據1996年電信法第706節發佈法規制定提議意見調查書(NOI,FCC 09-31),希望蒐集各界對於以下四個問題的看法:1.) 何為「先進通訊服務」?;2.) 如何促進美國民眾先進通訊的使用;3.) 目前推動是否合理合時?4.) 何種方式可以更有效推動先進通訊服務發展。 此次,該計畫將獲得72億美元以實現下列要求:1.) 以最有效能與效率的方式確保全美民眾能接近使用寬頻網路服務;2.) 提出人民有能力負擔與寬頻服務最大效用化的策略;3.) 評估目前寬頻推展現狀(包括其他相關的計畫);4.) 如何運用寬頻網路服務以提升消費者權益、公民參與、公眾安全、社區發展、健康照護、能源獨立效率性、教育、員工訓練、私部門投資、企業活動、創造工作機會與經濟成長。 參眾兩院要求FCC必須在2010年02月17日前,將該最終方案遞交眾議院與參議院相關委員會審議。但是,有論者認為目前FCC的計畫與方向並未考量到終端使用者真正需求與如何使用該等科技;同時,歐巴馬政府針對寬頻網路議題未提供足夠的公民思辨機會,最後恐將事倍功半。
WIPO的廣播協議激怒了podcasters英國支持一項由智慧財產權組織(World Intellectual Property Organization/WIPO)草擬的廣電協議(Treaty on the Protection of Broadcasting Organizations),引起一陣反對聲浪。反對者聲稱,這無疑是送給大財團一項操控媒體內容製作的新權利。 2006年6月21日,在西班牙召開的此項協議的討論會議,賦予無線、有線廣電業者和網路廣播業者一項全新的智慧財產權利。業者將對他們所傳輸的任何作品,擁有「五十年、類似著作權的權利(copyright-like rights)」。此協議的目的是為了讓法律更合乎時代性,特別是要處理數位傳送上所產生剽竊數位訊號的問題。不過,網路廣播業者和podcasters卻擔心,如果WIPO將該規範擴張到網路,將使原無需經過授權散播的作品,或者內容是獲得「Creative Commons」授權,可無限制次數的發表,在某些情況下更可不付費的作品,反將經過網路廣播的傳送,讓一些團體組織獲得新的權利。如此一來,恐怕除了限制民眾獲取文化知識的自由外,更會讓那些原屬於創作者和公眾的權利,落入廣電業者手中。Podcasters認為,podcasting 和廣播不能相提並論,更不該受同樣法規的規範。
英國資訊委員辦公室(ICO)發布沙盒執行過程中所觀察到的關鍵議題2019年9月英國資訊委員辦公室(Information Commissioner's Office, ICO)啟動沙盒計畫(ICO Sandbox)測試階段(beta phase),由ICO所選10個測試專案,透過解決當今社會問題,例如如何減少暴力犯罪、大學如何促進學生的心理健康、新技術如何改善醫療保健等,期能促進公眾利益。 各專案在滿足創新性和可行性前提下,同時也面臨著複雜的資料保護議題,因此ICO持續與各專案溝通,提供其應用現有個資保護指引之建議,如歐盟一般資料保護規則之資料保護影響評估指導文件(Guide to the GDPR - Data protection impact assessment)、資料保護自我評估工具包(Data protection self-assessment toolkit)等。自2019年3月底開始(受理申請)迄今,ICO沙盒執行過程中所觀察到的關鍵議題如下: 公部門資料應用效益:部份參與者正在克服與公部門進行歷史資料共享,或是如何整合應用大數據等。個人資料與新技術應用,必須與資料主體的權利和自由進行權衡。 同意:確保各方對於「同意」(Consent)之理解,以弭平差異,同時向公眾提供透明資訊。 新技術的挑戰:應用語音生物辨識(voice biometrics)、臉部辨識技術(facial recognition technology, FRT)等,需要在適當基礎上處理特殊類別資料。 資料分析(Data analytics):以符合資料保護的方式進行資料分析,處理特殊類別資料的適法性,評估處理過程中的風險,並檢查可能用於資料分析的資料來源,確保符合目的之應用。 未來的6個月,ICO將持續與各專案合作,使其為有效的解決方案,為公眾提供創新合規之產品與服務,並成為未來結合資料保護和創新應用之規劃藍圖,以奠定隱私保護的基石。