合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/01/12)
引註此篇文章
你可能還會想看
中國國務院發布AI行動意見,全面推動智慧應用加速現代化建設

中國國務院發布AI行動意見,全面推動智慧應用加速現代化建設 資訊工業策進會科技法律研究所 2025年12月10日 隨著人工智慧(下稱AI)技術的快速發展,全球各國政府均積極推動AI在百工百業各領域的應用,以提升國家創新力、產業競爭力與社會治理效能,中國政府亦是如此。同時,受地緣政治及經貿競爭的影響,中國政府為強化國家供應鏈安全與韌性,由政府主導加速現代化建設,以推動智慧社會新型態的發展為目標。 壹、事件摘要 中國國務院於2025年8月26日發布「關於深入實施人工智能+行動的意見」(國發[2025〕11號)(下稱行動意見)[1],旨在全面推動AI應用於各行各業,以提升國內產業生產力與創新量能,並促進人機協作的智慧社會新型態,作為推動「中國式現代化」發展之重要建設。 貳、行動意見重點內容 於該行動意見中,中國國務院提出三項階段性目標,分別為: 一、 2027年前:AI應用普及率達70%以上 推動科技、產業、消費、民生、治理與全球合作的6大核心領域全面結合AI應用,擴大AI使用普及率達70%以上,以達加速公共治理與產業創新之成效。 二、 2030年前:AI應用普及率達90%以上 強化前述6大核心領域,持續擴大AI使用普及率可達90%以上,實現研發成果共享之效益。 三、 2035年前:AI應用普及率達100% 建立全面人機協作之智慧經濟與社會新型態,作為國家現代化建設之重要基礎。 為實現前述三階段目標,中國政府針對6大核心領域提出具體行動方向,重點整理如下: 一、 AI+科學技術 為加速科研進程並推動大模型建設與應用,將強化基礎科學研究平台和重要科技基礎建設的智慧化升級,打造開放式且高品質的共享資料集,以促進AI跨領域的結合發展。同時,亦積極促進AI帶動研發模式創新與效能的提升,以加速技術研發和產品應用落地。 二、 AI+產業發展 鼓勵企業將AI導入內部策略規劃、組織架構與業務流程設計等,以建構創新的商業模式;並在技術、產品與服務體系中推動智慧化應用,強化供應鏈各環節與AI的協作,同時最佳化工業、農業及服務業的生產與服務模式,藉以帶動傳統產業轉型升級,建構新型生態體系並加速整體產能提升。 三、 AI+消費增質 透過推動AI與服務的結合,建立多元及智慧化的服務模式,加速發展智慧消費相關基礎建設;此外,推動AI應用於各類商品與設備,重點發展智慧聯網汽車、智慧機器人、智慧家居、智慧穿戴等終端商品,加速技術融合與產品創新,以提升人民生活的品質。 四、 AI+民生福祉 透過推動人機協作的模式,提供新型的工作、學習與生活型態,建立更具智慧化的社會發展模式。例如,企業雇主可藉由AI協助建立新型組織架構和管理模式,提升傳統職務執行之效率,亦或是透過AI進行技能培訓以因應勞動力短缺之情形;學校教育面向則可推動AI融入教學教材,推動更加多元與互動之學習生態;生活方面則計劃推動AI健康照護、社會服務等領域廣泛應用,全面提升公共服務與生活品質,形成具包容性的智慧化社會。 五、 AI+智慧治理 推動AI全面導入社會治理過程,以促進市政管理、政務服務及公共資源運作的智慧化轉型,並利用AI強化公共安全與網路安全治理能力,完善國家安全防護的機制;於生態層面,將運用AI推動綠色永續與人機協作,強化於環境與碳管理領域的監測、預測及治理能力,促進高效及精準的治理模式。 六、 AI+全球合作 推動AI的普及與共向,建立開放生態系、強化運算能力、資料與人才領域的國際合作,共同提升全球南方AI基礎建設,縮減全球數位落差,協助各國可平等參與智慧化發展過程,共同因應AI應用相關風險,確保技術發展安全且可信賴地發展。 參、事件評析 從上述中國國務院發布之行動意見可知,其目標在於藉由強化安全及可信賴的AI,並促進AI應用於各領域的發展,以建構可持續性的智慧化生態系,提升社會治理效率與全民生活的品質,以利國家經濟與科技的共同發展。 然而,該行動意見雖明確提出國家整體目標及治理方向,為相關領域的智慧化發展提供指引,惟對於各項目標尚未提出可操作性措施、具體政策細節,或對產官學各單位可獲得的政府資源、技術支持與協助等進行明確規範。故後續仍需持續關注相應政策措施及配套資源的發布,以評估其實際推動AI應用之成效。 [1]《国务院关于深入实施“人工智能+”行动的意见》(國發[2025]11号)。

中國大陸法院認定AI創作可受著作權法保護

中國大陸法院認定AI創作可受著作權法保護 資訊工業策進會科技法律研究所 2023年12月05日 近期生成式AI的工具運用,無論是生成文字的ChatGPT、生成圖像的Midjourney及生成影片的Pictory,技術一日千里,蓬勃發展;其應用已逐漸進入一般人的生活領域網,而且產生AI產出的侵權爭議,滋生運用AI創作的生成內容是否可主張著作權之疑義。我國經濟部智慧財產局於今(112)年6月以經授智字第11252800520號令 函指出--「AI利用人如係單純下指令,並未投入精神創作,由生成式AI模型獨立自主運算而生成全新內容,該AI生成內容不受著作權法保護。」採取否定見解 。不過其前提係「單純下指令,並未投入精神創作」,適於日前中國大陸北京互聯網法院於11月27日以(2023)京0491號民初11279號民事判決 認為如可認定屬「非機械性智力成果」,運用AI生成的圖片仍可受著作權保護。 壹、事件摘要 本案起因於原告將其使用開放原始碼的Stable Diffusion以輸入提示詞的方式,生成「春風送來了溫柔」之少女人像圖,並發布於網路平台。原告於事後發現,被告將該圖原有的原告署名浮水印(平台所發予的用戶編號)截除,並使用於其在網路上發布的文章中使用該圖做為插圖。原告因此提起姓名表示權與網路傳輸權的侵權訴訟。 被告主張系爭圖片具體來源為網路取得,已無法識別來源與浮水印,並不能確定原告是否享有圖片之權利;而且其所發布的主要內容為原創詩文,並非系爭圖片,亦未做為商業用途,並無侵權故意。 原告於本案中提出生成過程的影片佐證資料,北京互聯網法院認定呈現下列具體生成(取捨、選擇、安排與設計)步驟: 一、選擇前述軟體程式提供的模型,初步決定畫面最終生成的可用素材,決定作品的整體風格、類型。 二、為展現一幅在黃昏的光線條件下具有攝影風格的美女特寫所需,輸入有關類型、主體、環境、構圖、風格的提示詞,包括:「超逼真照片」與「彩色照片」類型;「日本偶像」主體並詳細描繪臉部皮膚、眼睛、辮子等細節;「外景」、「黃金時間」與「動態燈光」之環境提示;「機前瀏覽(眼看鏡頭)」、「酷姿勢」為構圖提示;「底片紋理、膠卷仿真」等風格提示。另並進行輸入反向指令提示,包括:繪畫、卡通、動漫等要求,以避免此類風格出現於生成內容。 三、進行相關參數設定,以及多次試驗的調整,包括採樣方法、清晰度、圖形比例等不同參數設置。 貳、重點說明 北京互聯網法院根據原被告的陳述與提供的證據資料,認定原告的AI生成圖構成作品(受著作權保護),且原告享有該作品之著作權: 一、法院首先提出四個認定是否構成作品的判斷要件:1.是否屬文學、藝術、科學領域;2.是否具有獨創性(原創性);3.是否具有一定的表現形式;4.是否屬於智力成果。同時認為本案須審酌的重點在於獨創性與是否屬於智力成果。 二、關於「是否屬於智力成果」,法院認為從原告構思圖片到最終圖片選定為止,原告進行了一定的智力投入,例如設計人物的呈現方式、選擇提示詞、安排提示詞的順序、設置相關的參數、選擇符合預期的生成內容,已具備本要件。 三、至於「是否具有獨創性」,法院認為非有智力投入的都具有獨創性,如「按照一定的順序、公式或結構完成的作品,不同的人會得到相同的結果」,則屬「機械性的智力成果」,並不具有獨創性。但運用AI生成過程若能「提出的需求與他人越具有差異性,對畫面元素、布局構圖描述越明確具體」就越能呈現人作者的個性化表達。因此,法院認定原告雖然AI創作沒有使用畫筆,也與過去使用繪圖軟體不同,但原告對於人物及其呈現方式透過提供進行設計,並透過反覆的修改參數、調整修正,這過程呈現原告的審美觀,而亦可見不同人使用該AI工具可以自行生成不同的內容,故該作品「係由原告獨立完成、體現了原告的個性化表達」。 四、針對原告是否享有該圖作品的著作權,法院採肯定看法認為: 1.雖原告使用AI工具的行為類如委託他人設計,於委託時該是受託人為創作人,但委託與AI工具區別在於委託人具有自主意志,AI工具本身並沒有,不是自然人或法人等民事主體,依法(中國大陸著作權法)該AI工具本身無法成為作者而享有著作權。 2.事實上仍是人以工具進行創作,而工具的設計者亦已於GitHub論壇的授權條款中揭示該工具的授權人並不對使用者所生成的內容主張權利。 3. AI工具的設計者本身並沒有創作該圖的意願,亦無預先設定後續生成內容,未參與創作的生成過程,其訓練雖然是投入相當大的心力,但投入的是在工具的創建而非特定內容的生成。 參、事件評析 本案最終由原告獲得勝訴,法院認定被告侵害其姓名權與公開傳輸權,雖然法院認為使用AI工具的行為類如委託他人設計,於委託時該是受託人為創作人,但也認為AI工具本身並沒有自主意志,不是可享有著作權利的主體,依法(中國大陸著作權法)該AI工具的使用本質仍是人以工具進行創作,而工具的設計者並沒有生成內容的意思與投入,故應由多次修改呈現其個人表達念的使用者取得著作權。本文認為可以從此判決中獲得下述啟示: 一、對初次生成結果進行修改指令是取得原始性的重點:現今AI工具的使用,如要求程度不高,其實只須簡單的指令,例如生成一個xx的圖片,即可產生一張可用的圖片,但此時AI生成的內容僅是「按照一定的順序、公式或結構完成的作品,不同的人會得到相同的結果」,屬「機械性的智力成果」,將不具有獨創性。 二、反覆修改、調整參數呈差異化,即便是AI生成亦獲保護:運用AI生成過程應力求與他人的使用具有差異性,對畫面元素、布局構圖描述越明確具體,越能呈現人個性化表達,始能取得著作權保護。而反覆的修改參數,例如視線角度、光影呈現方式、表情姿勢要求等圖片的細節呈現,強化呈現個人化的思想、表達、創作投入,即可獲得著作權保護。 三、AI生成世代的著作保護更須重視創作歷程的存證:本案原告取得勝訴的重要關鍵,在其於本案中提出生成過程的影片佐證資料,證明其使用過程的需求(在黃昏的光線條件下具有攝影風格的美女特寫)、取捨(輸入反向指令提示,包括:繪畫、卡通、動漫等)、選擇(「日本偶像」主體並詳細描繪臉部皮膚、眼睛、辮子等細節)、安排與設計(「機前瀏覽(眼看鏡頭)」、「酷姿勢」等構圖)步驟呈現其多次試驗的調整的事實證明,若無此佐證影片,單依生成結果難以證明其創作投入,訴訟結果可能會變成敗訴。 四、AI生成工具的使用須注意生成結果的權利歸屬約定:即便本案針對原告使用AI生成工具的生成結果可受著作權保護,但原告是否享有該圖作品的著作權,法院再次確認工具的設計者的授權條款並沒有對使用者所生成的內容主張權利,若該條款約定使用者不依法可享有的內容權利,使用者的權益將受影響,是必須特別要注意的事情。 如同北京互聯網法院在判決中提及的,在照相機出現之前,人們需要高度的繪畫技術才能再現物體形象,但即便出現智慧型手機亦不影響我們運用它產生有獨創性的作品而構成攝影著作。可預見的未來AI技術會越發達,人的投入會越少,但這並不影響著作權制度鼓勵作品創作的立法意旨,只要有創作性的投入,即便只是反復的指令下達,也仍是受著作權法保護的獨特的個人作品。 [1]詳見臺灣智慧財產局頒布函釋說明生成式AI之著作權爭議,理慈國際科技法律事務所,https://www.leetsai.com/%E8%91%97%E4%BD%9C%E6%AC%8A/interpretation-released-by-taiwans-ipo-to-clarify-copyright-disputes-regarding-generative-ai?lang=zh-hant,最後瀏覽日期2023/12/04。該文提及的智慧財產局令函,本文未能於於該局之著作權函釋系統中檢索到。 [2]該局111-10-31以電子郵件1111031號令函提及有關人工智慧(AI)的創作,如是「以人工智慧為工具的創作」,也就是人類有實際的創意投入,只是把人工智慧(例如:繪圖軟體)當作輔助工具來使用,在這種情形依輔助工具投入創作者的創意而完成的創作成果仍可以受著作權保護,著作權則由該投入創意的自然人享有,除非有著作權法第11條及第12條之情形。 [3]判決全文詳見https://mp.weixin.qq.com/s/Wu3-GuFvMJvJKJobqqq7vQ,最後瀏覽日期2023/12/04。

加州法院判決刪除公司電腦之個人資訊非屬犯罪行為

  美國加州北區聯邦地方法院,於去年(2017年)12月5日做出關於雇員刪除其由公司提供電腦中與公務無關資料是否屬電腦犯罪之判決(United States v. Zeng, 4:16-cr-00172(District Court, N.D. California. 2017).)。   該案情為曾(Zeng)氏為避免其竊取自家公司商業機密行為被揭發,而逕自刪除其在公司提供筆記型電腦內之相關資料。而嗣後仍然被公司發現並報案,於此偵查單位FBI則以曾氏違反電腦詐欺及濫用法案(Computer Fraud and Abuse Act,下稱CFAA)中「未經授權而毀損他人電腦(18 U.S.C. § 1030(1984).).」以美國政府名義(下稱控方)起訴曾氏刪除其犯罪證據之行為。   對於該控訴,被告曾氏以被刪除之電子紀錄與其業務無關,非為公司所有財產為由作為抗辯。此外曾氏同時以其他判決主張毀損電腦之定義應係指由外部傳輸行為所致(如駭客行為),電腦使用者自己刪除行為應不包含之,以及控方未舉證其刪除行為將導致公司有不可回復或無法替代之損害作為抗辯。於此,控方則以刪除行為不應以內容而有所區分作為回應。   在審理期間,承審法官多納托(Donato)氏除參酌控辯雙方證詞外,並特別詢問控方律師指控內容是否會對一般大眾造成其在公用電腦中刪除同類資訊上之顧慮。而控方則以曾氏行為屬特殊情況作為答辯。最後,多納托氏則以控方主張將造成社會恐慌以及控方未提出被告刪除資料行為究竟對公司有何實際損害,判決被告無罪。

銜接實體與虛擬的新票據交換制度-美國二十一世紀支票交換法

TOP