合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/01/24)
引註此篇文章
你可能還會想看
歐盟理事會通過爭議不斷的歐盟數位單一市場著作權指令

  為了使歐洲的著作權法規更符合數位時代及單一市場所需,歐盟執委會(European Commission)於2016年9月所提出的「數位單一市場著作權指令」(The Directive on Copyright in the Digital Single Market)提案,於今年2月13日由歐洲議會(European Parliament)與歐盟理事會(Council of the EU)、歐盟執委會達成最終協議,歐洲議會與歐盟理事會並分別於3月26日及4月15日通過提案,歐盟理事會於4月17日簽署正式指令。新指令的重點內容包含: 文字與資料探勘(Text and data mining):第3條規定,研究組織為了科學研究而需對文字與資料探勘時,得例外對著作進行重製、擷取(extraction)。 強化著作人和表演者在數位環境中的地位:第14條規定,當著作人和表演者將著作權讓與或授權給出版商後,出版商必須定期向著作人和表演者告知這些著作的利用情形。另外,第15條規定,如果著作人和表演者覺得先前約定的報酬太低時,可以要求與出版商重新磋商更公平且適當的報酬。 賦予新聞內容重製權及向公眾傳播權:規定於第11條,使用新聞的內容(尤其網路新聞)時,須向新聞出版者取得重製權及向公眾傳播權的授權。另外,本次通過的正式指令,已無之前提案中具有爭議的「須得到新聞出版者同意才能使用新聞頁面超連結」條文內容,而無先前的超連結稅(Link Tax)爭議。 網路服務提供者義務:第13條規定,網路服務提供者如Instagram、YouTube等,有義務透過有效的機制,迅速刪除未經著作權人授權許可的內容,並防止這些未經授權的內容重新上架,以保護著作權人的利益。   不過,從歐盟執委會提案之後,第13條就引起了德國民眾的強烈反彈,從今年2月最後一個禮拜開始,德國各大城市展開了一連串名為「反對歐盟著作權改革法案」(gegen EU-Urheberrechtsreform)的抗議活動,包含線上連署及上街遊行,並已擴散至其他歐盟會員國。抗議訴求認為,使用所謂的「上傳過濾器」(Upload-Filter)會對網路的言論自由和多樣性產生巨大影響,由於在實際操作上,網路服務提供者只會依據著作權人所提供的著作授權清單,利用上傳過濾器自動過濾未得到授權的內容,因此經合法使用其他著作後所創作的新著作(例如文章內含有合法引用的內容),可能會成為被過濾、刪除的對象,因為上傳過濾器可能無法判別法定例外的合法使用。所以上傳過濾器被認為是有爭議的審查手段。   雖屢有爭議,但本次通過數位單一市場著作權指令,使歐盟的著作權法規更能適應當今數位世界,在音樂串流服務、影音點播平台、新聞彙整平台、以及各種社群平台已成為人們接觸著作和新聞的主要門戶時,加強網路使用者享有的自由和權利,創作者也將獲得更好的保護和報酬,以創造更繁榮的網路經濟。

營業秘密管理概要

日本經產省發布《資安產業振興戰略》,強化資安產業與技術基礎

日本經濟產業省(簡稱經產省)於2025年3月5日發布《資安產業振興戰略》(サイバーセキュリティ産業振興戦略),目前日本大多使用海外製造的資安產品,且相當重視使用產品的實際體驗,進而導致日本國產資安產品難以銷售獲利,陷入缺乏資金開發投資的惡性循環,為求打破現狀促進日本資安產業發展,具體因應政策如下: 1. 創造有利資安新創企業進入市場的環境:彙整具有前景的資安新創企業名單,提供予政府參考,讓政府率先試行導入資安新創企業提供的產品與服務,展示實際使用資安產品與服務的成果,藉此提升資安新創企業知名度,降低其進入市場的難度。 2. 發掘具有潛力的技術及具市場競爭力之產品或服務:實施競賽形式的獎金制度,發掘可提升資安、解決問題,對社會具有貢獻的技術,並推動約300億日圓的研發計畫,促進技術實際落地運用,改善不利開發投資的環境。建立系統整合商、日本國產產品與服務供應商之間的媒合機制,讓供應商可在產品銷售過程中發揮影響力。 3. 充實高階專業人才拓展國際市場:擴大高階專業人才培育計畫,提升並宣傳資安人才的職業魅力,支援產業向海外發展,與合作國家共同促進企業與人才交流,以因應資安產業整體基礎不足,難以培育人才,拓展國際市場等問題。

93年國人申請發明專利數量大幅成長28.39﹪ 創新研發成果明顯躍進

  93年專利申請統計資料顯示我國受理專利申請案總數、發明申請案數量、及國人發明申請案等指標,均呈現相當幅度成長,顯示我國過去幾年官方與民間投資創新研發成果有明顯成長。    93年專利、商標申請與核准統計出爐,全年專利新申請案件總數72,105件,較92年的65,742 件增加6,363件(9.68﹪),本國人申請案43,038件,外國人29,067件。其中屬技術強度較高的發明申請案件總數計41,930件,較前一年增加6,107件(17.05﹪);本國人發明申請案16,754件,較前一年大幅增加3,705件(28.39﹪),顯示我國產業研發技術成果有向上提昇的趨勢。93年專利發證數66,415件,比92年大幅增加24,333件(57.82﹪),此係因93年7月專利法修正實施,新型專利改採形式審查,縮短專利審查時程,及專利廢除異議制度改採繳費後公告同時發證的制度轉換短期影響。    93年商標申請案依類別統計為72,650件,比92年申請案件數65,907件,增加6,743件(10.23﹪),;93年商標公告註冊案計54,912件,較前一年74,572件減少19,660件(-26.36﹪);依類別計55,986件,均較前一年減少。不論是在申請或公告註冊數都是以本國人佔絕大多數。商標申請於92年底開始實施一申請案多類別制度,不同類別毋需另提出一獨立申請案,因此依類別統計數會比申請案件數多。

TOP