合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/25)
引註此篇文章
你可能還會想看
美國食品藥物管理局修訂《臨床研究電子系統、電子紀錄及電子簽章:問答集》指引草案

美國食品藥物管理局(U.S. Food and Drug Administration, US FDA)於2023年3月15日修訂《臨床研究電子系統、電子紀錄及電子簽章:問答集》(Electronic Systems, Electronic Records, and Electronic Signatures in Clinical Investigations: Questions and Answers)指引草案,為試驗委託者、臨床研究人員、人體研究倫理審查委員會、受託研究機構及其他利害關係人統整電子系統、電子紀錄及電子簽章常見問答,供食品、醫療產品、菸草製品及動物新藥臨床研究參考。 本指引草案修訂2017年6月21日所發布的《21 CFR part 11臨床研究使用電子紀錄及電子簽章—問答集》(Use of Electronic Records and Electronic Signatures in Clinical Investigations Under 21 Part 11-Questions and Answers),並將於本指引最終版確定後,取代2007年5月10日所發布的《臨床研究使用電腦系統》指引(Computerized Systems Used in Clinical Investigations)。US FDA認為電子系統、電子紀錄及電子簽章是可信且可靠的,並且通常可等同於紙本紀錄及手寫簽名的方式。 本指引修正重點如下: 一、新增電子系統驗證的風險基礎方法,以確保臨床研究建立、修改、維護、歸檔、檢索、傳輸電子資料及紀錄的真實性、完整性及機密性。 二、統整試驗委託者與資訊科技服務供應商合作應注意事項,以確保電子紀錄符合監管要求。 三、新增數位健康科技(digital health technology, DHT)定義及使用DHT考量重點。 關於臨床研究使用DHT,亦可參考2021年12月23日所公布的《透過數位健康科技擷取臨床研究遠端資料》(Digital Health Technologies for Remote Data Acquisition in Clinical Investigations)指引草案。該指引草案針對DHT的選擇、驗證、應用、訓練及風險提供相關建議。於臨床研究使用電子系統、電子紀錄及電子簽章已為國際趨勢,對於各國相關規範值得持續關注。 本文同步刊載於stli生醫未來式網站(https://www.biotechlaw.org.tw)

2004年WIPO推出國際專利電子申請系統且申請數量激增

  世界智慧財產組織 (WIPO)於今年3月報導指出:WIPO於2004年推出了新的E-Pdoc申請系統,這一系統讓WIPO得以用電子形式接收、處理和發送國際專利優先權文件。有了此一電子申請系統,申請人可以要求同一件申請案以其在任何特定簽約國專利局首次提出申請的日期?國際專利申請日。如果申請得到有關國家專利局的專利授權,該先申請日還可以作?獲得國際專利有效保護的起始日期。    受到電子申請系統方便性之鼓舞, 2004年國際專利申請數量激增並正式突破了一百萬件申請的大關,同一年依據專利合作條約(PCT)規定所提交申請的數量也創下紀錄,共計12萬多件。其中美國繼續列在最大用戶榜首,但增長速度最快的是亞洲大陸─即:日本、韓國和中國大陸。

中國大陸專利局於2014年7月21日簽署「知識產權保險戰略合作協議」,落實創新驅動發展戰略

  中國大陸專利局與中國人民財產保險股份有限公司於2014年7月21日在北京簽署「知識產權保險戰略合作協議」,雙方將合作促進專利保險之發展。所謂專利保險係指在專利研發、專利申請、實施、讓與、使用或專利訴訟中,由於發生專利侵權的行為而提供的保險服務。然而,此次協議更包括專利保險政策擬定與政策環境營造、承保理賠流程之改善,並且試圖強化專利風險的宣導以提升企業管理專利風險的意識,最終目標是建立專利保險風險控制及分散機制。   相對於我國高科技產業於引進專利保險在分散專利風險上有正面的參考價值,但由於現行客觀環境下的條件較不完備,使得我國在推行專利保險上窒礙難行,主要原因在於法律制度的不同所產生的專利風險程度有異、無法準確計算保險標的鑑價制度等,但專利保險的概念早在1994年美國即已推出,又伴隨智慧財產權意識的高漲,各國也相繼推行,例如:英國推出的「專利申請保險」,以及日本推出的「知識產權授權金保險」等。因此,此次中國大陸亦擴大推行專利保險之政策,可謂與國際發展趨勢與整體智財法制建制有關,可供我國未來引進專利保險制度上試行之參考與討論。

中華人民共和國《出版管理條例》之介紹

TOP