合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/19)
引註此篇文章
你可能還會想看
Google提供免費大量的專利及商標資料

  美國專利商標局(下稱USPTO)於6月2日和Google簽訂一協議,為期兩年Google將免費協助USPTO提供超過10TB(terabytes)大量的專利及商標相關資訊,提供使用者一次下載大量資料。其下載網站為http://www.google.com/googlebooks/uspto.html,該網站載明,所有的原始資料都來自於USPTO,Google未修改任何資料,只將檔案轉為zip壓縮檔。   早期專利及商標的資料是由使用者付費後方可由政府的DVD取得,所以公司往往花費龐大的費用在於取得所需要的資料。   USPTO表示,IP群體渴望USPTO可提供大批機器可閱讀的格式,然而USPTO未具備相關的技術能力。目前此協議是過渡的解決方案,USPTO正發展策略,希望未來能讓合作承包商獲得大量專利商標相關資料,並提供給大眾使用。   Google工程經理Jon Orwant表示,Google非常高興能與USPTO合作,以促進專利及商標資料更具存取性(accessible)及有用性,更重要的為,使公開的資料更容易蒐集與分析。   為可經由Google下載相關專利及商標資料,包括已獲證圖像(grant images),已獲證全文(grant full text),已獲證目錄資料(grant bibliographic data),已公開申請案(published applications),轉讓(assignment),維護費用事項(maintenance fee events),USPTO Red Book及分類資料(classification information)等。USPTO表示,未來將與Google再合作提供額外的資料,包括專利及商標申請歷史檔案及其相關資料。

美國為加強聯邦補助生物科研之安全性而提出新規範

中國大陸國家食品藥品監督總局為落實食品安全法所涉保健食品管理項目,修訂《保健食品備案工作細則》

  中國大陸食品及保健食品法制主要規定於《中華人民共和國食品安全法》、《食品生產許可管理辦法》、《保健食品註冊與配案管理辦法》及《食品生產許可審查通則》。惟,近年來,中國大陸國家食品藥品監督總局因應日前食品安全法修正 ,為進一步落實其所涉之保健食品備查及管理項目之執行,補強保健食品之法制缺口,即依據《保健食品註冊與備案管理辦法》訂定《保健食品備案工作細則》,另於今年度(2017)年2月7日公布該細則內容,進行為期一個月之公眾意見徵集。《保健食品備案工作細則》共分為八個章節,依序規範保健食品所涉之備查項目、相關適用資格及應備齊之文件,例如:中國大陸製造及生產之保健食品之特殊備查要求、外國進口之保健食品備查要件…相關變更及效力等多項內容。茲就重要內容說明如下: 一、適用範圍及基本原則 凡用於凡於中國大陸境內生產製造或欲進口之保健食品皆適用之。並應當遵循規範統一、公平公正之備查原則保健食品備查。 二、保健食品備查概念 係指保健食品生產企業應依據辦法及細則規定之法定程序、要件,將可茲證明該項產品之安全性、功能性等相關資料及應備文件提交權責當為進行存檔備查之過程。 三、食品藥品監督管理部門之權責 中國大陸國家食品藥品監督總局為保健食品註冊及備查之主管單位、應對各省、自治區、直轄市食品藥品監督管理部門之保健食品註冊及備查相關項目具有指導監督之責。

基因資訊醫療運用與業務過失

TOP