合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/11)
引註此篇文章
你可能還會想看
美國北卡羅萊納州將虛擬貨幣交易所納入貨幣傳輸法的適用對象

  為迎接數位貨幣此種新興產業所帶來的挑戰,在企業經營者與立法者的同意下,北卡羅萊納州於2016年6月通過H.B. 289法案,擴大該州貨幣傳輸法(Money Transmitters Act )的適用對象,將虛擬貨幣交易所納為貨幣移轉服務商,其須向主管機關申請特定執照,並繳納保證金,立法者更於2017年追加繳納保險金的規定,以避免資安危機。法案內對虛擬貨幣的定義為,一種能表彰價值的數字,可經由電子交易並具有交易媒介(medium of exchange)、計價單位(unit of account)和價值儲存(store of value)等功能,但虛擬貨幣並不是美國政府所承認的法定貨幣(legal tender status)。   又虛擬貨幣的經營業務,範圍包含建立於區塊鏈的虛擬貨幣活動,但排除挖礦者、使用區塊鏈技術的軟體公司,像是智能合約平台(smart contract platforms)、智能資產(smart property)等適用對象。申請貨幣移轉業務執照,須繳交1500美金的費用,再加上每年至少5000美元的評估費用。此外,為保障使用者所要求的保證金部分,貨幣移轉金額若低於100萬美元者,必須提出15萬美元作為擔保,若超出100萬美元者,則須提出更高的保證金。此項法案的出爐強化了法律的明確性,為該州經營虛擬貨幣的業者,提供一項可預見的規範,該法案未來是否能成為其他州成立新法的指標,仍有待後續發展。

新加坡將推動國家電子醫療紀錄

  新加坡自今年(2018年)1月5日起推動「醫療服務法案(Healthcare Services Bill)」之制定,該法案預計取代現有「私人醫院和醫療診所法(Private Hospitals and Medical Clinics Act)」。其中「國家電子醫療紀錄(National Electronic Health Record),下稱NEHR」將整合並改善國營醫療機構及非國營醫療機構兩種醫療紀錄無法互通之情形,而行動醫療及遠端醫療亦納入之。   根據目前之諮詢狀況(已於今年2月15日結束),提案單位衛生部(Ministry of Health)表示,由於現代醫療技術已趨近複雜,若能整合各醫療單位之就診紀錄,將可大幅提升醫療效率,特別是在急診的狀況下,整合過的單一病歷將可降低評估所需的時間。   而對於病患之個資方面保護,該部表示,首先,NEHR並不會蒐集全部患者的醫療參數,只有患者之核心醫療參數才會上傳至NEHR之資料庫內,此外亦不提供非醫療目的外之使用(例如就業及保險評估)。而為降低非法使用之機率,非法使用亦將處罰之。   另外為尊重病患個人之資訊自決權,NEHR亦提供了病患選擇退出機制(opt-out)以作為個資保護的最後屏障。然而該退出機制仍不同於一般的退出機制(即退出後不得蒐集、處理及利用),該機制僅禁止各醫療機構讀取該病患之醫療紀錄,但是各該機構依NHER之架構仍應將每次就診紀錄上傳之,此一設計係避免緊急情況下或病患同意讀取電子病歷時,卻無醫療紀錄可供查詢之窘境。

美國《確保關鍵礦產安全可靠供應的聯邦戰略》

  《確保關鍵礦產安全可靠供應的聯邦戰略》(A Federal Strategy to Ensure Secure and Reliable Supplies of Critical Minerals),為美國商務部於2019年6月4日發布的一項國家層級礦產行動計劃,制定依據為美國總統於2017年12月20日發布的13817號行政命令,戰略目標是強化美國製造業與國防工業及礦產供應鏈彈性,推進研究開發工作,減少美國對中國大陸等外國實體的關鍵礦產資源依賴。   美國商務部表示,確保關鍵礦產供應穩定及供應鏈彈性,對於美國經濟繁榮與國防安全至關重要,過去美國過分依賴外國關鍵礦產資源及供應鏈,導致經濟和軍事出現戰略性弱點。據統計共有35種與美國經濟與國家安全相關的礦產品,包括鈾、鈦和稀土元素,為智慧手機、飛機、電腦和GPS導航系統及風力發動機、節能照明與混合動力汽車電池等綠色科技產品的必要組成。35種關鍵礦產中有31種選擇進口,其中更有14種關鍵礦產是完全依賴國外進口。   《確保關鍵礦產安全可靠供應的聯邦戰略》提出6項行動綱領包括:(1)推動關鍵礦產供應鏈的轉型研究、開發與部署;(2)加強美國關鍵礦產供應鏈和國防工業基地;(3)強化與關鍵礦產相關的國際貿易合作;(4)提升對國內關鍵礦產資源知識;(5)提升在美國聯邦土地上獲得關鍵礦產資源的機會,並簡化授權開採的審查程序;(6)增加美國關鍵礦產資源勞動力等。

美國環保署擬針對兩項奈米材料納入顯著新種使用規則

  奈米材質之特性雖有助於開發新穎產品,但對於環境與人體健康是否會造成危害,迄今仍未有定見;為避免奈米科技毫無節制地發展,2008年9月以降,美國環保署(Environmental Protection Agency,EPA)以毒性物質管制法(Toxic Substances Control Act,TSCA)管理奈米材料,並在10月底考慮將奈米碳管納入前述法規中;11月初,更進一步依據毒性物質管制法5(a)(2)發布「顯著新種使用規則(Significant New Use Rule,SNUR)」,將以矽氧烷(siloxane)所改造之奈米矽微粒(silica nanoparticles)與奈米鋁微粒(alumina nanoparticles)列入管理範圍內。   一般而言,化學物質如未列於由EPA所公佈之「化學物質目錄」者,皆應向環保署提出製造前通知(Premanufacture Notice,PMN);而顯著新種使用規則以指定特殊新種化學物質的方式,配合適用製造前通知制度,要求業界針對製造、加工、銷售與使用等過程,提出具體因應措施。申言之,關於前述兩項奈米物質,一旦涉及有別於以往的重大創新製造活動,業者即應於正式進行製造前之90天先行通報環保署,再由其評估該業者是否符合相關條件要求,否則得予以禁止或限制之。   根據環保署既有之測試資料,可以確認奈米微粒得由呼吸與皮膚接觸等方式進入人體。以矽氧烷所改造之奈米矽及奈米鋁,泰半係作為添加劑之用;然而,觀察過往製造前通知所登載之內容,該兩項化學物質無論在呼吸或皮膚接觸所造成之暴露程度尚屬輕微;因此,針對該等奈米材料而向環保署所為之通報流程及審查作業,可能會對於業者後續之生產製造活動形成不確定的阻礙。   有鑒於奈米材料可能對人體健康產生未知風險,為保障奈米工作環境中人員的安全,顯著新種使用規則將於2009年1月起正式生效,作為管理特殊化學物質的監督方式。對於製造或使用奈米材料所可能引發之風險,美國環保署正著眼於環境、健康與安全議題,逐漸採取較為謹慎的政策設計方向,以維護大眾利益。

TOP