合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2025/12/26)
引註此篇文章
你可能還會想看
美國商務部產業安全局擴大對中國半導體製造設備、軟體工具、高頻記憶體等項目之出口管制

.Pindent{text-indent: 2em;} .Noindent{margin-left: 2em;} .NoPindent{text-indent: 2em; margin-left: 2em;} .No2indent{margin-left: 3em;} .No2Pindent{text-indent: 2em; margin-left: 3em} .No3indent{margin-left: 4em;} .No3Pindent{text-indent: 2em; margin-left: 4em} 美國商務部產業安全局(Bureau of Industry and Security,簡稱BIS)於2024年12月2日發布《外國生產的直接產品規則補充以及先進運算及半導體製造項目管制精進》(Foreign-Produced Direct Product Rule Additions, and Refinements to Controls for Advanced Computing and Semiconductor Manufacturing Items),並於同日(12月2日)生效,部分管制措施的法律遵循延後至2024年12月31日。BIS開放公眾可以就本次管制提出意見。 因中國的半導體戰略旨在進一步推進中國的軍事現代化、大規模殺傷性武器(WMD)的發展,美國政府認為中國的相關政策與措施,將可能侵害美國及其友盟之國家安全。因此,本次管制之目的旨在進一步削弱中國生產先進節點半導體的能力,包括下一個世代的先進武器系統,以及具有重要軍事應用的人工智慧與先進運算。 為達上述目的,本次管制修正具體擴大的管制項目概述如下: 1. 24種半導體製造設備,包括某些蝕刻(etch)、沉積(deposition)、微影(lithography)、離子注入(ion implantation)、退火(annealing)、計量(metrology)和檢驗(inspection)以及清潔(cleaning)工具。 2. 3種用於開發或生產半導體的軟體工具。 3. 管制源自美國的高頻寬記憶體,以及於美國境外生產且美國管制清單中所列之高頻寬記憶體。 4. 新增對電子電腦輔助設計(Electronic Computer Aided Design)與技術電腦輔助設計(Technology Computer Aided Design)軟體及技術的限制。

美國環境保護署(EPA)發布顯著新種使用規則(SNURs),將影響單壁及多壁奈米碳管(Carbon Nanotubes)之使用

  美國環境保護署(Environmental Protection Agency,以下簡稱EPA)於2010年9月17日聯邦政府公報中,依據毒性物質管制法(Toxic Substances Control Act,以下簡稱TSCA)section 5(a)(2)授權,發布了顯著新種使用規則(Significant New Use Rules,以下簡稱SNURs)的最終規則(final rule)。此項規則於2010年10月18日生效,任何想要製造、輸入以及加工單壁奈米碳管(single-walled carbon nanotubes,以下簡稱SWCNTs)及多壁奈米碳管(multi-wall carbon nanotubes,以下簡稱MWCNTs)兩項化學物質者,必須依照TSCA section 5(a)(1)要求,在進行上述利用活動的至少90天前,報經EPA核准,否則不得使用。   事實上,EPA曾於前(2009)年6月24日發布上述SNURs的直接最終規則(direct final rule),徵詢公眾意見,並在同年8月21日撤回該規則。在重新提案的規則中,主要是新增SWCNTs、MWCNTs釋放於水中的顯著新種使用態樣,並將已完全反應、結合或嵌入已完全反應之聚合物基(polymer matrix)以及嵌入不再進行機械加工外其他處理之永久硬性聚合物形式(permanent solid polymer form)之SWCNTs、MWCNTs物質,排除在新SNURs適用範圍之外。   目前,依照TSCA section 5(e)之規定,若系爭之化學物質已列名於TSCA section 8(b)所建立之現存(existing)化學物質目錄(INVENTORY)中,其他化學物質生產者欲生產該種化學物質時,並不需再向EFA進行通報程序。然而,若EFA對該列名之化學物質曾發出TSCA section 5(e)下之具風險性命令(risk-based order),則相關之化學物質生產者須於生產前依據TSCA section 5(a)(2)規範中之SNURs規定通報EFA,使得EFA於生產前仍有再次檢驗該系爭化學物質的機會。   這一次,EPA以制訂SNURs之方式,要求所有製造、輸入、加工該項化學物質者,有義務通報任何與原同意命令所定條款不同的使用活動。這樣的規範變動,預計將對奈米材料的製造及運用活動造成不小的影響。

美國FDA計畫舉辦3D列印技術於醫療運用下之法制探討會議

  隨著3D印表機的價格日趨親民、3D列印設計檔案於網際網路交流越趨頻繁,以及預期3D列印技術在未來的應用會更加精進與複雜化,3D列印技術於醫療器材製造面所帶來的影響,已經逐漸引起美國食品藥物管理局(FDA)的關注。   在近期FDA Voice Blog posting中,FDA注意到使用3D列印所製造出的醫療器材已經使用於FDA所批准的臨床干預行為(FDA-cleared clinical interventions),並預料未來將會有更多3D列印醫療器材投入;同時,FDA科學及工程實驗辦公室(FDA’s Office of Science and Engineering Laboratories)也對於3D列印技術就醫療器材製造所帶來的影響進行調查,且CDRH功能表現與器材使用實驗室(CDRH’s Functional Performance and Device Use Laboratory)也正開發與採用電腦模組化方法來評估小規模設計變更於醫療器材使用安全性所帶來的影響。此外,固體力學實驗室(Laboratory of Solid Mechanics)也正著手研究3D列印素材於列印過程中對於醫療器材耐久性與堅固性所帶來的影響。   對於3D列印就醫療器材製造所帶來的法制面挑戰,在Focus noted in August 2013中,其論及的問題包含:藉由3D列印所製造的醫療器材,由於其未經由品質檢證是否不應將其視為是醫療器材?3D列印醫療器材是否需於FDA註冊登記?於網路分享的3D列印設計檔案,由於未事先做出醫療器材風險與效益分析,FDA是否應將其視為是未授權推廣等問題。   針對3D列印於醫療器材製造所帶來的影響,CDRH預計近期推出相關的管理指引,然FDA認為在該管理指引推出前,必須先行召開公聽會來援引公眾意見作為該管理指引的建議參考。而就該公聽會所討論的議題,主要依列印前、列印中與列印後區分三階段不同議題。列印前議題討論包含但不限於材料化學、物理特性、可回收性、部分重製性與過程有效性等;列印中議題討論包含但不限於列印過程特性、軟體使用、後製程序與額外加工等;列印後議題討論則包含但不限於清潔/多餘材料去除、消毒與生物相容性複雜度影響、最終裝置力學測定與檢證等議題。

美國國家標準與技術研究院公布物聯網設備核心網路安全基礎指南草案

  美國國家標準與技術研究院(National Institute of Standards and Technology, NIST)於2019年8月1 日公布「安全物聯網設備之核心網路安全特徵基準(Core Cybersecurity Feature Baseline for Securable IoT Devices)」指南草案,提出供製造商參考之物聯網設備網路安全基本要素,該指南草案中提出幾項重要核心要素如下: 設備辨識:物聯網設備必須有可供辨識之相關途徑,例如產品序號或是當連接網路時有具獨特性之網路位址。 設備配置:獲得授權之使用者應可改變設備的軟體以及韌體(firmware)之配置,例如許多物聯網設備具有可改變其功能或是管理安全特性之途徑。 資料保護:物聯網設備如何保障其所儲存以及傳送之資料不被未經授權者使用,應清楚可被知悉,例如有些設備利用加密來隱蔽其儲存之資料。 合理近用之介面:設備應限制近用途徑,例如物聯網設備以及其支持之軟體應蒐集並認證嘗試近用其設備的使用者資訊,例如透過使用者名稱與密碼等。 軟體與韌體更新:設備之軟體應可透過安全且可被調整之機制進行更新,例如有些物聯網設備可自動的自其製造商取得更新資訊,並且幾乎不需要使用者特別之動作。 網路安全事件紀錄:物聯網設備應可記錄網路安全事件並且應使這些紀錄讓所有人或製造商可取得,這些紀錄可幫助使用者與開發者辨識設備之弱點以近一步修復。

TOP