合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=66&tp=1 (最後瀏覽日:2026/02/23)
引註此篇文章
你可能還會想看
西班牙隱私保護專責機構對Google發動刑事制裁程序

  西班牙隱私保護專責機構「資料保護專員」(Data Protection Commissioner;一般多以其西班牙文縮寫AEPD簡稱之 ),針對Google街景服務(Street View)攝影過程中不當蒐集網路用戶資訊一事,於2010年10月18日對Google發動刑事制裁程序(criminal sanction procedure)。AEPD於其網站上發表聲明,其已經掌握Google涉及五項犯罪活動的證據,其中包括蒐集Wi-Fi用戶資訊並將相關資料傳送回美國等,AEPD已將相關證據資料提交馬德里法院。   Google街景服務提供全球諸多地區的地理圖片,但此一服務也引發人們對於侵犯個人隱私之擔憂。儘管Google先前已多次針對街景攝影車攫取Wi-Fi用戶未經加密訊息之行為進行道歉,但仍有諸多國家對於Google是否違反內國隱私保護法規展開調查。   此次AEPD採取法律行動前,事實上西班牙網路用戶權利協會已就相同問題Google提起訴訟,而西班牙法院亦於今年8月展開調查。AEPD對外表示,一旦法院認定Google犯罪情事屬實,各個犯罪行為將可處以6萬至60萬歐元之罰金。無獨有偶,加拿大政府亦於10月19日認定Google收集Wi-Fi用戶資料之舉動,屬於違法行為。

歐盟考慮設立中央網路犯罪防制機構

  歐盟部長理事會(Council of Ministers)已於今(2010)年4月27日要求執委會檢視其網路犯罪防制目標,並調查是否有需要設立一中央機構,以儘速達成下列幾項目標,包括:提高調查人員、檢察官、法官及法院相關人員的專業標準、鼓勵各國警方資訊分享以及協調歐盟27個會員國間打擊網路犯罪所採取之方式。   部長理事會提議由執委會進行設立專責機構之可行性調查研究,擬由該專責機構負責前述目標之達成,亦須評估並監督預防性與調查性措施之實行。該調查研究中應特別考量欲設立專責機構之目的、範圍及可能的經費來源,另外亦需考慮是否將其設置於位於海牙的歐盟刑警組織(European Police Office, Europol)中。考量網路犯罪跨國界之特性,為使打擊網路犯罪之相關措施更有效,必須有良好的國際合作及司法執行互助配合。部長理事會認為藉由專責機構之設立,不僅能夠協助培訓法官、警方及檢察官,亦能做為聯繫網路使用者、受害者組織及其他私部門的常設機構。   本部長理事會將歐盟現有之網路犯罪防制相關計畫分成短、中、長期計畫,要求執委會定期追蹤各項相關計畫之執行情況,亦將設立網路犯罪防制專責機構列入執委會後續四年所持續執行有關犯罪與安全治理的斯德哥爾摩計畫(Stockholm Programme)中。   此外,部長理事會也呼籲歐盟各國追蹤用於網路犯罪之IP位置及網域名稱,同時要求執委會協助建立共通的廢止機制,以進行網路犯罪防制。   位於希臘的歐盟網路與資訊安全機構(European Network and Information Security Agency, ENISA),是現階段歐盟網路犯罪防治的研究機構,其進行資訊安全威脅行為之調查,並提供相關建議,但僅是資訊服務單位,未實際投入打擊犯罪行動。

美國商務部產業安全局擴大對中國半導體製造設備、軟體工具、高頻記憶體等項目之出口管制

.Pindent{text-indent: 2em;} .Noindent{margin-left: 2em;} .NoPindent{text-indent: 2em; margin-left: 2em;} .No2indent{margin-left: 3em;} .No2Pindent{text-indent: 2em; margin-left: 3em} .No3indent{margin-left: 4em;} .No3Pindent{text-indent: 2em; margin-left: 4em} 美國商務部產業安全局(Bureau of Industry and Security,簡稱BIS)於2024年12月2日發布《外國生產的直接產品規則補充以及先進運算及半導體製造項目管制精進》(Foreign-Produced Direct Product Rule Additions, and Refinements to Controls for Advanced Computing and Semiconductor Manufacturing Items),並於同日(12月2日)生效,部分管制措施的法律遵循延後至2024年12月31日。BIS開放公眾可以就本次管制提出意見。 因中國的半導體戰略旨在進一步推進中國的軍事現代化、大規模殺傷性武器(WMD)的發展,美國政府認為中國的相關政策與措施,將可能侵害美國及其友盟之國家安全。因此,本次管制之目的旨在進一步削弱中國生產先進節點半導體的能力,包括下一個世代的先進武器系統,以及具有重要軍事應用的人工智慧與先進運算。 為達上述目的,本次管制修正具體擴大的管制項目概述如下: 1. 24種半導體製造設備,包括某些蝕刻(etch)、沉積(deposition)、微影(lithography)、離子注入(ion implantation)、退火(annealing)、計量(metrology)和檢驗(inspection)以及清潔(cleaning)工具。 2. 3種用於開發或生產半導體的軟體工具。 3. 管制源自美國的高頻寬記憶體,以及於美國境外生產且美國管制清單中所列之高頻寬記憶體。 4. 新增對電子電腦輔助設計(Electronic Computer Aided Design)與技術電腦輔助設計(Technology Computer Aided Design)軟體及技術的限制。

美國FDA發布「醫療器材單一識別碼系統」規則草案

  美國推動醫療器材「單一識別」(Unique Device Identification, UDI)系統已行之有年,藉由建立UDI系統,強化醫療器材錯誤回報(Adverse Event Report)以及上市後產品監督(Post-Market Surveillance)等相關資訊的流通,以保障病人的安全。2007年由美國國會所通過的《食品藥物管理法修正案》(Food and Drug Administration Amendments Act of 2007, FDAAA)第226項,修正《食品、藥物及化妝品法》(Federal Food, Drug, and Cosmetic Act , FD&C Act)新增第519項f款,提供美國食品藥物管理局(U.S. Food and Drug Administration, FDA)訂定「醫療器材單一識別系統」法規之法源基礎。另一方面,在美國國會的要求之下,FDA於2012年7月3日正式發布「醫療器材單一識別碼系統」規則草案,進行公眾預告與評論(Notice and Comment)程序。   FDA長期收集醫療器材產業、醫療社群、病人與消費者,以及產業專家之建議,而將這些建議呈現在規則草案內容中,目的在於減少廠商成本,並順利建置UDI系統,是故草案內容實採取某些公司實際使用的標準與系統經驗。FDA所發布的規則草案重點如下: 1.「單一識別碼」將分為「器材識別碼」(Device Identifier),包含特定器材的單一識別;「生產識別碼」(Production Identifier),包含器材的生產資訊。 2.將採取區分醫療器材風險程度之高低作為標準,分階段置入高風險的醫療器材的「單一識別碼系統」;低風險的醫療器材將有條件在部分或全部的規則中例外免除。 3.免除零售的非處方(Over the Counter)醫療器材適用此規範,係因這些器材尚有統一商品條碼(Universal Product Code, UPC)作為識別。   FDA宣稱,隨著系統的建置與規範的制定,絕大多數的醫療器材將必須具有統一的日期標準,包含標籤上的到期日;亦必須使UDI能夠容易閱讀,且能為系統自動識別與應用資料擷取技術,進一步成為全球UDI資料庫建置的標準。我國目前雖尚無UDI系統的相關法規範,但產業與主管機關已就相關議題進行討論,而FDA所發佈的規則草案之發展歷程,即可作為相關單位在制定法規之參考,藉此瞭解先進國家在此議題之發展,提早與先進國家之標準做接軌。

TOP