合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=66&tp=1 (最後瀏覽日:2025/04/04)
引註此篇文章
你可能還會想看
協助中小企業因應國際綠色產品輔導措施

  自 92 年歐盟公告「廢電機及電子設備指令」( WEEE )及「電機及電子設備使用某些危害物質限制指令」( RoHS )以來,國際大廠紛紛制訂各種綠色採購標準以要求供應鏈體系符合無毒性、可回收及省能源的目標。回顧 94 年台灣電機電子產品輸歐出口值為新台幣 2,334.27 億元,影響廠商家數為 31189 家,因此這兩項指令執行之後,對台灣產業的衝擊影響甚鉅。   為協助國內中小企業因應歐盟 RoHS 指令之執行,經濟部中小企業處自 93 年起即已開始進行相關輔導工作,解決中小企業在面對綠色採購要求所遭遇之問題,如:法規環境、客戶要求、管理制度、人力資源等,藉由綠色供應鏈輔導,提升中小企業對綠色產品的認知,塑造優質而有效率的綠色供應鏈環境,以強化中小企業綠色競爭力。   隨著歐盟指令的推行已逐漸從資訊產品等 3C 大廠擴散到小型家電、玩具運動器材及電動工具等中小型企業規模,因此經濟部中小企業處將持續辦理輔導中小企業進入綠色材料與供應鏈體系,以及清查限用物質診斷、成立網路顧問團提供諮詢、綠色材料及供應鏈人才培訓、建立綠色供應鏈稽核訓練系統、示範觀摩及成果擴散等工作。   綠色產品趨勢已是不可擋的潮流,隨著今年 7 月 1 日 RoHS 指令的執行,及後續 EuP 、 REACH 、 … 等一連串綠色指令法規要求,對我國企業是一波波嚴酷的挑戰,需要政府投入更多的資源,繼續協助企業符合客戶綠色採購要求,將環保貿易障礙轉換成企業發展的新契機,開發拓展綠色產品的商機,以提升我國企業之綠色競爭力。

歐盟部長理事會通過開放GSM頻段供3G寬頻技術使用

  歐盟部長理事會(Council of Ministers)已跟隨歐洲議會腳步,通過對「GSM 指令」(Global System for Mobile Communications Directive)進行修改的提案,准許電信營運商在900 MHz頻段上提供UMTS服務(3G通訊技術之一,可向下相容GSM與GPRS),例如WCDMA通訊架構可於900 MHz上運用。這項決議仍須經過歐盟各會員國國會和監督機構認可,預計2009年10月開始實施。   原先指令在1987年所提出,將900 MHz和1800 MHz頻段劃歸GSM手機專用,此作法有效促進GSM產業的蓬勃發展。修改該指令的提案,則是允許讓900 MHz頻段在繼續供GSM服務使用的同時,也開放給行動上網等更高速的泛歐洲通訊服務。預估將能大幅降低電信營運商網路建制成本,可減少大約16億歐元的支出。   據歐盟電信委員會Viviane Reding委員表示,GSM Directive的修訂,將為行動通訊業者解除限制,並因此能在GSM頻段上建置更先進的技術,以提供高速行動寬頻服務;她預期這將有效促進歐洲的無線經濟(wireless economy),並催生「數位歐洲」(Digital Europe)的誕生。相關發展值得台灣電信通訊產業注意。

德國聯邦內政部公布《資訊科技安全法草案》

IE壟斷瀏覽器市場遭歐盟裁罰,股東狀告微軟公司

  針對2013年微軟因Internet Explorer瀏覽器壟斷問題遭歐盟裁罰,微軟股東Kim Barovic於2014年4月11日向美國華盛頓西區聯邦地區法院(U.S. District Court, Western District of Washington)提出告訴,控告包括微軟公司創辦人Bill Gates與前任CEO Steve Ballmer等高層在整起事件中決策失誤、處理不當,致使公司承受鉅額罰款,蒙受重大損失,且董事會亦未善盡職責,徹查事件發生之原因。   2013年3月,身為歐盟反壟斷監管機構的歐盟執委會(European Commission),以微軟公司自2011年5月至2012年7月間發布的Windows 7 Service Pack系統更新,未提供超過1500萬用戶除了預設IE瀏覽器以外其他上網程式的選擇,顯然未履行該公司於2009年對歐盟做出的具有法律拘束力的承諾(即確保歐洲地區的消費者有選擇網路瀏覽器的自由)為由,對該公司之義務違反處以7億3100萬美元的天價裁罰,這也是歐盟執委會首次對違反此項義務的公司開罰。   本起訴訟是自2013年事件發生以來,首次有股東向微軟公司提告。原告Kim Barovic在訴訟中要求徹查決策錯誤的發生原因並懲處管理階層的相關失職人員。她說,董事會表示:「經調查,無證據顯示有任何現任或前任主管或經理人違反受託人義務。」微軟則於11日發布聲明:「Barovic請董事會調查其要求,還對董事會與公司管理階層提告。董事會已經完整地考量過其要求,但找不到官司成立的根據。」

TOP