合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/11)
引註此篇文章
你可能還會想看
美國司法部針對與集管團體的著作權合意判決提出修正解釋

  美國司法部於今年六月底,就1941年實施至今,與「美國詞曲作者及出版商協會」(American Society of Composers, Authors and Publishers,ASCAP)及「廣播音樂公司」(Broadcast Music Incorporated,BMI)間的合意判決(Consent Decree),提出了新的解釋。司法部認為,在維護市場自由競爭的價值下,應該允許部分詞曲著作人授予全部的歌曲權利給單一集管團體。   在當今閱聽大眾習慣變化快速的年代,閱聽服務種類多元,使用人很有可能因難以取得全部歌曲權利而陷入侵權風險。司法部此舉可增進使用者授權便利性與完整性。   然而,新的解釋引來正反兩面不同的評價,部分數位音樂業者(如Pandora Media, Inc)認為,如此可提升消費者享受服務的便利性,亦可避免大型集管團體的壟斷與對於音樂授權市場的價格控制。反對聲浪則表示,如果單一權利人可授權全部的音樂著作權利給個別集管團體,會增加授權複雜程度,亦將造成集管團體彼此間授權費用分攤上的困擾;並且,大型音樂出版業者(如SONY/ATV)很有可能撤回對於集管團體的概括授權,這對於消費者來說無異是增加了取得授權的困難度,只是將壟斷力量由集管團體轉移至服務提供業者本身而已。亦有論者指出在授權透明機制建立以前,過度自由的授權模式將增加整個音樂視聽產業的內部管制負擔。   我國對於集管團體與音樂服務業者間關係,恐亦存在市場力量不均衡的問題,政府或應思考如何於「授權市場的公平競爭」、「社會大眾的閱聽權利」,以及「音樂產業的發展方向」三者之取,取得政府、人民與產業三贏的結果。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

聯合國推動「全球綠色新政」並倡導各國促進綠色投資及研發活動

  聯合國環境規劃署(UNEP)正式發表「全球綠色新政」(Global Green New Deal)報告,建議各國投入GDP1%(約7,500億美元)資助綠色環境建設及發展,除期使更落實綠色經濟倡議(Green Economy Initiative)內容外,並希望以此帶動綠領就業(Green Collar Job)及促進綠色研發活動蓬勃。     聯合國UNEP於2009年2月對外發表全球綠色新政報告,並倡導五大重要投資領域,包括以下: (1) 提昇各新舊建築物能源使用效率領域之投資。 (2) 再生能源(包括太陽能、風力、地熱能、生質能等)領域之投資。 (3) 永續交通運輸環境(包括氫能汽車、高速鐵路、快速捷運系統等)領域之投資。 (4) 全球性生態構成(包括潔淨水、森林、土壤等)基礎環境領域之投資。 (5) 永續農業(包括有機農產品)領域之投資。     聯合國UNEP並於研究報告中強調:綠色經濟轉向之根本驅動力在於導入相關綠色科技之解決方案,包括各種清潔生產製程、污染防治技術,以及管末和監控技術,涵蓋know-how、流程、商品、服務、設備、組織和管理等,均為綠色經濟蓬勃發展之關鍵環節。     而世界各國關於推動綠色新政投資之規劃行動,如歐盟於2008年11月29日通過經濟振興方案,總預算為2000億歐元(1.5%EU的GDP),方案內容涵蓋4大優先領域,亦即為民眾(people)、商業(business)、基礎建設及能源(infrastructure and energy)、研究與創新(research and innovation),歐盟也呼籲各國應多投入綠色科技研發活動。     而美國2009年2月通過之復甦與再投資法案(American Recovery and Reinvestment Act),亦將綠色新政涵蓋其中,其中編列61.3 billion美元投入「清潔、效率能源方案」,主要係投資於提升能源效率、發展潔淨能源及交通效率及科技研發等。     以外,日本政府於2009年2月亦指示著手研擬「綠色新政」規劃,,預計於6月後向首相提出建議書,以因應氣候變遷及經濟危機威脅等危機。而南韓則是於2009年1月宣布未來4年將投入50兆韓元推動「綠色新政」,並以此投資行動,刺激創造更多的綠色就業機會。

美國總統歐巴馬簽署通過網路安全資訊分享法案(CISA)

  網路安全資訊分享法案(Cybersecurity Information Sharing Act,CISA)於2015年10月27日在「參議院」通過。接著眾議院於12月18日通過1.15兆美元的綜合預算法案,並將網路安全資訊分享法案夾帶在預算案中一併通過,最後美國總統歐巴馬亦在同日簽署通過使該法案生效,讓極具爭議的網路安全資訊分享法案偷渡成功。   網路安全資訊分享法案,建立了一個自願性的網路資訊安全分享之框架,其主要內容,在讓美國民間企業遭受網路攻擊或有相關跡象時,得以分享客戶個人資訊予其他公司或美國國土安全局等相關部門,同時並讓民間企業免除向公務機關洩漏客戶個資隱私等相關之法律責任。該法案目的係期盼藉由提高網路攻擊訊息共享度來改善網路安全問題。   該法案通過引發各界譁然。修正後的網路安全資訊分享法案去掉多數保護隱私權之條款,諸如分享客戶資訊時不用再遮掉無關的個人資訊、不再禁止政府利用這些個人資訊進行監控。   美國媒體批評該法案的通過是政府最可恥荒謬的行為之一。就隱私權層面,批評者認為,該網路安全資訊分享法案仍與監控密切結合,未能解決客戶個人資料被大量外洩的風險。就程序面而言,一個正式的網路安全資訊分享法案似乎不應被包裹在大額綜合預算法案中通過。該法案通過後之執行情形值得繼續觀察。

美國簽署晶片和科技法案,全球科技業將掀起波瀾

  美國近日為防堵中國、其他受關注國家如俄羅斯等國掌握半導體等高科技行業關鍵技術,遂致力於加強培養其本土之半導體及高科技通訊產業。於美國時間2022年8月9日美國總統拜登簽署 「2022年晶片和科技法案」 (CHIPS and Science Act 2022),該法案除可作為2021年頒布之「美國電信法案」之補助資金來源,發展開放式無線電接取網路(Open Radio Access Network, ORAN)外,亦有望大幅度提升美國本土晶片生產量。   本法案提高美國聯邦政府對科學技術研究及開發專案之授權,除授權美國商務部(Department of Commerce , DOC)、國防部(Department of Defense, DOD)外,還結合國務院(Department of State, DOS)透過資金補助之方式,發展影響美國競爭力及國家安全至關重要之半導體製造等高科技產業、人工智慧、量子計算等科學研究,本法案整體編列之預算高達2800億美元,至2027年時,授權金額預計將達1740億美元,而其中將挹注超過520億美元之資金用於發展美國本土晶片之生產及研發。   此外,該法案設有靜態限制,禁止接受補助之半導體企業投資以電子設計自動化(Electronic design automation, EDA)工具設計或製造晶片之中國公司,換句話言,即受補助之企業不得於十年內投資或擴大生產中國製低於28奈米之先進晶片。本法案亦提供25%之稅收優惠予於美國建造、裝設晶片廠之業者,以鼓勵企業進駐美國藉以提升美國生產之晶片總量,同時藉由企業之投資帶動美國各地經濟發展,提高就業率。   藉由本法案之制定,有望降低美國對其他國家晶片之依賴,並得藉此發展科技研究,對未來全球高科技產業供應鏈將造成偌大影響,值得持續關注。

TOP