合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/05/12)
引註此篇文章
你可能還會想看
國際能源總署發布《建設未來電網》報告

國際能源總署(International Energy Agency, IEA)於2025年2月25日發布《建設未來電網》(Building the Future Transmission Grid)報告,指出隨電氣化進程加速與再生能源擴大投資,全球電網建設與汰換需求大幅增加。然電網關鍵零件的採購週期較2021年、價格較2019年幾乎增長一倍,使電網建設與汰換難以跟上需求成長。 對此,《建設未來電網》報告提出以下建議: (1)提升需求明確性:政府應推動長期電網投資計畫與規劃,使供應商可得知零件需求與種類。 (2)加強產業對話:政府應加強與產業的協調與對話,以確保電網零件準時交付並加速潔淨能源轉型。 (3)積極投資電網:為避免電網成為再生能源發展瓶頸,應超前規劃並加快投資,確保電網發展與電力需求同步。 (4)設計採購框架:政府可透過長期合約、標準化採購程序、互通的電網零件標準,提升電網採購的一致性、可擴增性(scalability)與投資信心。 (5)簡化許可流程:政府應加速與簡化電網建設許可程序,並消除不必要的行政障礙。 (6)提升電網效率:電網營運商可透過數位科技提升電網輸電效率,最大化電網效能。 (7)供應鏈多元化:政府可與本地供應商或二階供應商合作,增加電網供應鏈多元化。 (8)確保技術人才:政府與產業應合作建立人才補給線,並確保數位技能納入產業培訓中。

Facebook粉絲專頁管理者是否負有保護用戶個資隱私之控制者(Data Controller)責任

  2018年6月5日歐盟法院針對Unabhängiges Landeszentrum für Datenschutz Schleswig-Holstein v Wirtschaftsakademie Schleswig-Holstein GmbH訴訟進行先訴裁定,擴大解釋《資料保護指令》(Directive 95/46/EC)之「資料控制者」範圍,認為Facebook和粉絲專頁管理者皆負有保護訪客資料安全的責任。由於「資料控制者」定義在《資料保護指令》與《一般資料保護規則》(GDPR)相同,因此裁定將影響未來使用社群媒體服務和平台頁面的個資保護責任。   本案起因德國Schleswig-Holstein邦獨立資料保護中心要求 Wirtschaftsakademie教育服務公司在Facebook經營之粉絲專頁必須停用,其理由認為Facebook和Wirtschaftsakademie進行之Cookie資料蒐集、處理活動並未通知粉絲成員且因此從中獲利,然Wirtschaftsakademie認為並未委託Facebook處理粉絲成員個資,當局應直接對Facebook要求禁止蒐集處理。歐盟法院認為Wirtschaftsakademie使用Facebook所提供之平台從中受益,即使未實際擁有任何個資,仍被視為負共同責任(jointly responsible)的資料控制者,應依具體個案評估每個資料控制者責任程度。   在原《資料保護指令》並未有「資料控制者需負共同責任」之規定,本案擴大解釋資料控制者範圍,對照現行GDPR屬於第26條「共同控制者」之規範主體,然而本案將資料控制者擴張到未實際處理資料之粉絲專頁管理者,是否過於嚴格?且未來如何劃分責任與義務,皆有待觀察。

什麼是「瑞典創新夥伴計畫」?

  瑞典創新夥伴計劃(Innovation partnership programmes),起源於瑞典企業與創新部下屬的國家創新委員會所強調的三個社會挑戰:數字化,環境氣候變遷和人口老齡化。創新夥伴計畫最重要的任務,在於公部門、企業界和學術界間的交流,為社會挑戰尋求創新解決方案,同時加強瑞典的全球創新和競爭力。創新夥伴計畫具體可分為五項重點發展領域。 一、下一代交通:目標是成為運輸效率更高的社會,以智能方式運輸,使用更多的節能型車輛。 二、智慧城市:智慧城市係利用訊息和通訊技術提高政策服務的質量,提升效能和互動性,降低成本和資源消耗,改善公民與政府的聯繫。 三、循環經濟:開創世界資源的新途徑,目標是可持續和無毒的原料生產。包括糧食供應管理、能源問題、及循環生物經濟轉型。 四、生命科學:透過醫療、商業和學術界合作,研發創新藥物,使健保和醫療技術惠及社會,並運用數位技術為強化。 五、新材料:為刺激瑞典工業的廣泛數位化運用,必須在各種成熟行業、新創公司和研究環境中加強夥伴關係,提升瑞典的產業競爭力。

基因改良作物命運大不同

  身為世上最大基因改良( GMO)棉花生產者的 中國大陸 ,已經批准將經過基因改良的混種棉花進行商業化,預料可以解決生活日用品上的短缺。相對於此, 歐盟 的農業部長們,卻對於是否批准編號1507的基因改良玉米,陷入一個進退維谷的困境。但是經過8年激烈的反對, 丹麥 卻允許基因改良玉米的進口。   而在 美國 有 85﹪的大豆,76﹪的棉花,45﹪的小麥是經過基因改良的。至於 澳洲 農業與資源經濟局則最近則對基因改良作物做出一份報告,認為各省禁止基因改良食品會減小經濟效益,使 澳洲 面對世界各地日益增多的基因改良作物發展,屈居弱勢。至終可能會在十年後造成1.5億到6億澳幣的損失。

TOP