合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/02/21)
引註此篇文章
你可能還會想看
美國聯邦通訊傳播委員會完成空白頻段干擾測試

  美國聯邦通訊傳播委員會(Federal Communications Commission, FCC)於今(2008)年初完成700MHz頻譜拍賣後,在8月份針對空白頻段(white space)中可用以抗干擾之技術進行測試,並於8月11日完成測試。完整的測試報告預計將在9月份公布。FCC並可望在未來幾個月內表決是否開放空白頻段。   所謂「空白頻段」係指無線電視數位化之後,位於各電視頻道之間未被使用之閒置頻段。Google、Motorola、Microsoft等公司近一、二年來持續遊說FCC開放空白頻段(white space)免執照使用,以促進無線寬頻服務之發展。   儘管數位無線電視台及Verizon等正使用該頻段之業者有干擾疑慮,然主張開放空白頻段之公司深信開放空白頻段對於新興無線寬頻服務之發展將大有助益,且透過感測技術(sensing technology)或地理定位科技(geolocation technology),即可使得無線裝置於使用空白頻段之同時,不至於干擾數位無線電視台或其他取得執照使用該頻段之業者。   關於試驗結果,無線麥克風業者Shure之資深公關經理Mark Brunner 表示,感測技術幾乎完全無法準確偵測使用中之無線麥克風或電視頻道是否正播送中,自然無法避免干擾發生。支持開放空白頻段之Motorola公司則表示,儘管感測技術無法避免干擾發生,但是Motorola所使用之地理偵測科技則在測試中被證實可有效避開正在使用中之頻段,避免干擾情況發生。

2030年數位羅盤:數位十年的歐洲之路

  由於新冠肺炎疫情爆發,反應了歐盟對非歐洲國家數位技術的依賴,歐盟為扭轉此局勢,於2021年3月9日提出「2030數位羅盤」(2030 Digital Compass)計畫,擬定至2030年歐洲成功實現數位轉型的願景、目標和途徑。 歐盟預計在2030年前將計畫中4個核心目標轉化為具體政策: (一)擁有數位知識之公民及數位專家:  1.具備基本數位知識之人口至少達到80%。  2.應有2000萬名以上的資訊通訊技術專家,且促使更多女性進入此產業。 (二)安全和永續發展的數位基礎設施:  1.所有歐洲家庭都應擁有Gigabit網路,且所有人口密集區都應被5G所覆蓋。  2.歐洲半導體的產量應占世界的20%。  3.歐盟應部署1萬個氣候中立的高度安全邊緣節點(edge node)。  4.於2025年前開發出歐洲第一台量子電腦。 (三)企業數位化轉型:  1.75%的歐洲企業應使用雲端運算服務,大數據和人工智慧。  2.超過90%的歐洲中小企業應達基本數位密集強度。  3.擴大創新規模並改善融資管道,使歐盟的獨角獸企業數量翻倍。 (四)公共數位化服務:  1.於線上提供所有主要的公共服務。  2.所有歐洲公民均能使用電子病歷。  3.80%的歐洲公民應使用電子身份證。   歐盟委員會將基於上述目標,期於2021年第3季前提出相關數位政策計畫,並於2021年底前與其他相關機構取得決定性進展。

澳洲發佈《直接行動計畫》以因應氣候變遷

歐盟《企業永續盡職調查指令》草案,將永續治理內化至企業經營

  歐盟執委會(The European Commission)於2022年2月23日發布《企業永續盡職調查指令》草案(Proposal for a Directive on corporate sustainability due diligence),其目的在於促進永續及負責任企業行為,並使企業將人權與環境考量內化至企業營運與公司治理。   本指令要求各歐盟成員國,須確保企業確實執行人權及環境盡職調查,具體要求企業之作為如下: (1) 將盡職調查納入公司政策(第5條); (2) 採取適當的措施,以鑑別企業自身或子公司於營運及其既有商業關係價值鏈之現有或潛在的不利衝擊(adverse impacts)(第6條); (3) 採取適當措施,預防及減緩潛在的不利衝擊,並消弭現有不利衝擊或縮小其影響範圍(第7、8條); (4) 建立並維持申訴制度,確保受前述不利衝擊影響或有相當理由信其將受影響之人、價值鏈中之工作者代表以及關注相關領域的民間社團等利害關係人之申訴管道暢通(第9條); (5) 定期針對自身及子公司之盡職調查政策及措施進行評估,以確保其有效性(第10條); (6) 企業須於每年4月30日前揭露盡職調查相關資訊,受《企業永續報告指令》(Corporate Sustainability Reporting Directive, CSRD)規範之企業須於企業年報中揭露,其他企業則須於企業網站揭露(第11條)。   另一方面,本指令也明定公司董事義務,依據第25、26條,董事於其決策過程須考量短、中、長期之人權、氣候及環境因素;企業亦須指定部分董事負責盡職調查相關治理作為,並定期向董事會進行報告。   適用本指令的歐盟企業有兩種:(1) 員工人數500人以上且全球年營業額1億5,000萬歐元以上之大公司;(2) 員工250人以上之且全球年營業額4,000萬歐元的高衝擊產業(如:紡織、農業、採礦業等)。另外,非歐盟企業若符合前述員工人數之要求,且於歐盟境內之營業額達到前述標準,亦適用本指令。

TOP