合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=57&tp=1 (最後瀏覽日:2025/07/05)
引註此篇文章
你可能還會想看
美國國會《促進美國5G國際領導力法案》

  美國眾議院於2020年1月8日通過《促進美國5G國際領導力法案(Promoting United States International Leadership in 5G Act)》,指示美國國務卿未來應強化美國5G關鍵基礎設施,並在國際標準組織中爭取5G標準制定的領導地位。該法案象徵美國積極對抗中國大陸在5G網路、網際網路設備及雲端設施的控制,以維護國家安全及5G產業競爭力。目前法案還需由美國參議院通過,並經總統簽署後生效。   法案指出,國際標準制定組織(例如國際電信聯盟,第三代合作夥伴計劃3GPP和5G基礎設施協會、5GPPP公私聯盟協會)採用的標準,對於全球經濟及確保網路技術的全球連接至關重要。5G技術標準能帶來更高的智財權收入及技術出口,對未來全球無線通訊技術及標準制定產生強大影響力。中國大陸政府近來鼓勵民間企業在國際5G標準組織中發揮更大作用,企業積極參與並主導5G國際標準制定,試圖重組全球市場並主導經濟戰略性產業。中國大陸官員在國際標準制定組織中,亦擔任更多主導角色,包括建立夥伴關係、分配全球無線電頻率及衛星軌道,建立資通訊技術的國際技術標準等。中國大陸透過「中國製造2025」及「互聯網+」計畫,企圖在國際標準制定組織中稱霸,為中國大陸企業創造5G技術的不公平競爭優勢。   又為加強美國在5G國際標準制定組織中的領導地位,本法案具體列出美國未來5G技術標準與資通訊安全的三項目標:(1)美國與盟國及合作夥伴,應在第五代及下世代行動通訊系統和基礎設施的國際標準制定組織中,保持參與及主導地位。(2)美國應與盟國及夥伴合作,鼓勵並促進第五代及下世代行動通訊系統及基礎設施,發展安全的供應鏈網路。(3)維持美國與盟國及合作夥伴間電信及網路安全標準,維護美國國家戰略和安全利益。

澳洲發布「數位健康2018-2019年報」針對「我的健康紀錄系統」提出檢討及建議

  澳洲隱私保護辦公室(Office of the Australian Information Commissioner, OAIC)於2019年11月發布「2018-2019年數位健康年報」,其中針對「我的健康紀錄系統」(My Health Record System)日前發生資料外洩事件提出檢討及隱私建議。   「我的健康紀錄系統」於2012年開始由澳洲數位健康局(Australian Digital Health Agency)負責維運,所有健康報告以電子形式通過網站存檔或讀取,包括處方藥紀錄、醫生診療記錄、影像檢查以及其它測試紀錄等,所有資訊將置於網路並授權醫療專業人員,例如醫生、藥劑師、醫院工作人員和專職醫療人員(例如護士或物理治療師),均可登錄查詢。   「我的健康紀錄系統」原先以民眾自願選擇加入模式運作,以選擇性線上註冊方式概括同意健康資料存取。隨後為促進醫療產業發展,澳洲政府宣布「我的健康紀錄系統」全國適用並提供退出機制至2019年1月31日。而2018年澳洲修訂「我的健康紀錄法」(My Health Records Act 2012)強化個人資料管理相關規範,例如:提供永久刪除權、不得適用於保險目的、違反關鍵隱私保護而增加民事和刑事處罰等。   「2018-2019年數位健康年報」指出,隨著「我的健康紀錄系統」於2019年2月從選擇性註冊模式變為退出模式,關於隱私疑慮的查詢和投訴大幅增加。2018年至2019年OAIC收到57件投訴案,OAIC更對數位醫療產業中的受監管企業進行隱私評估,包括私人醫院、藥房等。為解決民眾疑慮,「我的健康紀錄法」修訂賦予永久刪除權,使投訴數量開始遞減,OAIC亦為醫療服務提供者發布有關保護患者個人健康資料相關指引,並與衛生部門組織合作,促進良好的隱私保護觀念,以增進健康服務提供者對預防和應對資料外洩的理解。

Nbn 工研院將釋出百多項專利

  工業技術研究院系統晶片技術發展中心( STC)計畫將其與國立交通大學推出的靜電放電防護(ESD protection)技術相關專利授權業界,該專利以6大組合區分,包含「輸出入介面電路之靜電放電防護」、「高速/射頻/混壓輸入輸出IC之靜電放電與電性栓鎖防護」、「輸出入單元電路設計」等共計110件專利,預計進行專屬授權。    隨著半導體產業競爭全球化,競爭型態也從過去的價格戰轉變成智慧戰,半導體產業廠商需快速大量取得專利權進行佈局,才能保持產業競爭力。配合產業界對專利的需求,工研院此次專屬授權的 ESD專利組合,主要來自STC的研發成果,將IC半導體產業中極重要的靜電放電防護與輸出入單元電路設計(I/O Circuit Design)相關專利,搭配交通大學電子工程系靜電放電防護專利,公開徵求專屬授權廠商。   ESD專利組合專屬授權說明會訂7月21日上午9時30分於工研院竹東中興院區9館010室召開,內容包括專屬授權競標規則、專利組合及專屬授權契約內容介紹,並隨即開放通訊投標,結標日為9月23日。

英國發布「2017年資料保護法」草案,以符合數位時代之需求

  數位技術改變人們的生活,為使英國人民、企業及組織接受數位時代的變革,並確保英國做好脫離歐盟(European Union)的準備,英國數位文化媒體及運動部(Department for Digital, Culture Media & Sport)修正1998年的資料保護法(Data Protection Act 1998),於2017年9月14日,提交2017資料保護法草案(Data Protection Bill 2017)(以下簡稱:本草案)予上議院審議,以因應數位時代的來臨。   此次本草案修正的方向為: 一般資料處理(§3-26): 一般資料處理係依歐盟的一般資料保護規則(General Data Protection Regulation,簡稱GDPR)為標準,將歐盟GDPR一般資料處理的相關規範之標準制定於此次修正之資料保護法中,並確保健康、社會安全與教育資料等個人資料之安全維護。另對於個人資料的近用與刪除予以規範以強化公共政策,並維護國家安全。 執法程序(§27-79): 拜科技進步所賜,網路世界如遠弗屆,透過網路跨境傳輸、分享、蒐集資料,並非難事,因此,更需要一個強而有力且一致性的個人資料保護規範框架。警方、檢方或司法刑事機關為偵查犯罪行為,而蒐集、處理或利用個人資料,須有明確、正當、合法的執法目的,對於國際間個人資料的交流利用須依明確的程序規範並賦與相當之保護措施,確保英國退出歐盟後,仍可繼續與歐盟各成員國間聯手偵辦重大犯罪案件,以維護國際間之資訊安全。 國家安全(§80-111): 因國家安全事項不在歐盟法(EU Law)規範範圍之列,故GDPR或指令法律(Law Enforcement Directive,LED)之效力不及於各成員國對於國安全之情資蒐集。故英國本次修法參採個人資料保護公約(Convention for the Protection of Individuals with regard to Automatic Processing of Personal Data,又稱現代化公約108(modernised Convention 108))之精神,將情報單位基於維護國家安全之必要蒐集個人資料之規範,明文納入個人資料保護法之適用,以符合國際間的資訊安全規範標準。 資訊委員與執行(§112-168): 資訊委員(Information Commissioner)係指保護資訊權之公共利益、促使公務機關公開資訊與維護個人資料隱私權之獨立政府官員,得主動偵查犯罪,並得通知或教育廣泛的資料管理者,以提高資料保護之標準。繼2010年賦與資訊委員針對金融犯罪之執法權限之後,本草案亦增列意圖還原已去識別化之個人資料、禁止不當揭露個人資料兩種犯罪類型,賦與資訊委員更廣的處理權責。違反資料保護法(如不當揭露個人資料),將處以行政罰責(最高可處1,700萬英鎊/2,000萬歐元罰鍰)。   本草案除建制一個一般資料處理、執法程序及國家安全的資料保護體系外,更加強對於學術研究、金融服務及兒童保護等領域的資料保護,以因應數位時代之變革。

TOP