合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=65&tp=1 (最後瀏覽日:2025/04/26)
引註此篇文章
你可能還會想看
檢視英國無線寬頻規畫方向

  Ofcom從行動載具、應用程式的蓬勃發展,預見英國10年內將會超過500億台載具透過與機器對機器通訊(Machine-to Machine Communication,M2M)、智慧聯網(Internet of Things)連接,應用在各種領域,包括運輸、健康照顧、能源及農業。有鑑於新興服務普及後,將使2030年民眾使用行動數據總量將是現在25倍,Ofcom在今(2013)年11月以頻譜有效利用為宗旨,提出英國無線通訊基礎藍圖諮詢。   根據本份藍圖顯示,Ofcom為了促使頻譜有效利用,除了持續評估廣播、無線相機與麥克風移頻可行性外,已確認的頻譜規畫為以下三個方向: 1、2.3GHz與3.4GHz: Ofcom已與國防部(Ministry of Defence)共同合作,將原本公部門使用的2.3G、3.4G頻段,轉移至商業使用,預計將於2015-2016年進行拍賣。除此之外,Ofcom將持續與政府部門合作,讓更多頻段能釋出於商用。 2、700MHz:為了讓民眾皆可得到「黃金頻譜」(Prime Spectrum)所帶來之利益(例如具有高度覆蓋性), Ofcom已規劃2018年將釋出部分頻譜供行動寬頻使用,讓更多民眾可享有無所不在網路帶來的便利性。 3、「閒置頻譜」(White Space):英國未來6個月內,將會超過20個組織參與Ofcom所推動的閒置頻譜技術試點計畫。Ofcom將透過各種創新應用服務的測試,讓閒置頻譜與新興服務可相顯益彰。   Ofcom行動寬頻政策除了頻譜重新規劃,解決未來英國行動數據可能產生的「容量危機」(capacity crunch )外;另一方面,政府亦透過提高3G業者涵蓋義務、賦予1張4G執照具有覆蓋義務、以及促使偏遠地區增加基礎建設等方式,維護民眾取得完善服務品質。因此,從上述的政策走向,可以預見英國業者未來所提供的行動寬頻,將朝向穩定的服務與合理的價格演進。當民眾使用新興服務不再有網路中斷、或費用過高之疑慮後,將會增加民眾對資通訊軟、硬體的黏著性,使國家更具有競爭力。

英國不贊同歐盟新視聽媒體服務指令

  英國傳播、電信、科技及媒體相關領域業者及團體於 2006 年 4 月聯合發表一份意見書,反對歐盟提出的新視聽媒體服務指令( Audiovisual Media Services Directive )草案。同時英國政府也正關注這項草案並與其他會員國進行討論。   自 2005 年 9 月起,歐盟開始針對電視無國界指令( Television without Frontiers Directive )的修正進行討論。歐盟考慮將該指令修改為視聽媒體服務指令,擴大其規範範圍,使其包括各種與電視相似( TV-like )的服務,並將所有視聽媒體服務區分成線性( linear )及非線性( no-linear )服務,分別給予不同程度的管制。   不過英國有許多業者及團體對於這項新指令的制訂深表不贊同,其認為: (1) 就非線性服務(例如隨選視訊)而言,目前既有法規以及業者自律規範已足以保障消費者; (2) 線性及非線性的分類方式可能不適宜作為法律定義的基礎; (3) 新指令將可能阻礙新進業者參與市場的意願,甚至導致投資者轉向其他國家發展。所以希望透過連署,要求歐盟重新檢視這項新指令。

英國資訊委員辦公室(Information Commissioner’s Office,ICO)認定英國電子零售業者Carphone Warehouse違反《Data Protection Act 1998》資料保護法

  英國電子零售業者Carphone Warehouse在2015年遭到網路攻擊,造成逾300萬客戶及1000名員工的資料外洩,外洩的資料包括客戶的姓名、地址、電話號碼、出生日期、婚姻狀況及1.8萬名客戶的金融卡資訊。   英國資訊委員辦公室(Information Commissioner’s Office,ICO)認為涉及之個人資料嚴重影響個人隱私,使得個人資料有被誤用的風險。ICO進一步調查後並發現,駭客僅是透過有效的登入憑證,就能藉由WordPress軟體存取系統,此事件亦暴露該組織技術安全措施之不足,因受影響系統中使用的軟件的重要元素已過時,且公司未能執行例行的安全測試。ICO認為,像Carphone Warehouse此類規模龐大的公司,應積極評估其資料安全系統,確保系統穩健而避免類似的攻擊。   據此,ICO判定該公司缺乏妥善的安全措施保障使用者資訊,已嚴重違反《Data Protection Act 1998》資料保護法,判罰40萬英鎊。   從今年5月25日起,隨著GDPR的生效,法律將更加嚴格。對此,ICO亦發布了有用的指導,包括GDPR指南,現在採取的12個步驟和工具包。國家網絡安全中心(NCSC)也為組織為保護自己所採取的步驟提供了有用的指導。

論析各國之企業智慧資產揭露機制

TOP