合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/06/21)
引註此篇文章
你可能還會想看
臉書(Facebook)被控告違反和解協議

  臉書(Facebook)在2011年11月與美國聯邦貿易委員會(Federal Trade Commission, FTC)針對用戶資料的隱私權問題達成和解,包括第一:臉書必須遵守其自行提出的隱私權政策;第二:臉書必須要事先得到使用者的同意,才能更改其資訊分享的設定;第三:當使用者刪除其帳號的三十天內,臉書必須實際上使任何人不能再取得相關資訊;第四:必須對新產品或服務建立並維護其隱私權保障的計畫;第五:在未來二十年內,臉書必須由獨立的第三人稽查其隱私政策,以維護使用者的資訊隱私保護。   但是公益團體電子隱私資訊中心(Electronic Privacy Information Center, EPIC)最近指控臉書的Timeline功能違反和解協議的第二條。在EPIC的指控中表示:臉書必須要事先得到使用者的同意,才能更改其資訊分享的設定。而Timeline的功能在2011年12月6日上線後,完全改變了使用者揭露其資訊的方式,強化使用者張貼的重要事件,並回溯資料至該使用者第一次登入臉書時(甚至更早至第一次輸入相關資料時)。雖然臉書提供七天時間給使用者可以編輯Timeline,刪除不希望公開的照片或貼文,但幾乎沒有人知道。EPIC因而要求FTC介入調查。

眾所矚目的LG對廣達權利金訴訟案有了初步的進展

  今年1月16日(週三),美國聯邦最高法院將韓國LG電子公司與台灣廣達(Quanta)電腦公司的訴訟案排入審判的程序之中,並預計今年六月底左右會有相關的判決結果產生。此案件之所於引人注目,主要是本案爭議的內容在於LG公司將其記憶體相關的專利權授權給美國Intel公司。而台灣廣達公司自Intel公司購買部分經LG授權的零組件,並用來製造筆記型電腦。   LG公司發現此情形之後,遂向美國法院控告廣達公司的行為侵害該公司的專利權,LG公司主張其授權並不包含對Intel公司以外的廠商,所以廣達公司的行為侵害該公司的權利;但廣達公司則主張Intel公司已取得授權,有權對外銷售,因此廣達公司的行為是合法的行為。   由於美國地方法院判決對LG有利,所以廣達公司不服因而提起上訴,本案也已經進入聯邦最高法院的訴訟程序,最後判決結果如何,將影響未來專利權擁有者與被授權者之間的關係,究竟收取權利金的範圍是否及於供應鏈或中下游的廠商等,成為眾人關注的焦點,也因此相關產業人士皆十分關注本案的發展。

被遺忘權的地域化與全球化

  2014年5月,歐洲法院(European Court of Justice)判決認定,歐洲人民有權要求搜尋引擎移除特定搜尋結果之聯結,亦即承認了ㄧ項新穎且從未見過的網路權利─被遺忘權(The Right to Be Forgotten)。對於此判決,正反論述各有見地,贊成有如隱私權的提倡者,因恐網路紀錄永不流失,網路網羅並刺探生活細節的功能將嚴重影響隱私權;反對者則有如言論自由學派,憂慮訊息的有限揭露將影響人民獲得資訊的自由與正確性。該歐州法院判決效力僅限定於歐洲網域,例如,若有一法國人要求移除其破產的資訊,則Google僅會在法國google.fr和德國google.de的網域中移除該搜尋結果,至於google.com則因被視為美國網域而能免於移除。然而,近來法國國家資訊自由委員會(CNIL)積極要求Google一旦確定移除某項聯結,其效力應及於所有的網域而一併移除。   為回應法國主管機關之要求,有鑒於有高達百分之97的法國人至今仍多習慣使用其歐洲國內網域的搜尋引擎,再加上沒有一個國家有權限要求或限制他國人民如何獲得資訊,Google認為法國的要求無必要,且不成比例,故不贊同法國國家資訊自由委員會的主張並要求其撤回聲明。由於Google未於15日內依指示遵循,法國主管機關將可考慮後續制裁。因此,被遺忘權目前仍舊維持地域化,然而,即便仍維持現狀,但歐洲法院的判決亦已造成網路資訊的分割,資訊的獲得將因網域的差別而有如小國林立。

網路服務提供者於2016中國大陸反恐法下之通報義務

  中華人民共和國第12屆全國人民代表大會常務委員會第18次會議於2015年12月27日通過並公布《中華人民共和國反恐怖主義法》(以下簡稱反恐法),並自2016年1月1日開始施行。反恐法第18條與第19條要求電信業務經營者與互聯網服務提供者,應當為公安機關、國家安全機關依法進行防範、調查恐怖活動「提供技術接口和解密等技術支持和協助」,並應當依照法律與行政法規規定,「落實網絡安全、信息內容監督制度和安全技術防範措施,防止含有恐怖主義、極端主義內容的信息傳播;發現含有恐怖主義、極端主義內容的信息的,應當立即停止傳輸,保存相關記錄,刪除相關信息,並向公安機關或者有關部門報告。」倘有違反以上規定且情節嚴重者,反恐法第84條授權由主管部門對該公私處50萬人民幣以上罰款,並對該公司直接負責之主管人員與其他直接責任人員處10萬元人民幣以上50萬人民幣以下罰款,並可由公安機關對該等人員處5日以上15日以下之拘留。   我國刻正進行資通安全管理法之制定,以為範圍更廣之資訊基本法的作用法。資通安全管理法當中考量納入與關鍵基礎建設相關之民間產業,使之成為資安通報之一環,政府需要民間企業配合時也將於法有據。於恐怖攻擊事件頻傳之今日,倘我國需要就此等事件要求電信業者或服務提供者進行通報時,相關國際立法例及其實踐,即值參酌。

TOP