合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/02/06)
引註此篇文章
你可能還會想看
WTO判澳洲素面菸品包裝一案勝訴

  WTO爭端小組於2018年6月28日裁決澳洲「素面菸品包裝案」(Australia—Tobacco Plain Packaging)由澳洲勝訴,本案歷時長達5年,係由古巴、宏都拉斯、多明尼加共和國及印尼4個WTO成員針對澳洲2011年實施「素面菸品包裝法案」(Plain Packaging Act)向WTO爭端解決機構提出控訴。   澳洲系爭法案要求菸盒外觀應採統一規格之外觀,禁止使用具識別性鮮明的顏色,不得出現任何具有宣傳效果之商標或印記,僅能以單調的橄欖色為主色,品牌名稱需以小型標準字體印刷,健康警示圖片需占菸盒面積正面75%,背面90%,以達降低國內吸菸人口、保護國民健康之目的。   原告方認為法案侵害菸商使用商標權利,能否有效達到減緩菸害之目的仍有疑義,主張該法制造成不必要之貿易障礙。爭端小組檢視原被告主張與證據,認定澳洲法律係透過減少菸品使用、改善公眾健康目的,手段與目的之間具合理關聯性,駁回原告主張其他替代措施具同等效果的訴求、侵犯商標違反智慧財產權的論點。   此案被視為全球公共健康衛生政策與貿易衝突之指標性案件,目前法國、匈牙利、愛爾蘭、紐西蘭、挪威、斯洛維尼亞、英國均已通過此類包裝規定,而比利時、加拿大、哥倫比亞、印度、巴拿馬、土耳其、新加坡與馬來西亞等國亦有意比照辦理。惟國際菸草產業質疑此項裁定,將使其他欲實施嚴格管制菸品、酒類與垃圾食品的國家開先例,不利於商標權保護與發展。

歐盟發布「如何掌握歐洲的數位基礎建設需求?」白皮書暨公開意見諮,尋求成員國間更一致的頻率與海纜監理架構

「安全、韌性、高效、永續的數位基礎設施」,是歐盟「數位十年計畫」(Digital Decade Policy Programme 2030)所擘劃的政策目標之一。執委會於2024年2月21日發布「如何掌握歐洲的數位基礎設施需求?」(How to master Europe's digital infrastructure needs ?)白皮書,詳細盤點歐盟數位基礎設施的發展現狀及所面臨的挑戰,提出可能的政策方案並公開諮詢各界意見。 其中有關頻率管理的部分,執委會認為成員國間各自為政的頻率釋出與管理政策拖累了整體歐盟的5G布建進程,目前5G的涵蓋率與普及率仍不如預期,成員國間的數位發展程度也參差不齊,法規環境差異對跨境提供服務所造成的障礙亦導致數位單一市場難以成形。為避免相同困境在6G重演及因應發展衛星通訊服務帶來的跨境頻率管理議題,歐盟將更進一步同調各成員國的頻率管理政策與規範環境,提高歐盟對頻率政策的掌控,確保歐盟通訊網路的安全性、獨立性和完整性。 海纜的安全性亦受到關注,歐盟既有電子通訊網路和服務的監管架構並未就雲端服務業者規範相關的義務,但隨著大型雲端服務業者持續投入海纜建設,歐盟已經有超過60% 的國際流量透過非公眾網路業者建設的海纜傳輸,監理上的漏洞已經形成歐盟通訊網路的安全隱患。 執委會將與各界展開廣泛的討論與磋商,研議能確保安全與韌性之數位基礎設施的政策工具及監理框架。在頻率管理方面,希望能提高歐盟的一致性與協調性,為地面通訊、衛星通訊及其他新興應用的頻率使用提供更統一甚至單一的授權流程及選擇條件,以促進數位單一市場的形成;在海纜方面亦規劃建立歐盟層級的聯合治理體系,將針對海纜的風險、弱點及依賴性做全面性的評估,亦將資助既有海纜的升級與新海纜的設立,同時確保供應鏈的安全性及降低對高風險第三國的依賴。

英國同意BT「下世代文字中際服務申請」

  為了讓聽力或語言障礙之民眾,取得更為便利的電信服務,英國Ofcom在2012年10月透過「回顧中繼服務-決策下世代文字中繼服務」(Review of relay services: Decision on the introduction of Next Generation Text Relay)陳述書(Statement)之發佈,提高通訊服務業者 (communications providers)對身障者的義務。根據陳述書內容,英國市話、行動通信業者必須在2014年4月18日,達成「下世代文字中繼服務」(Next Generation Text Relay,NGTR)之要求。因此,英國電信BT於去(2013)年11月提出審查申請,並在今年3月獲得Ofcom許可。   Ofcom要求下世代中繼服務最主要重點,主要可分為(1)透過網際網路的連接,提供雙向語音服務,讓雙方談話更為流暢;(2)促使更多載具皆可使用文字中繼服務。BT為了落實上述核心要求,除了透過提升服務性能、技術應變能力、員工培訓與申訴機制,增加中繼服務的品質,以通過Ofcom核可外,BT亦允諾2014年4月18日後,該公司文字中繼服務將可進一步延伸至: 1.既有文字電話(textphones)與視障閱讀器(Braille readers)。 2.支援Windows XP系統以上個人、筆記型電腦。 3.適用Linux的Intel個人、筆記型電腦。 4.Intel型Mac OS X版本。 5.行動電話具有Android 4的作業系統。 6.2014年6月30日將可提供服務至蘋果公司相關產品,包括iPhone與iPad。   BT不僅提供文字中繼服務於自身客戶,亦提供批發接取(Wholesale access)於其他通訊服務業者,使其具備文字中繼服務,讓非BT的消費者亦可獲得無障礙服務。相信隨著更多通訊服務業者提升文字中繼服務功能後,將可讓聽障、語言障礙民眾使用電信服務更加便利,使英國充分落實聯合國「身心障礙者權利公約」之精神。

美國聯邦通訊委員會新通過的隱私規範

  這是客戶的資訊,該資訊如何被使用應為客戶的選擇。」於此一理念下,美國聯邦通訊委員會(Federal Communication Commission,FCC)於2016年10月27日通過了寬頻客戶隱私規定(Broadband Consumer Privacy Rules),該規定要求寬頻網路服務提供者(broadband Internet Service Providers,ISPs)應保護其客戶之隱私,該新通過的隱私規範非禁止使用及分享客戶的資訊,而係給予客戶有更多的選擇去決定自身的資訊該如何被分享及使用。以下簡介規範內容: 一、規範對象:寬頻網路服務提供者及其他電信營運商,例如Comcast、Verizon、AT&T等。規範對象未包含聯邦貿易委員會(Federal Trade Commission,FTC)所管轄的隱私保護措施下的網站或其他邊緣服務商(edge service),例如Google、Facebook、Amazon等。亦未規範寬頻網路服務提供者營運的社交媒體網站或政府監管、加密,執法等問題。 二、 主要規範內容:將ISP所蒐集得使用及分享的資訊分為三類,建立客戶同意要件,分類如下。 (一)敏感性資訊須事前取得客戶肯定地選擇同意加入(opt-in),才得為使用及分享。敏感性資訊包含精確的地理位置、金融資訊、健康資訊、孩童資訊、社會安全碼、網站瀏覽紀錄、app使用紀錄及通訊內容。 (二)非敏感性資訊,例如電子郵件地址或服務層資訊,得使用及分享,惟當客戶選擇退出(opt-out)則不得使用及分享。 (三)同意要件之例外。除了在建立客戶與ISP關係外,針對特定目的將會被推定為已取得客戶同意,包含寬頻服務之提供或針對服 三、 其他重要規範內容:清楚告知客戶收集的資訊、將如何使用、向誰分享;實施合理的資料安全準則;保密性違反之通知。   然而針對FCC是否具有相關管制權限,質疑聲浪仍存於本次規範之通過。亦有認為該規範與FTC的管制同時運行將形成疊床架屋,造成社會大眾之混淆。並且該規範未能真實反映網路生態,未將網路公司或社交網站公司列入管制對象,無法真正保護客戶隱私。

TOP