合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/05/04)
引註此篇文章
你可能還會想看
銜接實體與虛擬的新票據交換制度-美國二十一世紀支票交換法

在西班牙下載音樂無罪?!

本週西班牙法官判決,認為行為人為私人用途而下載音樂,其行為並非藉以從中獲利,應認其為無罪。 即便,檢察官辦公室及音樂工會呼籲應對此下載音樂並且在郵件及聊天室提供音樂之被告,處以兩年有期徒刑,然而,在此案當中,卻無直接證據證明被告於銷售音樂之過程中獲利。   此判決震驚了音樂工會,如此一來,西班牙一千六百萬的網路使用者將可透過網路交換音樂而不會受到處罰。西班牙唱片工會聯盟 Promusicae 表示,他將對此項判決提起上訴。   由於歐洲不同的法律規定,關於分享檔案的訴訟也會因不同國家而有極大的差異。然而,大多數的歐洲國家傾向對此處以較高的刑罰。就同為歐盟成員的芬蘭而言,上週便有 22 人因為非法分享電影、音樂遊戲及軟體而被處以 427,000 歐元。   至於西班牙此項為個人用途而下載音樂之行為,據其司法院院長指出,則有待立法修正解決。

美國《現在行動法》(MOBILE NOW Act)

  美國《現在行動法》(MOBILE NOW Act)全名為《創造無線寬頻投資機會暨減少過度且不必要之障礙法》(Making Opportunities for Broadband Investment and Limiting Excessive and Needless Obstacles to Wireless Act),於2018年3月23日由美國總統簽署生效。《現在行動法》(以下簡稱本法)立法目的在於確保頻譜資源有效利用與建構未來無線通訊基礎建設的法制框架,具體措施包含訂定頻譜釋出目標、確認毫米波(millimeter wave,對應頻率為30至300GHz)頻譜商用可能性、訂定頻譜釋照政策規劃、簡化通訊基礎建設流程,以及確保鄉村無線通訊技術的發展等。   依據本法要求頻譜主管機關應完成三大任務,包含:一、依本法第603(a)條第1項,在2022年12月31日前,主管機關應釋出至少255MHz的頻譜提供予固定與行動無線寬頻使用。二、依本法第604(a)條,聯邦通訊委員會(Federal Communications Commission, FCC)應在本法施行後兩年內完成在42000至42500MHz間的毫米波進階無線通訊服務及操作規範。三、針對當前已高度使用的3GHz頻段,主管機關應在本法施行後24個月內完成3100MHz至3550MHz間頻段的影響分析及商用可能性報告,以及在本法施行後18個月內完成3700MHz至4200MHz間頻段的公眾意見徵詢,並提交對聯邦機構影響分析及商用可能性報告。透過上述三大任務完成頻譜規劃與商用可能性評估,輔以完善頻譜釋照政策及簡化流程,創造吸引電信業者投資次世代通訊技術之誘因。   美國參議院於2019年12月5日針對本法施行後的辦理情形,召開「次世代通訊技術革新:《現在行動法》落實情形」聽證會,會議中強調《現在行動法》的落實與確保美國次世代通訊技術的領先有密切相關,因此透過本法移除頻譜規劃與分配產業商用過程中的障礙至關重要,本法使美國得以在全球5G通訊技術競賽中處於領先地位;在聽證會中肯定FCC在毫米波頻譜拍賣中的貢獻,並期許FCC與國家電信暨資訊管理局(National Telecommunications and Information Administration, NTIA)能夠藉由落實本法來確保頻譜的有效規劃與分配,進一步維持美國在5G通訊技術發展的領先地位。

歐盟與17家社交網站業者達成協議,強化青少年上網安全

  受惠於網路的高度普及與上網費用的調降,網路已成為民眾日常生活所不可或缺的事項。由於整體網路人口中,青少年占有極高的比重,如何提供青少年一個安全的網路空間,向為各國所關注的議題。     近年來社交網站在歐洲發展迅速,根據統計,現階段歐洲約有4,170萬的網路使用者,參與各種類型的社交網站。為防止日益嚴重的網路霸凌(Cyber-Bulling)及兒童賣春等問題,歐盟於2009年2月與MySpace、Facebook等17家社交網站達成協議,相關業者承諾將於自家網站上提供一個「申告侵害」(Report Abuse)的按鍵,便利使用者快速通知業者來自於他人的不合宜接觸或行為,以防止青少年受到網路霸凌或網路援交訊息的困擾。     社交網站業者除承諾提供上述通報機制外,在此次協議中,業者亦承諾強化青少年個人隱私的保護,以避免有心人士輕易透過社交網站,取得青少人之私密資料。

TOP