合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/05/25)
引註此篇文章
你可能還會想看
印度競爭委員會因廣義平價義務條款裁罰網路旅行社

印度競爭委員會(Competition Commission of India, CCI)於2022年10月19日以違反競爭法(Competition Act)第3條及第4條規定,涉嫌協議限制競爭與濫用市場地位,分別對兩家網路旅行社(online travel agents, OTAs)—MakeMyTrip India Private Limited和Ibibo Group Private Limited(合稱MMT-Go)裁罰22.348億及16.888億印度盧比(約為2600萬和2029萬美金),並要求MMT-Go修改與合作飯店之間的「廣義平價義務條款」,CCI認為「廣義平價義務條款」可能會限制競爭,具有市場地位的業者施行可能造成壟斷,需要個案認定是否違反競爭法。MMT-Go向國家公司法上訴法院(National Company Law Appellate Tribunal, NCLAT)提起救濟,NCLAT於2023年2月23日宣布將對CCI的裁罰進行審理,預計於4月11日舉行庭審。 「平價義務條款」在OTAs和合作飯店間相當常見,是為了要解決搭便車問題,防止飯店從中獲取不公平利益,而平價義務條款分成「狹義」與「廣義」。「狹義平價義務條款」禁止飯店在飯店自身網站以更好的價格與條件進行銷售,因只限制飯店在本身銷售管道的條件,並不影響OTAs之間的競爭。而「廣義平價義務條款」則禁止飯店在其他銷售管道以更好的價格和條件進行銷售,此將減少OTAs之間的競爭。當具有市場地位的OTAs與飯店簽訂「廣義平價義務條款」,因其更為低廉的價格與市場地位,其競爭對手無法與之公平競爭,可能產生壟斷。 此外,歐盟可能有同樣的看法,歐盟委員會於2022年5月新修訂「垂直集體豁免規則」(Vertical Block Exemption Regulation, VBER)將廣義平價義務條款從豁免範圍中刪除,但仍豁免狹義平價義務條款。因為廣義平價義務條款可能限制競爭或造成壟斷,印度與歐盟對於廣義平價義務條款已經做出限制,可能是未來競爭法的國際趨勢,可以作為我國未來相關法規調適之參考。

美國國防部發布《國防部資訊技術發展戰略》,以促進IT變革並為未來奠定基礎

美國國防部(Department of Defense, DoD)於2024年6月25日發布「關鍵點:國防部資訊技術發展戰略」(Fulcrum:DoD Information Technology (IT) Advancement Strategy),將持續促進DoD之IT變革,並為未來奠定基礎。 本戰略描述作戰人員在推動IT方面應達成之目標與重要性,並列出提供聯合作戰IT能力、資訊網路與運算現代化、最佳化IT治理、栽培第一數位人力等四大目標(Line of Effort, LOE),簡述如下: (1)提供聯合作戰IT能力(Provide Joint Warfighting IT Capabilities):在現今不斷變化且充滿競爭的全球環境中,該目標以使用者為中心,提供具功能性、可擴增、永續且安全之IT功能。並以改善作戰人員可用資訊為重點,以利在快節奏、多領域(multi-domain)作戰中獲得決策與競爭優勢。 (2)資訊網路與運算現代化(Modernize Information Networks and Compute):該目標著重於迅速滿足任務與商務需求,利用卓越技術與以資料為中心的零信任(Zero Trust)資通安全方法,提供安全且具更快資料傳輸速度、更低延遲與高度彈性的現代化網路。 (3)最佳化IT治理(Optimize IT Governance):該目標將提高傳送效率、節省成本,且透過從治理到資料獲取系統的簡化政策,以轉變治理制定更好的決策,包括使用強大資料功能。 (4)栽培頂尖的數位人才(Cultivate a Premier Digital Workforce):該目標將確保作戰人員為新興技術之布署做好準備,並持續致力於識別、招募、發展並留住最佳數位人才。其擴展DoD網路人力框架(DoD Cyber Workforce Framework, DCWF),著重於更廣義的數位人力,包括資料、人工智慧、軟體工程的工作角色。

蕃茄醬瓶身相似設計引發商標侵權之爭

  今年(2014)3月6日美國號稱蕃茄醬巨人的H.J. Heinz Co. (以下簡稱Heinz)於美國德州聯邦法院向一家德州公司Figueroa Brothers Inc. (以下簡稱Figueroa)提起商標侵權訴訟,主張Figueroa製造販售的蕃茄醬採用與其設計幾近相同的瓶身(ketchup bottle),侵害其極具識別性、代表性的商業表徵(trade dress)。   Heinz目前針對該玻璃瓶設計已註冊取得3個聯邦商標,其除了主張聯邦商標法保護外,亦基於普通法(common law)提起商標侵權主張。然而,Heinz表示,在提起訴訟前,已數次嘗試與Figueroa私下解決此爭議,但未果,所以最後才會訴諸法律途徑,提起訴訟。   Heinz於訴狀中表示從1890年代開始,便開始行銷販售有名的蕃茄醬產品,該產品的包裝即為系爭具有高度識別性的玻璃瓶設計。Heinz認為被告Figueroa未經同意擅自使用此瓶身設計的行為會造成消費者混淆,搭便車利用Heinz花費大量心力、時間和費用所累積的良好商譽來牟利。此外,Heinz並注意到Figueroa其他醬料產品例如莎莎醬、辣醬皆使用不相似的包裝,惟獨蕃茄醬產品包裝跟其有名的玻璃瓶設計幾乎完全相同。   自Heinz提起訴訟過了近一個禮拜,案情有了變化,Figueroa於4月初與Heinz和解,雖然Figueroa並未承認其侵害Heinz商標權,但同意從今年12月開始停止使用該玻璃瓶設計,並從此不再侵害Heinz的商業表徵(玻璃瓶設計)。然而,和解金額相關條款並未揭露。   此案之後,對於其他欲仿冒或剽竊Heinz的玻璃瓶設計者,是否會有遏阻影響,值得後續觀察。

美國眾議院一致通過電子郵件保護法案

  美國眾議院於2016年4月27日一致同意通過支持電子郵件保護及雲端隱私法案(Email Privacy Act, EPA),本法案之後將會要求執法部門於搜查電子郵件或儲存於雲端設備的資料時,必須向法院取得搜查令,才能取得超過180天以上的資料。   本法案係針對1986年推出的《電子通信隱私法(Electronic Communication Privacy Act, ECPA》進行補強,因為目前科技的進步,早已遠超過ECPA是在網路興起前所得規制的範圍,在當初ECPA法案訂定之初,人民仍有定期刪除E-mail以保持硬碟空間的習慣,但相較於現在多數人都已使用雲端信箱的習慣下,如仍能讓警方等恣意調查任何人的信箱,往往可取得巨量的消息,因此本次的修正可預期將更能使相關規範符合時宜需求。   本次修正重點如下: 1.過往之ECPA規定要求聯邦機構在調查超過180天的電子郵件時只需要取得傳票即可,現在則是需要取得搜查令。 2.要求政府機構必須先取得法院的搜查令,才可以要求供應者揭露其保有之資訊。 3.要求執法部門應於取得資料的10天內向資料被揭露者提供相關證明,如涉及政府單位者則縮短至3天。   雖然EPA在眾議院內獲得美國兩黨的一致通過,但仍須經參議院下一波的投票表決,才能決定本案是否得順利通過。

TOP