合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/01/24)
引註此篇文章
你可能還會想看
美國專利標示不實之罰金計算

  美國聯邦巡迴上訴法院在2009年底於The Forest Group Inc. v. Bon Tool Co. 一案中將美國專利法35 U.S.C. § 292中關於不實專利標示(false patent marking)的懲罰金計算方式認定為罰金之計算是以每一個標示錯誤專利資訊的產品為基礎。美國專利法35 U.S.C. § 292中要求法院對專利資訊標示不實或錯誤之產品或包裝處以最高美金$500的罰金。在此案之前,許多地方法院將35 U.S.C. § 292解釋為罰金之計算是以每一次被告”決定”將產品標示不實專利資訊為基礎 (single penalty for each “decision” to falsely mark products),不論此決定是包含一個或一整批產品。在本案中,聯邦巡迴上訴法院同意地方法院的看法認定被告Forest Group意圖藉不實專利標示企圖欺騙大眾但撤銷地方法院將罰金定為$500之判定,而將目前專利法35 U.S.C. § 292 解釋為罰金是以”每一個”標示錯誤專利資訊的產品為基礎 (penalty for false marking on a per article basis)。   為了防範日後因此案罰金計算方式而造成所謂”標示流氓”(marking trolls) 之興起,聯邦法院於其判決中特別說明其解釋並非要求法院必須將每一標示錯誤專利資訊的產品處以$500美元的罰金。因法條中之罰金是以美金$500為上限,法院有權利權衡各案例背景決定罰款金額。例如,針對大量製造但價錢低廉的產品, 法院可對每一個產品處以極少的罰金。   The Forest Group 一案是美國聯邦巡迴上訴法院第一次針對不實專利標示之罰金提出解釋,直得關注其後續引發反應。廠商也應重新檢視其產品專利標示是否有不實或錯誤之狀況以避免被控標示不實專利資訊而被處以罰款。

生物識別技術走進零售業

  近期幾家大信用卡公司遭駭客入侵,使得消費者受到了越來越大的身份被盜用的威脅。對此,能使購物更加安全的技術,特別是生物識別技術,包括電影中常見到的虹膜掃描,以及相對普及的指紋,聲音,臉部特徵識別等,越來越引發了人們的興趣。   目前,美國第二大零售連鎖店 Albertson 已經和其他數百個零售商一起加入了生物識別付款的試點行列。該公司發言人表示,新付款方式則大大加速了結帳的速度;另外也可以自動識別是否賣菸酒給未成年人。   不過生物識別技術的根本的缺陷在於隱私問題,因?這項技術意味著對個人資訊的集中儲存。而這個系統必然會成?駭客和其他居心不良者的「蜜罐」,一旦這個儲存系統被攻破,並將受害者的生物資訊惡意更改,受害者將面臨身份被終極盜用的噩夢。

雲端運算所涉法律議題

  雲端運算(Cloud Computing),是一種基於網際網路的運算方式,用以共享軟硬體資源、依需求提供資訊給電腦和其他裝置。本質上其實就是分散式運算 Distributed Computing,其主要應用是讓不同的電腦同時協助你處理運算,故只要具備兩台以上電腦,讓他們之間互相溝通,協助您處理工作,就是基本的分散式運算。   雲端運算是繼1980年代大型電腦到用戶端-伺服器的大轉變之後的又一種巨變。使用者不再需要了解「雲端」中基礎設施的細節,不必具有相應的專業知識,也無需直接進行控制。雲端運算概念下描繪了一種基於網際網路而新增加的新興IT服務、使用和交付模式,藉由網際網路來提供各種不同的資源、服務功能而且經常是虛擬化的。 「雲端運算」供應模式以及實用定義如下: ‧ 軟體服務化 (SaaS):透過網際網路存取雲端的應用程式 (例如:Salesforce.com、趨勢科技 HouseCall)。 ‧ 平台服務化 (PaaS):將客戶開發的應用程式部署到雲端的服務 (例如:Google AppEngine 與 Microsoft Azure)。 ‧ 基礎架構服務化 (IaaS):有時亦稱「公用運算」(Utility Computing),意指處理器、儲存、網路以及其他資源的租用服務 (例如:Amazon 的 EC2、Rackspace 以及 GoGrid)。   雲端運算服務所涉及的法律議題相當廣泛,包含隱私權、個人資料保護、資料管轄權、契約責任、智慧財產權保護與營業秘密等。在隱私權問題方面,使用者的隱私或機密風險,乃至權利義務狀態會因為雲端供應商所提供之服務與隱私權政策(privacy policy)而有顯著不同,也可能因為資訊型態或雲端運送使用者類型不同而有差異。在雲端運算服務契約方面,發生資訊安全事件導致資料失竊或毀損時,供應商責任或注意義務如何於契約中合理分配風險,亦是契約方面重要議題。

英國商業、能源及產業策略部提出新版「後2020智慧電表布建計畫」,以助於住家型智慧電表全面布建

  英國商業、能源及產業策略部(Department of Business, Energy and Industrial Strategy,以下簡稱BEIS)於2020年6月18日提出新版「後2020智慧電表布建計畫」(Smart meter policy framework post 2020,以下簡稱旨揭智慧電表計畫),擬於未來4年內全面布建住家型智慧電表,以助於住家型用電戶管理用電並進一步減低碳排放量。   依BEIS預估,布建後有可能助於節省住家型用電戶平均250英鎊之電費,並減少全國4千5百萬噸碳排放量。依旨揭智慧電表計畫,電表布建費用將由售電業負擔,售電業應盡其最大努力布建智慧電表,如售電業並未盡到此一義務,則恐將面臨高額罰鍰。同時,智慧電表之布建可以鼓勵消費者改變用電習慣,如鼓勵消費者於用電離峰時間對於電動載具進行充電,或者是設置(再生能源)發電設備用於用電高峰期間發電、饋電至電網。   從而BEIS旨揭智慧電表計畫,也是為BEIS於2019年1月提出智慧饋電保證(Smart Export Guarantee,以下簡稱SEG)鋪路。於SEG新政策下,BEIS將擬定一套不同於躉購制度之政策框架,使小型生產消費者(prosumer,此處係指可以自行生產電力之用電戶)所生產之綠色電力,可於此一政策框架之保障下,與售電業者議約,並將電力售予售電業者,以減輕英國政府預計於今年3月廢除躉購制度所帶來之衝擊。又依SEG新政策,小型生產性用電戶須設置有智慧電表,始受前開SEG新政策之保證,從而得以優惠之價格或條件將再生能源設備所產生之電力出售予電力供應事業主體。職是故,BEIS旨揭智慧電表計畫,實際上可謂與BEIS於2019年所提出SEG新政策相互搭配,以迎接後躉購制度時代之來臨。   對於智慧電表之硬體規格,依旨揭智慧電表計畫,第二代智慧電表(SMETS2)為其建置之核心。第二代智慧電表與第一代智慧電表不同之處在於,第一代智慧電表係以3G為通訊基礎,且不同電力供應事業主體所使用之系統相互間無法交流、並存,第二代智慧電表則以4G以上規格為通訊基礎,且不同電力供應事業係使用同一套系統。同時,智慧電表應盡量配置有「住家顯示系統」(In-Home Displays),使住戶可以透過視覺化之及時反饋方式,知悉現在住家內之能源使用情形以及相關電價狀況,從而進行改變用電習慣。同時,智慧電表之用電或饋電至電網之資訊,也應可以透過智慧電表傳輸至電力供應事業主體或交易市場,從而使電力供應事業主體可及時知悉用電戶之用電或饋電情形,從而及時做出反應。   對於智慧電表之建置程序以及資訊傳輸、保存安全性上,旨揭智慧電表計畫則要求應符合「智慧電表建置行為準則」(The Smart Meter Installation Code of Practice, SMICoP),從而用電戶可以在此一準則或框架下,對於自己之用電資料享有一定之掌握權限。

TOP