合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?no=55&tp=5&d=8532 (最後瀏覽日:2025/04/29)
引註此篇文章
你可能還會想看
美國參議院通過幹細胞研究加強法案,惟仍難逃被布希總統否決之命運

  美國參議院近日就是否開放聯邦經費挹注於胚胎幹細胞研究進行激辯,並於 17 日通過幹細胞研究加強法( Stem Cell Research Enhancement Act of 2005, HR 810) 及其他兩項亦涉及胚胎幹細胞研究的類似法案。其中最引人注目者為 HR 810 ,該法案允許以聯邦經費資助使用人工授精之剩餘胚或病患自願捐贈之胚胎,進行幹細胞研究。這些法案的通過顯示,美國參議院打算挑戰布希政府自 2001 年所立下禁止聯邦經費挹注於胚胎幹細胞研究的禁令。   其實早在去年五月,眾議院即以 238 票贊成、 194 票反對通過 HR 810 ,布希政府在眾議院通過 HR 810 後,隨即表示一旦本法在國會立法通過,將會動用否決權推翻此一法案。根據美國法律,法案唯有經參眾議院以三分之二以上多數通過,總統始不能否決之。日前參議院係以 63 票贊成、 37 票反對通過 HR 810 ,並未達三分之二多數通過,因此本法案未來恐難逃被布希總統否決的命運。白宮發言人業已表示,該法案強迫所有的美國納稅義務人出錢資助以故意破壞人類胚胎為基礎的研究行為,法案一旦送交總統,布希總統將會行使否決權,這將會是布希總統任內首度針對國會所通過的法案動用表決權。   儘管布希總統仍持一貫反對胚胎幹細胞研究的立場,不過,美國民眾卻有支持胚胎幹細胞研究的趨勢。一項最新民調顯示,每四名受訪者中,就有三名贊成將聯邦經費用於資助胚胎幹細胞的研究。隨著美國國會大選將於十一月中旬展開,預料胚胎幹細胞研究議題將會再度成為焦點。

InterDigital主張Samsung侵犯其3G專利

  無線技術開發商,美國InterDigital Communications Corp. (InterDigital)表示其已向美國國際貿易委員會(United States International Trade Commission, ITC)提起訴訟案件,控告南韓三星電子(Samsung Electronics Co. Ltd.)與特定關係企業侵犯其3G專利。   InterDigital正向ITC宣告南韓電話製造商三星電子輸入侵犯其三項3G專利權的特定手機和零組件至美國並在當地銷售,進行不公平的貿易交易。   InterDigital也向德拉瓦州的美國地方法院(U.S. District Court)提起告訴,指控三星電子的3G WCDMA手機侵犯其在ITC申訴案件當中所述的專利權。   InterDigital要求ITC下達禁制令(exclusion order),以禁止在其訴訟中所指明之三星電子話機,包含三星電子的BlackJack (由Cingular Wireless所販售)以及模組SGH-ZX20與SGH-A707,進口美國或進一步在美國銷售。   ITC有30天的時間決定是否要調查InterDigital的申訴。通常,ITC委員傾向於12至15個月內完成調查。   William Merritt,InterDigital的董事長暨執行長,表示他們已經與三星電子進行協商,但沒有成功。   顯然,這兩家公司對於InterDigital之主張仍存在有歧見,但是目前三星電子的公司政策傾向於不評論該公司所涉及之訴訟案。

歐盟個人資料侵害事故通知規則於2013年8月生效

  歐盟個人資料侵害事故通知規則(regulation on the notification of personal data breaches)於2013年8月生效,其目的係為統一歐盟各會員國有關個人資料侵害事故通知之規定,以使當事人可以獲得一致性的待遇,同時,業者於歐盟境內亦可採取一致性的作法。此規則將適用於所有供公眾使用之電子通訊服務(publicly available electronic communications services)提供者,例如網路服務提供者(Internet service providers)及電信業者,同時,其敍明前述業者所持有之個人資料如有發生洩露或其他侵害時,應通知當事人與通報主管機關之技術性程序(technical measures)。   依個人資料侵害事故通知規則之規定,業者於知悉個人資料侵害事故之24小時內通報主管機關,通報內容包括:事故發生之日期與時間、受侵害之個人資料之種類與內容、受影響之當事人人數、以及為降低對當事人可能帶的負面影響擬採取或己採取之組織上與技術上之措施。   個人資料侵害事故可能對當事人之個人資料或隱私產生負面影響,業者必須立即通知當事人有關個人資料侵害事故之情事,例如遭侵害之個人資料涉及金融資訊、個人資料遭侵害會造成當事人名譽受損或業者知悉該個人資料已被未經授權之第三人擁有時。若業者能證明其對被侵害之個人資料已滿足主管機關所要求的技術保護措施,使未經授權而取得資料之人無法探知該遭侵害之資料內容時,即無須通知當事人有關個人資料遭侵害之情事。

遠距健康照護之法律議題研析

TOP