合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/01)
引註此篇文章
你可能還會想看
美國參議院通過「2008年基因資訊平等法」(Genetic Information Nondiscrimination Act of 2008)

  美國參議院以95對0票通過了「2008年基因資訊平等法」(Genetic Information Nondiscrimination Act of 2008),該法案主要是為了增補「2007年基因資訊平等法」(The Genetic Information Nondiscrimination Act of 2007)所制定。   「2008年基因資訊平等法」的內容主要為:1.保險業者不得基於被保險人的基因資訊,拒保或是提高保費,也不得要求被保險人提供其基因資訊以供保險用途,除非符合該法的例外規定。2.雇主不得以員工的基因資訊來限制、隔離、分級員工的工作,更不可據此來剝奪員工的工作機會。但是,本法所稱的基因資訊不包含個人的性別與年齡。   在本法通過之前,美國已有41個州立法保護個人的基因資訊被保險公司使用,並且進行不平等的對待;另有32個州立法保護員工因為基因資訊,兒在工作場合受到歧視。美國並於2000年發佈行政命令(Executive Order 13145),禁止利用基因資訊歧視聯邦單位的員工;另外,「1996年醫療保險可攜與責任法」(Health Insurance Portability and Accountability Act of 1996, HIPAA)也針對歧視做了若干的保護,但是仍有許多漏洞,諸如沒有限制保險公司收集被保險人的基因資訊,或是沒有禁止保險公司要求被保險人進行基因檢測等,所以觀察家認為本法的通過對於個人權利保護是一項進步,但是遺傳病醫藥業者與研究者卻憂慮本法阻礙了醫療研究的發展。

英國政府技術移轉辦公室發布知識資產商業化指引,推動公部門研發成果商業化

英國政府技術移轉辦公室(Government Office for Technology Transfer, GOTT)於2025年5月9日發布「知識資產商業化指引」(The Knowledge Asset Commercialisation Guide),指導公部門及其研究機構(Public Sector Bodies, PSB) 透過技術移轉、衍生新創等途徑,促進其研發成果,即知識資產(Knowledge Asset, KA)商業化。指引包含KA商業化開發路線及技轉授權方法等,並建議PSB內部KA管理人員(如KA管理負責人及KA經理)使用。重點簡述如下: 1. 指引建議PSB以下行動策略:制訂KA管理策略,且應包含創作者獎勵政策、衍生新創政策、研發人員轉任借調原則、利益衝突管理程序等;對KA進行盡職調查(Due Diligence, DD),如確認研發人員對KA貢獻度、確認PSB具授權KA之權利;擇定KA商業化路線時,須確認其商業化目標、創造哪些產品及服務、市場機會與潛在客戶、參與團隊與資源;對商業夥伴DD,如KA授權對象、潛在投資者等,確認其合作目標與識別潛在利益衝突。 2. 指引建議4種KA商業化路線: (1) 於PSB內透過既定機制或創立新部門,進一步開發與商業化。 (2) 向外授權KA使用權利,指引認為此方式比移轉KA所有權更為妥適,因PSB可保有KA所有權、相關控制措施以及實質影響力。 (3) 成立KA衍生新創,PSB將KA使用權利授權予衍生新創,進而開發新產品及服務。 (4) 成立合夥企業,類似運用KA衍生新創,惟此路線下,PSB將與現有第三方合作成立新企業,兩方均持有股份並簽署合夥協議。

美民主黨提案開放網路賭博

  美眾議院金融服務委員會主席Barney Frank於4月26日提案撤銷國會去年備受爭議的禁止網路賭博法案,取而代之制定聯邦層級規範架構的「網路賭博規範與執行法案」(Internet Gambling Regulation and Enforcement Act ),以核准賭博公司線上收取美國國民賭金,並對未成年人、強迫性賭博、洗錢與詐欺等須採取保護措施。   布希總統去年十月所簽署通過的法律,要求銀行與信用卡公司拒絕付款給美國司法管轄權外約2300家的賭博網站,造成賭博業的空前危機。Frank在個人網站批評,〝此法律是對美國人身自由的不當的干預〞。壓力不止於此,WTO也稍早議決美國的此限制不合法,因為某些國內的活動如賽馬,排除外國的公司而形成差別的對待。   Frank 所提的新法案將禁止發執照給任何涉嫌違反賭博、洗錢與詐欺或其他金融法等罪行者,且執照的審理與取得將透過財政部防制洗錢法的協助。而未來消費者上網站必須提供姓名、地址、出生日期與相關身分證明號碼,以和線上支付系統作資料核對。   投資公司Friedman Billings Ramsay認為美國國庫預計五年可增加兩億美金的賭博稅收。

印度廣告標準委員會公布「虛擬數位資產和連結服務廣告指引」

  印度廣告標準委員會(Advertising Standards Council of India, ASCI)於2022年2月23日發布「虛擬數位資產及連結服務廣告指引」(Guidelines for Advertising of Virtual Digital Assets and Linked Services),旨在防止使用加密資產和相關服務用戶所面臨的風險。   本指引使用「虛擬數位資產」(Virtual Digital Assets, VDA)此專有名詞,而非「加密資產」,並將虛擬數位資產定義為透過加密或其他方法所產生的任何訊息、編碼或代幣,得以充當計價或記帳單位的憑證或儲存,包括加密貨幣和其他相關產品,例如非同質化代幣(NFTs)均屬之。   該指引目的在將虛擬數位資產廣告與印度廣告標準委員會所發布的準則保持一致,該準則要求廣告必須真實,不得因「模糊、誇大或遺漏」而誤導消費者,並且不得利用消費者之信任或欠缺了解。   最重要的是,廣告商必須在所有虛擬數位資產的廣告中,於明顯位置附上免責聲明,且免責聲明必須至少佔總印刷或靜態廣告空間的20%,而動態廣告至少要有5秒,並且必須出現在聲音和社群媒體廣告中。免責聲明中應載明:「加密資產和非同質化代幣並不受監管,風險高。此類交易造成的任何損失可能因為沒有監理,而難以取得賠償。」

TOP