合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=67&tp=5 (最後瀏覽日:2025/07/04)
引註此篇文章
你可能還會想看
德國將放寬非基因改造標示法規

  德國聯邦食品農也消保部(BMELV)發言人宣布,針對非基因改造食品標示制度之修正,今(2008)年初已達成政治協商,未來德國的非基因改造食品標示,將會容許那些在無可得替代產品的情形下而使用了基因改造維他命、添加物或加工輔助用料等基因改造產品之終端食品,標示為非基因改造食品。如此一來,那些使用目前只能以基因改造加工製成之維他命(如維他命B21、lyside等)所飼養之動物,日後動物來源食品以其作為原料時,這些食品將來也可以標示為非基因改造。此修法預計可在明年初完成實施。   德國此次修法目的,實係為了促進食品產業使用非基因改造標示。自從1990年建立非基因改造食品專有之標示制度起,動物來源食品如要作非基因改造標示,必須連在飼養時都使用非基因改造飼料,但食品產業卻表示此規定審為嚴苛且維持基因改造聲明所需的文件繁多,此機制實際上根本難以運用。BMELV為了促進食品產業使用非基因改造標示,遂決定修法放寬標準。   然而,這樣的修法仍然引起部分反對意見,例如德國食品產業聯盟(German food industry federation)即表示,非基因改造標示應當只能給予完全未使用基因改造之產品,其他產品則應使用諸如未含基因改造植物之類的聲明,否則就是誤導民眾之行為。此外,假如標有非基因改造標示的食品以此種方式使用過基因改造材料的話,更可能會折損非基因改造食品標示可性度。

歐盟發布數位身分皮夾信賴方登錄實施規則,健全數位信任生態系

歐盟執委會於2025年5月6日發布《數位身分皮夾信賴方登錄實施規則》(Commission Implementing Regulation (EU) 2025/848 Laying down Rules for the Application of Regulation (EU) No 910/2024 of the European Parliament and of the Council as regards the Registration of Wallet-Relying Parties)(下稱實施規則),旨在幫助數位身分皮夾(Digital Identity Wallet)用戶確保其身分資料傳輸至可信賴對象,且傳輸之資料並未超過預期用途。 實施規則規範重點如下: (1)建置及維運登錄資料庫:會員國應建置皮夾信賴方(wallet-relying party)登錄資料庫,並指定登錄管理員負責管理及維運。 (2)訂定登錄政策及程序:會員國應訂定登錄政策,內容須涵蓋皮夾信賴方註冊時之身分識別及核實程序、登錄程序所需配套文件及佐證資料、用以確認皮夾信賴方提供資訊正確之真實來源、皮夾信賴方之救濟機制、驗證已註冊信賴方身分之規則及程序,並盡可能採自動化流程。 (3)申請登錄所需資訊:皮夾信賴方申請登錄時應提供之資訊,包括與官方身分紀錄一致之姓名或組織名稱、身分識別資料(如國民身分識別碼、商業登記號碼、加值營業稅號、歐盟經濟營運者註冊及識別碼(Economic Operator Registration and Identification Number))、地址、聯絡資訊、服務類型描述、針對各項預期用途擬請求之資料清單、是否為公務機關等。 (4)簽發相關憑證:會員國應授權至少1家憑證機構簽發皮夾信賴方存取憑證(access certificate),以確認皮夾信賴方之身分。會員國另得授權憑證機構簽發皮夾信賴方登錄憑證(registration certificate),以證明皮夾信賴方所取得之資料未超過預期用途。 (5)暫停或取消登錄資格事由:若有登錄資訊不實、違反登錄政策、請求資料超過預期用途等情事,將暫停或取消皮夾信賴方登錄資格。 (6)紀錄保存年限:登錄及憑證簽發紀錄應保存10年。 此實施規則已於2025年5月27日生效,將於2026年12月24日施行。

國有研發設施開放近用之法制規範研析-以美日韓規定為核心

美國法院對於網路無障礙判決歧異

  加州聯邦中區地方法院於2014年6月在Jancik v. Redbox Automated Retail, LLC (No. SACV 13-1387-DOC, 2014 WL 1920751 (C.D. Cal. May 14, 2014))一案中,判決影片自動出租機公司Redbox勝訴。法院認為,雖然Redbox在其經營的線上影視串流服務中未提供隱藏字幕(closed captioning),導致聽障者無法藉由閱讀影片字幕來了解劇情,但「網站」非美國身心障礙者法(Americans with Disabilities Act,下稱ADA)第三章「民間事業體所營運之公共設施與服務」中所稱「公共設施」(public accommodation),即無障礙建置範疇不包含提供公眾商品與服務的「網站」,因此業者不須提供具可及性之商品,例如:附字幕影片。法院認為第三章並未就公共設施中商品特色和內容有所規範,因此業者無義務改善其他影片存貨規格,使其能為身障者所觀看;又Redbox線上影視串流服務僅有網路通路,依ADA文義解釋,網站亦非屬於公共設施,無提供無障礙建置之必要。   本案與第一巡迴上訴法院在NAD v. Netflix案見解大相逕庭,該案以「美國國家聽障人士協會」(National Association of the Deaf, NAD)為首之公協會,集體對美國知名線上串流影視節目網站Netflix提起訴訟,控告其線上影視節目未提供隱藏字幕,使得聽障人士無法觀看該影片內容,法院判決該平臺網站屬於「公共設施」,依ADA第302條規範,身心障礙者有權利享受公共設施之設備,不得因殘障而受差別對待。有關網站是否屬於ADA第三章所稱公共設施,而使得私法人有改善網頁無障礙技術義務,仍有待觀察。

TOP