合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=65&tp=5 (最後瀏覽日:2026/02/26)
引註此篇文章
你可能還會想看
美國參議院重新提出FDA現代化法案3.0,加速新藥開發之動物實驗新替代方法發展

.Pindent{text-indent: 2em;} .Noindent{margin-left: 2em;} .NoPindent{text-indent: 2em; margin-left: 2em;} .No2indent{margin-left: 3em;} .No2Pindent{text-indent: 2em; margin-left: 3em} .No3indent{margin-left: 4em;} .No3Pindent{text-indent: 2em; margin-left: 4em} 美國前任總統拜登於2022年底簽署《FDA現代化法2.0》(FDA Modernization Act 2.0, FDAMA 2.0),修改FDA自1938年以來新藥必須實施動物試驗之要求,將進入人體臨床試驗之前階段試驗改稱為「非臨床試驗(nonclinical test)」並許可採取非動物實驗方法,為美國在藥物安全監管方面的重大改變。 在FDAMA 2.0通過後,FDA仍未啟動修改監管法規以符合該法,為了確保改革能加速進行,2024年2月6日美國兩黨參議員合作提出《FDA現代化法案3.0》(FDAMA 3.0) 草案並於同年12月12日參議院無異議通過,惟眾議院在第118屆國會結束前並未討論該案,參議員於2025年2月第119屆國會重新提出該法案。 FDAMA 3.0重點包括: 1. 一般規定:FDA應於1年內,建立針對藥品的非臨床測試方法資格認定流程(Nonclinical Testing Methods Qualification Process);個人可申請特定用途的非臨床測試方法資格認定。 2. 符合資格之非臨床測試方法:非臨床測試方法必須可替代或減少動物測試;且提高非臨床測試對安全性和有效性的預測性,或縮短藥物(含生物製品)的開發時間。 3. 符合資格認定之應用:獲資格認定之非臨床測試方法,FDA應加速相關藥品申請(包括變更申請)的審核流程;允許申請人於藥品申請中引用相關數據與資訊。 4. 本法生效日起兩年內應每年向國會報告流程運行情形,包括已認定的方法類型、申請數量、審查天數、批准數量,以及該流程減少的動物數量估算等。 目前雖然其他國家尚未有類似立法,但歐美均投入大量研發資源減少動物實驗,且FDA亦於近日提出《減少臨床前安全試驗使用動物實驗之路線圖》,後續應密切關注本法案是否通過及相關產業影響。

循環型採購(Circular Procurement)

  相較於綠色採購(Green public procurement, GPP)所揭櫫的於採購產品、服務或勞務時選擇於其生命週期中對於環境造成衝擊較小者,循環型採購(Circular Procurement)可說是在綠色採購的基礎上,加入循環經濟(Circular Economy)強調最大化資源利用效率的概念,使對於環境的影響與衝擊並非唯一的標準,而應考量產品、服務或勞務對資源的利用效益。   歐盟執委會於2017年10月發布《循環經濟公共採購範例與指引》(Public Procurement for A Circular Economy: Good Practice and Guidance),其中指出循環型採購的意義在於促進歐盟邁向循環經濟轉型,藉由循環型採購所創造的需求,達成循環經濟所強調封閉資源循環(Closing the Loop)以最大化資源利用效率的概念,並肯認政府採購為推動循環經濟轉型的重要誘因之一。   具體的循環型採購做法,包含選擇具高度資源循環利用性的產品,例如可維修、再利用或利於回收再循環的產品,以及以採購服務代替採購硬體等,透過循環型採購對於資源利用效率的重視,支持符合循環經濟概念的產品設計、研發技術與商業模式等創新成果,與提出這些解決方案的企業或團隊,進而達成促進社會邁向循環經濟轉型與永續發展的目標。

歐盟RELIEF計畫於今(2016)年11月展開前商業化採購之市場公開徵詢

  有鑑於許多歐盟國家為日漸高漲的健康照護成本所困,歐盟於Horizon 2020政策下陸續推動會員國合作以更有效益的創新採購方式進行健康照護計畫的推展,以降低健康照護預算的壓力,RELIEF計畫即屬其一。歐盟於2016年2月啟動RELIEF計畫,聯合義大利、西班牙、瑞典三國,目的在發展創新ICT解決方案以協助慢性病患透過自我管理方式舒緩慢性疼痛、能夠持續獨立生活。欲採購的ICT創新服務為目前尚不存在於市場上、仍需經研發之解決方案,實為針對慢性疼痛自我管理解決方案的「研發服務」,該計畫係採「前商業化採購(Pre-Commercial Procurement, PCP)」方式進行跨國公告招標。目前RELIEF計畫正在進行PCP準備階段之公開市場徵詢,除了透過2個月(今年11、12月)的公開線上問卷調查業者意見,另將以workshop形式舉辦三場公開市場徵詢會議。   RELIEF計畫另一重要目標就是透過此計畫以建立完整PCP流程,讓未來參與相關計畫的公部門能夠熟悉並妥善運用PCP流程及工具 。「前商業化採購」為歐盟廣泛創新戰略中所指出能協助公部門採購「研發服務」的特殊採購程序,以滿足尚未存在市場上、仍需經研發的技術性創新需求,此程序不包含對研發成果的商業化採購,亦不受政府採購法之規範,能夠從需求面刺激廠商創新研發,讓研發從一開始即以機關需求為核心。   RELIEF計畫劃分為PCP之準備階段以及執行階段。於準備階段會進行PCP招標文件準備、採購團隊的需求及現有技術分析、公開市場徵詢(Open Market Consultation, OMC);由於採購機關對其需求尚無具體的規格描述,必須經廣泛的市場意見徵詢與溝通以進一步定義,正在進行中的OMC將聚集採購團隊、潛在投標者(例如對健康照護、數位照護、病患賦權與互動性有鑽研之ICT業者)、終端使用者等,以廣蒐相關利害關係團體意見並進行充分互動溝通,作為執行階段的重要參考基礎。   PCP正式公告後的執行階段即區分為階段A「解決方案設計(Solution design)」(計半年)、階段B「原型開發(Prototype development)」(計半年)、階段C「商業化前開發:場域測試(Pre-commercial development: field test)」(計一年)。各階段將設定參與廠商應達成目標,以篩選出較符合需求者始得進入下一階段,以維持廠商間良性競爭,於階段C最後決標予研發成果最符合計畫需求之廠商(可能1家以上)。   歐盟目前的創新推動策略上PCP屬尚未被充分運用的工具,從該計畫的規劃可見準備階段對後續PCP執行階段的重要性,透過其示範可供政策規劃者為借鏡,運用創新採購驅動產業創新發展以更有效益解決社會與政府需求。

談數位內容法制之立法模式與合併問題

TOP