合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/07/04)
引註此篇文章
你可能還會想看
從匯流看我國電信與廣播電視產業之法律規範

歐洲議會初步通過化妝品新法案,奈米化妝品成為規範之列

  奈米科技在化妝品領域之應用實例日益增多,對於此類產品之管理趨向也成各界關注的重點,可惜國際間遲遲未有突破性進展。   今(2009)年3月24日,歐洲議會初步通過化妝品規則之新法提案(提案編號:COM(2008)0049-c6-0053/2008-2008/0035(COD)),未來若獲正式通過,將可直接適用於歐盟各國。   就實質內容而言,歐盟在該規範中首次納入奈米科技之考量。其所界定之奈米材料為:「一種具有非溶解、抗生物性之材料,係經由人為單一或多次外部切割或內部建構,尺寸範圍在1至100奈米之間」。為確保奈米化妝品之安全性,該規範透過強制通報、安全評估,以及禁止使用有害人體健康之物質等機制進行管理。此外,化妝品倘若含有或使用奈米材料,製造人必須在產品包裝上之內容物清單中加以標明。   歐洲議會是以633位之多數票一讀通過了該法案,不過也有29位投票反對、11位放棄表示意見。 此外,各界對此立法之反應不一,消費者團體認為應儘早實施該法案;歐洲議會綠黨議員則對法案中的奈米材料之定義不予認同。   根據歐盟執委會評估,目前約有5%的化妝品使用奈米材料,主要是市面上銷售之防曬油、口紅以及抗老化乳霜。隨著此項運用趨勢的發展,很多消費者團體抱怨立法過於緩慢而無法趕上市售產品之發展腳步,而本次立法可望為奈米化妝品之管理開展新的契機與方向。

歐洲創新理事會發布2026年EIC技術報告,揭示25項深具發展潛力的新興技術訊號

歐洲創新理事會發布2026年EIC技術報告,揭示25項深具發展潛力的新興技術訊號 資訊工業策進會科技法律研究所 2026年05月25日 歐洲創新理事會(European Innovation Council, EIC)於2026年3月30日發布「2026年EIC技術報告」(EIC Tech report 2026,下稱EIC報告),提出25項新興技術訊號(signal),亦因相關技術極具發展潛力,將可能塑造歐洲未來的科技創新、產業和市場。 壹、事件摘要 EIC根據歐盟展望歐洲(Horizon Europe)科技研發架構計畫之申請、補助及專案管理資料,並涵蓋旗下近五年探路器計畫(EIC Pathfinder)、轉型器計畫(EIC Transition)及加速器計畫(EIC Accelerator)等超過13,380 件提案與獲補助案件,透過資料探勘及專家評估進行前瞻技術掃描,歸納出25項深科技新興技術訊號,並強調相關技術目前處於低至中度成熟階段,但已顯現未來發展潛力與創新性。 貳、重點說明 一、EIC報告辨識25項新興技術訊號,並分為三大領域 (一)數位與太空技術(Digital and space technologies) 1. 技術重點 此領域共9項技術,主要涉及先進半導體、安全運算架構、AI系統、量子通訊,以及太空基礎設施,顯示歐盟將數位主權、資訊安全及太空能力視為核心布局方向。 2. 技術簡介 9項技術包含:用於先進記憶體與憶阻裝置的二維材料(2D materials for advanced memory and memristive devices),有助於新型記憶體及神經形態運算技術發展;可量產之工業電磁設備的MXene二維奈米材料製造技術(Scalable MXene manufacturing for industrial electromagnetic applications),可應用於通訊、汽車電子、感測與新世代無線基礎設施;用於建立無須信任節點量子網路的量子中繼站(Quantum repeaters for trusted-node-free quantum networks),可突破量子通訊距離限制,使量子訊息於數百甚至數千公里距離下被安全傳輸;用於分散式及聯邦式學習之AI系統中的零信任架構(Embedded Zero Trust Architectures for distributed and federated AI systems),可強化對AI模型與資料運算的控制能力;應用於新興自我組織及資源效率系統之仿生AI技術(Bio-inspired AI for emerging self-organising and resource-efficient systems),借鏡神經科學、認知科學與演化生物學原理來設計AI系統,使其具備更高適應性、穩健性與資源效率;將自適應代理人用於開放動態環境中之具身AI技術(Embodied AI for adaptive agents in open and dynamic environments),將感知、內部認知、模擬行動能力等緊密結合之AI系統,並於開放環境中持續互動學習,主要用於支撐機器人、AI自主代理、數位孿生,以及其他需連續決策、長時程的智慧系統;用於大規模且可通訊中斷之衛星運作的邊緣運算技術(Edge computing for scalable and loss-tolerant satellite operations),將資料處理分析能力直接部署於衛星或軌道平台上,使其即時篩選、分類與判讀資訊,並支援自主決策,可用於深空任務、地球觀測、太空碎片管理;用於特殊太空環境之石墨烯塗層與複合材料(Graphene-based coatings and composites for performance-critical space systems),將石墨烯整合為薄膜、塗層、填充材料,提升太空機械之強度、阻隔能力及輻射防護效果,並廣泛應用於太空領域;用於軌道基礎設施維護與再利用之先進太空維修機器人技術(Advanced in-space servicing robotics for orbital infrastructure maintenance and reuse),使機器人於太空環境下進行機械操作、檢查、維修、對接等複雜性任務。 (二)清潔和資源效率技術(Clean and resource-efficient technologies) 1. 技術重點 此領域共7項技術,此類重點在於資源回收、水汙染處理與資源再利用、提升能源效率及綠色建築技術等,反映歐盟將淨零轉型與關鍵原物料供應安全一併納入政策目標。 2. 技術簡介 7項技術包含:用於再生金屬回收與生物復育之微生物採礦技術(Microbial biomining for secondary metal recovery and bioremediation),運用微生物與金屬間的交互作用,實現金屬回收,並同時修復重金屬污染之生物技術;用於低耗能海水淡化與水處理之電容去離子技術(Capacitive deionization systems for low-energy water desalination and treatment),新穎、低用電之新型水處理技術,用於海水淡化、工業及都市廢水處理、重金屬或養分去除,以及分散式水資源處理與回收;去除污染物之電化學水處理技術(Electrochemical treatment systems for destruction of persistent contaminants in water),利用電化學反應在水中直接化學轉化或礦化分解全氟及多氟烷基物質(PFASs)、微塑膠及奈米塑膠等高度持久性污染物之水處理技術;用於低溫及中溫廢熱回收之先進熱電發電材料技術(Advanced thermoelectric materials for low- and mid-temperature waste heat recovery),將交通建築系統與回收產業中之低溫及中溫廢熱能,轉為電力的材料技術,可提升能源效率,並降低對外部能源與關鍵材料的依賴;用於固態熱電轉換與感測之熱激發自旋電子材料技術(Spin-caloritronic materials for solid-state heat-to-electricity conversion and sensing),利用熱梯度引發之自旋電流與磁性激發產生電能的材料技術;用於預測材料製造之結合數位孿生之反算設計技術(Inverse design with digital twins for predictive materials manufacturing),運用AI驅動之逆向設計方法,以目標性能反推材料配方與結構,並透過數位孿生模擬真實環境表現,建立快速、可預測且貼近實際應用情境的新材料設計與製造流程;被動冷卻與重力儲能之能源建築技術(Passive cooling and gravity-based storage for energy-active buildings),利用建築表面的先進材料於不耗電情況下降溫,並將多餘再生能源以重力位能方式儲存於建築內,藉以降低建築冷卻用電需求、儲存局部多餘再生能源等。 (三)生物科技與健康技術(Biotechnologies and health) 1. 技術重點 此領域共9項技術,橫跨食品、生物製造、精準醫療、智慧醫療設備及分散式醫療應用,顯見歐盟關注的不只是單一生技或醫療技術突破,而是期望建立從生物研發、生產製造、臨床治療到醫療設備部署的完整體系,藉此強化歐盟下一代健康科技與高價值生技產業的競爭力與自主能力。 2. 技術簡介 9項技術包含:用於原形食物製造之菌絲體混合發酵技術(Mycelium-based hybrid fermentation for whole-food production),結合菌絲體生長與精準發酵,生產接近原型食物型態的新型蛋白食品原料;用於再生農業系統之生物技術多年生作物(Biotech-enabled perennial crops for regenerative agricultural systems)以生物技術改良多年生作物,使其兼具較佳產量與土壤保育效益,支撐再生農業與更永續的糧食生產系統;用於預防與個人化治療之新型微生物體療法(Novel microbiome therapeutics for preventive and personalised health),利用人體微生物群的組成、功能及其代謝產物,來預防、管理及治療疾病的新一代醫療技術;加速藥物與酵素探索之AI驅動蛋白質設計技術(Computational protein design for accelerated drug and enzyme discovery),透過AI預測蛋白質結構與功能,加速藥物與酵素探索,縮短新藥研發時程;可量產之嵌合抗原受體免疫細胞療法之自動化製造技術(Automated manufacturing technologies for scalable CAR immune cell therapies),以自動化、標準化製程提升嵌合抗原受體(Chimeric Antigen Receptor, CAR)免疫細胞療法的穩定量產能力,降低細胞治療製造門檻;可於細胞尺度介入治療之生物混合微型機器人(Biohybrid microrobots for cellular-scale therapeutic interventions),結合生物組件和人工材料的微型機器人,形成可於細胞或微小組織尺度中移動與作用的治療工具,可用於精準遞藥、微創介入與局部治療;整合手術流程之自主機器人系統(Autonomous robotic systems for integrated surgical workflows),將AI、計算機視覺、感測技術及機器人技術,整合進手術流程中,並於無人或少人參與下,執行部分自主或高階輔助手術任務,可提升手術精準度、效率與流程整合;用於神經疾病治療之非侵入式微創腦機介面技術(Noninvasive and minimally invasive brain interfaces for adaptive therapeutic modulation),透過非侵入或低侵入方式讀取與調控腦神經訊號,以實現持續、可調適的治療介入,可用於神經疾病治療與復健;提供分散式臨床場域應用之可攜式超低場磁振造影(Portable and ultra-low field magnetic resonance imaging for distributed clinical uses),使磁振造影(Magnetic Resonance Imaging, MRI)設備朝攜帶式、低磁場化發展,降低設施與操作門檻,利於偏鄉、急診與分散式臨床試驗之醫學影像診斷應用。 參、事件評析 EIC報告辨識出25項新興技術訊號,並將其歸納為數位與太空技術、清潔和資源效率技術,以及生物科技與健康技術三大領域。該報告不僅有助於歐盟及早掌握具發展潛力之新興深科技方向,亦可作為研發政策制定、創新支持措施規劃及投資判斷之重要參考依據。 此外,EIC報告以「技術訊號」作為分析單位,顯示歐盟有意於新興技術尚未成熟前,提前進行辨識、評估與布局,除保障創新競爭力外,亦可避免在未來關鍵技術競爭中受制於人。 就政策意涵而言,EIC報告不僅有助提升歐盟對前瞻科技治理的能力,亦有助於串聯創新支持工具、產業政策與戰略技術平台,進而形塑較為完整的科技治理體系。對我國而言,EIC採取資料探勘與專家判讀並行之新興技術訊號偵測機制,對我國科研成果運用、前瞻技術治理及國家科技政策規劃,均具有相當參考價值。

NIH公布最新GWAS基因型與表現型數據資料庫分享近用方針

  經過了一整年向各界諮詢與彙整各方意見後,美國國家衛生研究院(NIH)於今年8月底,公布其所資助之GWAS基因型與表現型數據資料庫(genotype-phenotype datasets)之分享近用方針。此方針希望在保障研究參與者的個人隱私前提下,協助科學研究社群取得相關基因數據資料。GWAS數據資料對科學有顯著的幫助,並具有龐大的潛在公共利益,然而,提供個人的基因型與表現型資料進行科學研究,涉及個人隱私與秘密之保護,故具有高度的敏感性而受到大眾關切。   因此,NIH在訂定這項方針時,為了搜集各方意見,首先於去年5月,宣布計畫更新GWAS的數據資料分享政策,後於去年8月公開徵詢大眾對方針之意見,次又依據所蒐集之各方意見,於去年12月針對此分享政策舉辦會議進行討論,根據這些討論所形成之共識,併同NIH內部討論之結果,最後形成此項分享政策。   方針中指出,如何在促進科學研究之目的,與保護相關參與人的權利間取得平衡,是相當重要的議題,故本方針分別對研究人員近用之程序、基因數據資料的處理與參與者權利之保護進行詳細規範。舉例來說,本方針要求欲近用資料庫的研究人員,提供其研究必須使用此資料庫的書面說明資料;另外也會對所有存放在資料庫的數據資料進行去個人化處理,使該項資訊無法再以技術判別,並使用隨機方法加密,以確保參與者的隱私與保密資料不遭外洩。根據NIH表示,此方針雖然僅是對GWAS數據資料庫的近用作規範,但未來亦有意將其作為近用其他類似資料庫的規範參考架構。

TOP