合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/07/01)
引註此篇文章
你可能還會想看
英國取法美國國防先進研發署研發補助機制,提出先進研究發明署法案

  英國商業、能源暨產業策略部(Department for Business, Energy and Industrial Strategy, BEIS)於2021年3月2日向英國國會提交「先進研究發明署法案」(The Advanced Research and Invention Agency Bill),作為英國政府設立獨立研究機構「先進研究發明署」(Advanced Research and Invention Agency, ARIA)的法源依據,用以補助高風險、高報酬之前瞻科學與技術研究,將仍處於想像階段的新技術、發現、產品或服務化為現實。   本法案授予ARIA高度的自主性,使ARIA得以招攬世界頂尖的科學家與研究人員,規劃最具前瞻性與發展潛力的研究領域提供研發補助;同時也給予相較於其他研究機構更多容許失敗的彈性,並明確指出失敗是前瞻科學研究必然經歷的過程。ARIA對於研發資金的運用將因而獲得充分的自主性與彈性,包含對於研究計畫提供快速啟動基金與其他獎項做為激勵措施,或是依據研發進展即時決策是否延續或中止。   ARIA取法自美國國防先進研發署(Defense Advanced Research Projects Agency, DARPA),美國DARPA在網際網路、GPS等技術研發上的成就,直到近期支持針對COVID-19的mRNA疫苗及抗體療法從而取得重大進展,在在顯示了DARPA模式的可行性與重大影響力,而其成功的關鍵在於高度的自主性、靈活性以及最少的行政程序障礙,因此法案將允許ARIA不受政府採購相關限制、並免於政府資訊公開的義務,以減少行政程序對於研發進程的影響。但ARIA每年度仍須向國家審計署提供年度會計報告以作為政府對其最低限度的監督手段,除此之外,商業部長將有權中止與敵對勢力對象的研發合作或結束特定的研究計畫。

幹細胞研究 麻州亮綠燈

  美國麻薩諸賽州州長 Mitt Rom-ney 在五月二十七日否決一項允許在麻州擴大胚胎幹細胞試驗研究法案。州長支持使用成年人的幹細胞或從治療不孕症診所剩餘冷凍胚胎提取細胞的研究,但他呼籲州議員禁止複製,因為提取幹細胞會摧毀胚胎。他說,這相當於創造人類生命只是為了摧毀它,在道德上不具有合理性。此外,他還呼籲州議員在法案中增設一項條款,規定懷孕那一刻即為生命開始,禁止為了其他研究製造胚胎,並限制給捐獻卵子婦女的補償,但州議會拒絕他了的所有這些要求。該州參眾兩會在同月三十一日以壓倒性的票數,推翻州長先前在二十七日所為之否決,並使該法案立即生效。   根據舊州法,若麻州科學家想進行胚胎幹細胞研究,必須獲得地區檢察官批准。新法實施後,科學家不需等待地區檢察官同意後才能進行研究,但州衛生廳將有權管制過程。除此之外,這項新法和聯邦法一樣,禁止複製嬰兒。   美國各州對幹細胞研究的態度迥異,甚至可以說處於分裂狀態。有七個州禁止任何複製研究,十一個州禁止幹細胞研究。但是,加州在二○○四年率先透過法案支持胚胎幹細胞研究,還計劃在十年內從州預算中撥款三十億美元資助這項研究。麻州緊隨其後。紐約、康涅狄格、賓州等也準備放寬對幹細胞研究的限制。 支持胚胎幹細胞研究者紛紛希望,麻州能成為治療脊椎受傷和糖尿病、柏金森氏症等疾病的科學先進研究中心。

新加坡個人資料保護委員會2017年7月發布資料共享指引

  新加坡個人資料保護委員會(Personal Data Protection Commission, PDPC)於2017年7月27日發布資料共享指引(GUIDE TO DATA SHARING),該指引協助組織遵守新加坡2012年個人資料保護法(Personal Data Protection Act 2012, PDPA),並提供組織內部和組織之間的個資共享指引,例如得否共享個資,與如何應用,以確保符合PDPA共享個資之適當方法;並得將特定資料共享而豁免PDPA規範。該指引共分為三部分,並有附件A、B。   指引的第一部分為引言,關於資料共享區分為三種類型探討: 在同一組織內或關係組織間共享 與資料中介機構共享(依契約約定資料留存與保護義務) 與一個或多個組織共享(在不同私部門間、公私部門間)   共享包含向一或多組織為利用、揭露或後續蒐集個資;而在組織內共享個人已同意利用之個資,組織還應制定內部政策,防止濫用,並避免未經授權的處理、利用與揭露;還應考慮共享的預期目的,以及共享可能產生的潛在利益與風險。若組織在未經同意的情況下共享個資,必須確保根據PDPA的相關例外或豁免之規定。   指引的第二部分則在決定共享資料前應考慮的因素: 共享目的為何?是否適當? 共享的個資類型為何?是否與預期目的相關? 在該預期目的下,匿名資料是否足以代替個資? 共享是否需要得同意?是否有例外? 即使無須同意,是否需通知共享目的? 共享是否涉及個資跨境傳輸?   上述因素還能更細緻對應到附件A所列應思考問題,附件B則有相關作業流程範例。   指引的第三部分,具體說明如何共享個資,與資料共享應注意規範,並提供具體案例參考,值得作為組織遵守新加坡個人資料保護規範與資料共享之參考依據。

美國FDA於20250617宣布將試行「局長國家優先審查券」

COVID-19疫情後美國開始積極處理藥品供應鏈脆弱性,為提振本土製造與審查效率,美國食品及藥物管理局(Food and Drug Administration, FDA)於2025年6月17日宣布將試辦「局長國家優先審查券」(Commissioner’s National Priority Voucher, CNPV)。該計畫依據《聯邦食品、藥品與化妝品法》(The Federal Food, Drug, and Cosmetic Act, FFDCA)與《公共衛生服務法案》(Public Health Service Act, PHSA)授權。CNPV將不同審查分組集中處理,並結合資料預先提交機制,力求將一般10-12個月的審查流程壓縮至1-2個月,試辦期為一年,並與現行優先審查及優先審查券(Priority Voucher, PRV)機制獨立並行。 內容要點: 1.遴選資格:符合任一「國家優先」標準之廠商 因應公衛危機:如廣效疫苗開發 帶來潛在的創新療法:超越突破性療法認定成效的新型療法 解決未滿足公共衛生需求:如罕病或缺乏療效標準治療之疾病 提升美國供應鏈韌性:如將藥品研發、臨床、生產遷至美國 提高可負擔性:將美國藥價降至最惠國藥價,或減少下游醫療費用 2.使用與要求: 適用階段:可於申請臨床試驗或申請藥證等階段啟用,亦可先領「未指名券」保留資格。 文件要求:需提前60天提交完整藥品化學製造與管制(Chemistry, Manufacturing, and Controls, CMC)與仿單預審,如遇重大缺件FDA得延長審查期限。 有效性:2年內使用,逾期失效;不可轉讓,但併購案中可沿用。 CNPV透過團隊同日決策,有望在FDA人力縮減背景下縮短審查時程。並強調國家利益,可能優先惠及具戰略價值及在美投資的大型藥廠;對我國優化藥品審查流程與吸引製造投資等目標,亦具重要參考價值。

TOP