合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/02/19)
引註此篇文章
你可能還會想看
桃莉羊誕生十年 複製技術之醫療運用距收成階段仍遙遠

  十年前的 7 月 5 日 ,全世界第一隻複製的哺乳類動物桃莉羊在英國誕生。 複製羊成功的案例,吸引了如潮水般的錢潮,流入探索利用這項新技術的領域,諸如有關治療癌症、心臟病、阿茲海默症和其他嚴重疾病的研究。科學家應用在姚莉身上的技術是屬於「細胞核轉置技術」( SCNT ),簡言之,是把卵子的細胞核取出,然後把身體細胞的細胞核放入這個卵子中。在這個新建構的卵子中,只有來自身體細胞的染色體,而沒有原卵子的染色體,新卵子中僅含有提供身體細胞者的基因組,所以稱之為「複製」。科學複製有很大的潛在風險,代價又高,但它對醫學研究仍有很大的貢獻,其中最引人注意的,就是可取得胚胎幹細胞。   幹細胞是一群尚未完全分化的細胞,同時具有分裂增殖成另一個與本身完全相同的細胞,以及分化成為多種特定功能的體細胞兩種特性,在生命體由胚胎發育到成熟個體的過程中,扮演最關鍵性的角色。研究人員相信未來可以利用幹細胞,修復或是更換受傷或是病變的器官中的細胞或組織,特別是利用有患者自己基因的幹細胞組織移植,可以避免免疫系統的排斥現象。   當年科學家複製桃莉羊時所抱持之野心不小,然而這十年來,科學家們並沒有能夠達成以幹細胞治療人類疾病的目標,雖然因複製 技術本身具有高度爭議性,許多國家已立法予以規制,然卻依舊無法避免如 前首爾大學教授黃禹錫偽造幹細胞研究成果的醜聞發生,這項醜聞使原本即因幹細胞研究和倫理會產生衝突而不易獲得公私部門經費支持的研究工作,更為雪上加霜。   英國胚胎學者指出,回顧過去醫學研究史上的新發現,不論是試管嬰兒或是其他的技術,從第一次到最後技術完全成熟階段,都需要花很長的時間一步步完成,未來可能還需要五十年的時間,複製技術對醫學的貢獻才可能到達豐收階段。

開放生物技術淺析

日本總務省修正電信法施行細則,促進市場競爭和強化消費者保護

  日本國會於2019年9月6日修正並公布電信法施行細則等規範,以配合2019年5月17日通過修正之《電氣通信事業法》(以下簡稱電信法)。電信法施行細則修正內容可分為︰(1)促進電信服務市場競爭;(2)保護用戶利益等兩大面向。針對促進市場競爭,施行細則明定一律禁止以「繼續」利用通信服務及購買手機為條件提供優惠;惟如非要求繼續利用通信服務時,則可對用戶提供不超過2萬日圓額度之優惠,並針對廉價機種、因通信方式變更需利用新通信服務而購買手機,以及庫存手機等狀況設有例外規定。此外,為避免電信業者在用戶解除契約時透過不當手段影響競爭關係,施行細則亦明定電信契約之年限(2年)及違約金上限(1000萬日圓),並新增業者必須提供無期間限制之契約,以及根據定期契約之有無,月費差額上限為170萬日圓等規定。   在保護用戶利益方面,電信法修正時新增有關代理販售店申請制度,以及業者應於推銷時向消費者告知姓名及行銷目的等規定,故施行細則亦配合上述修法,進一步規範上述規定之適用範圍和例外,指出於店面進行銷售時,因店員都配戴名牌,故不用另外告知姓名。

FDA針對境內個人化診斷醫療器材管理發布指引文件草案

  為促進美國境內個人化診斷醫療器材發展並進一步實現個人化醫療之理想與目標,於今(2011)年7月14日時,FDA於各界期盼下,正式對外公布了一份「個人化診斷醫療器材管理指引文件草案」(Draft Guidance on In Vitro Companion Diagnostic Devices)。而於此份新指引文件草案內容中,FDA除將體外個人化診斷醫療器材定義為:「一種提供可使用相對應之安全且有效治療產品資訊之體外診斷儀器」外,亦明確指出,將視此類個人化檢測醫療器材產品為具第三風險等級之醫療器材,並採「以風險為基礎」(Risk-Based)之管理方式。   依據上述新指引文件草案內容,FDA對於此類產品之管理,除明訂其基本管理原則外,於其中,亦另列出兩項較具重要性之例外核准條件。第一項,是關於「新治療方法」(new therapeutics)部分,FDA認為,於後述情況下,例如:(1)該項新治療方法係針對「嚴重」或「威脅病患生命」、(2)「無其他可替代該新治療方法存在」、或(3)將某治療產品與未經核准(或未釐清)安全或功效之體外個人化診斷醫療器材並用時,其為病患所帶來之利益,明顯高於使用該項未經許可或未釐清之體外個人化診斷醫療器材所將產生之風險等前提下,FDA或將例外核准該項新治療方法。其二,是關於「已上市治療產品」部分,依據新指引文件草案,於下列各條件下,或將例外核准製造商以補充方式所提出之「新標示」產品之上市申請案,包括:(1)該新標示產品乃係一項已通過主管機關審查之醫療產品,且已修正並可滿足主管機關於安全方面之要求;(2)該產品所進行之改良須仰賴使用此類診斷試劑(尚未取得核准或未釐清安全功效);(3)將此項已上市治療產品與未經核准或未查驗釐清安全(或功效)之體外個人化診斷醫療器材並用時,其為病患所帶來之利益,明顯高於使用該項未經許可或查驗釐清之體外個人化診斷醫療器材所具之風險等。   此外,FDA方面還強調,若針對某項個人化診斷醫療器材之試驗結果顯示,其具較顯著之風險時,將進一步要求業者進行醫療器材臨床試驗(Investigational Device Exemption,簡稱IDE)。而截至目前為止,此項新指引文件草案自公布日起算,將開放60天供外界提供建議,其後FDA將參考各界回應,於修正後,再提出最終修正版本指引文件;然而,究竟FDA目前所擬採取之規範方式與態度,究否能符合境內業者及公眾之期待與需求?則有待後續之觀察,方得揭曉。

TOP