合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=645&tp=5 (最後瀏覽日:2026/02/18)
引註此篇文章
你可能還會想看
淺析企業如何善用無形資產獲取商業利基

韓國特許廳推動「技術公開網路服務」,公開技術達到防禦性功能且促進公眾利用

  韓國特許廳自2000年12月開始提供「技術公開網路服務」,透過此網站服務,研究人員可將其研發的技術公開、並登載在韓國特許廳的技術公開網站,藉以取得具公信力的公開日期。假若網站上公開的技術與先申請專利的其他技術相似,但其公開日期較早,那麼網站上公開的技術會被認為他人申請專利時的先前技術(prior art),他人就無法取得專利權。此一服務的目的在於希望企業或個人的研究開發成果可防止他人以相同或類似的技術申請專利,作為一種防禦手段。另公開的研發成果也可提供公眾免費使用,進而促進整體產業的發展。   為改善「技術公開網路服務」,增加使用上之便利性,韓國特許廳2011年10月起推出新的「技術公開網路服務」系統,規定必須載明公開的必要記載項目(包括標題、相關領域、目的、技術組成內容),以利其他人得以簡便地了解被公開的技術內容。利用人可到韓國特許廳建置之「專利資訊檢索服務(Korea Intellectual Property Rights Information Service, KIPRIS) 」網站進行檢索,搜尋所需之技術內容。   研發者可以將自己的發明想法公開,防止他人就同一或類似技術申請專利;同時任何人皆可查詢利用已經公開的技術,避免重複研發,也可讓業界掌握技術發展的最新動向,以促進技術之活用。

中國大陸修定「網絡交易管理辦法」,課與第三方交易平台多項經營責任

  中國大陸國家工商行政管理總局為加強網路交易消費者保護,在2014年03月15日起實施「網絡交易管理辦法」,就企業經營者責任新設多項規定。特別是針對第三方交易平台業者,辦法要求其建立交易規則、消費資訊保存、不良訊息處理、消費糾紛調解管道等管理制度,以確保平台服務品質。同时要求平台業者建立審查制度,對申請進入平台從事經營活動之賣家,進行身分審查與建檔,透過以網管網,達成有效率的網路身分管理。   另外,為確保網路交易市場秩序、公平競爭,本辦法亦例示多項不公平競爭行為態樣,包括任意調整信用評價、傷害他人商譽等影響交易秩序之欺罔行為,皆受到明文禁止。甚至在商標侵權情況中,平台在接收到侵權通知時,必須積極採取必要措施,否則就因此損害擴大部分,將與侵權行為人共同承擔連帶責任。   考量在兩岸近期簽署之「海峽兩岸服務貿易協議」中,陸方已承諾對台開放「在線數據處理與交易處理業務」之電子商務網站經營,待將來協議完成相關程序生效後,台灣電子商務業者在進入大陸市場經營交易平台時,勢必受到本辦法規範,實應留意相關要求以避免觸法。

歐盟檢視「2005-2009年歐洲奈米科學與技術行動計畫」之執行成效

  歐盟執委會(European Commission)於今年9月初公佈了「『2005-2009年歐洲奈米科學與技術行動計畫』(Nanosciences and Nanotechnologies: An action plan for Europe 2005-2009)之期中執行報告」,文中總結了於2005至2007年有關該計劃重點領域執行之相關的活動及進程。   在該報告中,歐盟執委會也在報告中指出歐洲在奈米科學與技術發展上的一些弱點,包括:主要跨領域基礎設施的缺乏、私資金在奈米科技產業研發創新上的短缺(儘管「歐洲技術平台」積極鼓勵私人參與奈米科學與技術的投資,但目前私資金仍只佔全部資金之55%)、以及隨著歐盟會員國投資的增加,重複研究及分裂研究的風險也隨之增加。此外,奈米科技跨領域及創新的本質對於既有之研究、教育、專利授予及規範等方法也形成不少的挑戰。   另一方面,報告也指出歐洲在一些重點區域研究的整合相當成功;例如,在中小企業參與第六期研發綱領計畫(FP6) 中之奈米科學與技術計畫的部份,即由2003-2004年的18%成長至2006年的37%。此外,歐盟執委會也有計劃地來支持技術商業化的發展,像是競爭及創新計畫(Competitiveness and Innovation Programme)、財務風險分攤機制(Risk Sharing Financial Facility)、以及接收利用奈米技術為基礎之控制管路(pilot lines);未來,歐盟執委會計畫對負責任奈米科學與技術之研究採取自願性的行為規範。   下一份奈米科學與技術行動計畫之執行報告預計在2009年底公佈。

TOP