合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/01/05)
引註此篇文章
你可能還會想看
日本經產省為了促進智慧家庭(smart home)計畫,以促進資料共享與利用。

  經產省為了在智慧家庭領域創造新事業,整備相關資料活用環境,蒐集共有及分析從多種多樣機器及服務所實際產出之資料,於2017年8月開始實施實證實驗。在實施前,為了使參加實證之民間公司間,得為資訊合作而完備相關規則及保安對策,於5月24日召開「智慧家庭資料活用環境整備推進事業」檢討會。因物聯網(IoT)的擴大得以蒐集龐大資料,以及現在人工智慧(AI)解析能力提高下,期待在各種領域提高生產效率及創造新的事業模式。特別是在智慧家庭領域,其在「新產業構造願景的中間整理」(2016年4月27日、產業構造審議會新產業構造部會)中,為有力重要領域。因此,以IoT技術等使家庭內機器網路化,活用此一資料,除了使既存事業模式發生變革或創造新事業模式外,也期待可以透過把握製品之使用資訊,而提高產品回收(recall)率,並促進資源回收以及家庭部門節能化等相關社會課題解決上。為此,本事業係以對於家庭內機器網路化及透過此而創造新事業為目標,整備事業環境與社會課題及各主題新事業服務創造相連結,因應每個人的生活模式而使得生活空間客製化成為可能,實現智慧家庭之社會目標。

澳洲「頻譜改革」(Spectrum Reform)

  澳洲通訊暨藝術部(Department of Communication and the Arts)在2019年10月宣布,依據通訊部(Department of Communications,為通訊暨藝術部的前身)在2015年所發布頻譜檢視報告(Spectrum Review Report)之建議,推行頻譜改革(Spectrum Reform)措施,以落實改善頻譜管理並建立更有效的頻譜監管框架。其中最重要者為分階段修正現行之無線通訊法(Radiocommunication Act 1992),包含為頻譜使用者提供更高的抗干擾保護,並減除其投資頻譜的不確定風險,例如消除頻譜分配與重分配過程中不必要的限制、延長頻譜許可期限至20年、提供清楚明確的頻譜許可更新指引,並盡可能使設備執照(Apparatus Licence)與頻譜執照(Spectrum Licence)保持一致性。   因應現代通訊技術的發展,澳洲政府自2018年來持續推動頻譜管理現代化(Modernising spectrum management in Australia),包含提高頻譜管理的透明度與定價效率,以達成提高頻譜的使用效率,並建立單一的頻譜釋照框架,這些都將納入現正推動無線通訊法的修正中。此外,澳洲通訊與媒體局於2019年10月25日宣布將釋出26 GH頻段中的2.4 GHz(25.1至27.5 GHz),預計在2021年以拍賣方式分配頻譜執照,除了頻譜釋出外,通訊與媒體局計畫藉由設備執照、類別執照(Class Licence)以及頻譜執照三者的靈活組合,滿足澳洲5G技術應用的頻譜需求,並符合無線通訊法第3條「透過確保有效分配與使用無線電頻譜以最大化其使用效益,進而提升使用無線電頻譜之整理公共利益」之目標,來推動5G技術與創新應用的早期部署。

歐洲專利局(EPO)專利申請案件數量持續增加

  歐洲專利申請案件於2015再次創下新高,達到279,000件之多,較2014年多了近5000件,前五名的國家分別是;美國、德國、日本、法國、荷蘭。當中,向European Patent Office (EPO,歐洲專利局)提出專利申請的就有160,00o件(2014年為152700件),其中美國以及中國的專利申請案件數量頗具貢獻,較2014年增加了16.4%以及22.2%。此數據顯示了全球商業對於專利保護的重視。   EPO 負責人Benoît Battistelli 對此表示,這代表著歐洲不儘有著高度吸引力的科技市場使企業以及研發者爭相投入,更是全球創新能量的核心。   像是義大利和西班牙是在他們近四年來表現最好的一年,專利申請案件分別成長了9%、3.8%;同時,比利時為5.9%、英國為5.7%、荷蘭為3.3%、瑞士為2.6%。甚至也有大幅成長的國家,波蘭成長17.8%、立陶宛成長62.5%。不過,部分國家專利申請案件數量卻是持續下滑,德國下降了3.2%、芬蘭下降8.3%、丹麥下降2.7%。   另外,值得一提的是,不僅是非歐洲當地企業在歐洲的專利申請案件數量有所增加,歐洲當地企業或是研發者於歐洲以外地區的專利申請案件數量也有亮眼的表現,再次顯現了歐洲的創新潛力。   以產業別觀之,醫學科技相關專利申請案數量再次位於EPO中的第一名,成長了11%,引擎相關專利成長18%、 藥學相關專利成長10%、電腦相關專利成長8%。   然而,這樣的成長都與接下來在歐盟會員國之間要實施的單一專利政策有著高度關聯性。單一專利目前由EPO執行,相關的準備已於2015年就緒,包含內部結構的調整,以達到高效率高品質的專利審查過程(去年僅有48%的申請案成功取得歐洲專利)。   當中還有統一專利法庭的設置(United Patent Court),而真正的落實就等德國和英國國內進一步批准United Patent Court Agreement 。EPO對此表示樂觀的態度,認為2016年將會完成所有程序。   最後,歐洲專利開始在歐洲以外地區生效,版圖逐漸擴大。摩洛哥和摩爾多瓦在去年3月、11月都陸續成為非EPO會員卻簽署EPO相關協議,使得該協議法律效果於其國內產生效力。相信這樣的單一專利體制將會對我國有意進入歐洲市場的企業有所助益。 本文同步刊登於TIPS網站(https://www.tips.org.tw)。

美國佛羅里達州「基於保險目的之基因資訊法」最新修正於2020年7月1日正式施行

  美國佛羅里達州州長於2020年6月30日簽署「基於保險目的之基因資訊法」(Genetic Information for Insurance Purposes)法律修正案,並於2020年7月1日正式生效施行。本次「基於保險目的之基因資訊法」修正重點有二: 將「人壽保險」和「長期照護保險」保險人納入「禁止僅根據個人基因資訊即取消、限制、拒絕承保或設定不同保險費費率」之列; 明確規定醫療保險、人壽保險及長期照護保險之保險人,不得基於保險目的,向要保人、被保險人索取基因檢測結果,或要求要保人、被保險人須完成基因檢測後方同意核保。   同時,本次「基於保險目的之基因資訊法」修正理由亦明確說明:禁止醫療保險、人壽保險及長期照護保險之保險人利用基因檢測結果,並非禁止保險人依據醫療紀錄和醫療診斷結果進行核保或計算保險費費率,以此釋疑保險人對此次修正之擔憂。   美國聯邦參議院於2008年即通過「基因資訊平等法」(Genetic Information Nondiscrimination Act of 2008, GINA),惟「基因資訊平等法」僅禁止醫療保險保險人利用基因資訊進行核保,並未禁止其他類型之保險人。美國佛羅里達州本次修正「基於保險目的之基因資訊法」將人壽保險和長期照護保險一併納入規定,是全美首次擴大禁止利用基因資訊進行核保之保險類型。

TOP