合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=66&tp=1 (最後瀏覽日:2026/04/10)
引註此篇文章
你可能還會想看
智慧財產局修法賦予動植物專利權,但將不及繁殖物

  我國專利法修法後,將全面開放動植物專利,其中,最引起各界關注的問題是動植物專利權的效力。動植物專利的保護,有助於發展國內生技產業,但保護過度,又會影響農漁民生計,故智慧局在五月初發布之專利法部分條文修正草案中,增訂動、植物專利權利耗盡之範圍包括必然導致繁殖之專利生物材料本身及其所繁殖之生物材料,但不包括為繁殖之目的而使用該繁殖之生物材料之行為。   根據現行專利法第56條第1項規定,獲得動植物相關發明的物品專利權人,專有排除他人未經其同意而製造、為販賣的要約、販賣、使用或為上述目的而進口該物品之權。惟專利法第5條規定,專利物品本身經第一次販賣後,專利權效力及不於後續的實施行為。動植物的繁殖特性,如果一經販賣後,專利權效力即不及,則勢必影響動、植物發明人的權益。   基於上述理由,智慧局經參考歐盟生物技術發明指令第八條,於專利法部分條文修正草案中明訂動植物等生物材料之專利權耗盡範圍,另為了保護農民權益,此次專利法修正草案中亦特別明訂農民免責,使農民自專利權人或其授權人處取得受專利保護之植物繁殖材料,可將收穫後之種子在其農地上進行繁殖使用,而為專利權效力所不及。

新加坡與東協八國智財局簽署合作協議,加速特定領域專利申請流程以推動東協轉型工業4.0

  新加坡智慧財產局(IPOS)於2019年8月28日2019年新加坡智財週活動(IP Week @ SG 2019)中,宣布與東協(ASEAN)八國智財局簽署合作協議,新加坡與八個東協成員國智財局將推動在金融科技、網路安全、機器人等關鍵新興科技領域的專利加速審查與許可時程,在為期兩年的試辦計畫當中,企業與研發者最快將可以在提出申請後6個月獲得專利許可,以加速東協國家在推動轉型工業4.0相關基礎建設與製造的進程(Acceleration for Industry 4.0 Infrastructure and Manufacturing,簡稱AIM),並有助於東協國家掌握工業4.0為全球所帶來預計高達1.2兆至3.7兆美元的龐大商機。   根據國際知名管理顧問公司麥肯錫公司(McKinsey & Company)的統計,工業4.0將能為東協國家帶來至少2160億至6270 億的巨大製造業商機,除了前述加速關鍵新興科技領域專利審查的AIM試辦計畫外,包含新加坡在內的九個合作國智財局將擴大合作範圍至專利合作條約(Patent Cooperation Treaty,簡稱PCT),在為期三年的試辦期間內,專利申請人將可選擇透過取得東協國際檢索局(ISA)與國際初步審查局(IPEA)的PCT報告,以加速專利申請人在其他東協國家的專利申請。新加坡透過與東協國家、世界各國的智財合作,積極推動新加坡與全球創新社群(global innovation community)的連結,不僅為全球創新趨勢提供更多價值,亦同時鞏固新加坡作為創新中心的國際地位與經濟成長動能。

美國參議院提出「2019年物聯網網路安全促進法」草案

  自2016年Mirai殭屍網路攻擊事件後,物聯網設備安全成為美國國會主要關注對象之一,參議院於2017年曾提出「2017年物聯網網路安全促進法」(Internet of Things Cybersecurity Improvement Act of 2017)草案,防止美國政府部門購買有明顯網路安全性漏洞之聯網設備,並制定具體規範以保護聯網設施之網路安全,然而該法案最終並未交付委員會審議。   2019年4月,美國參議員Mark Warner提出「2019年物聯網網路安全促進法」草案(Internet of Things Cybersecurity Improvement Act of 2019),再度嘗試建立物聯網網路安全監管框架。本法將授權主管機關建立物聯網設備所應具備之安全性條件清單,而該清單將由美國國家標準與技術研究院(National Institute of Standards and Technology)擬定,並由管理與預算局(Office of Management and Budget, OMB)負責督導後續各聯邦機關導入由美國國家標準與技術研究院所制定之網路安全指引。本法草案相較於2017年的版本而言雖較具彈性,惟網路安全專家指出,清單之擬定與執行管理分別交由不同單位主責,未來可能導致規範無法被有效執行,且聯邦各層級單位所需具備之資安防護等級不盡相同,如何制宜亦係未來焦點。

NHTSA要求自動駕駛系統及L2自動駕駛輔助系統回報意外事件

  美國國家公路交通安全管理局(National Highway Traffic Safety Administration, NHTSA)2021年6月29日 「自駕車與配備等級2駕駛輔助系統車輛之意外事件回報命令(Standing General Order 2021-01:Incident Reporting for Automated Driving Systems and Level 2 Advanced Driver Assistance Systems)」,課予系統製造商與營運商意外事件回報義務,重點如下: (1)適用範圍:全美境內公共道路上發生之車輛碰撞事件,事發前30秒至事件結束期間內曾經啟用等級2駕駛輔助系統或自動駕駛系統。 (2)意外事件定義:事件中任何一方有人員死亡或送醫治療、車輛必須拖吊、安全氣囊引爆或事件涉及弱勢用路人(vulnerable road user)。 (3)回報期限:須於知悉事件後隔日立即回報,知悉後10日傳送更新資料,如後續仍有發現新事證,應於每月15號傳送更新。自駕車發生碰撞,即使無人傷亡、無車輛拖吊或安全氣囊引爆,仍需於次月15號傳送事件回報。 (4)回報方式及項目:需至NHTSA指定網站註冊帳號,線上填寫制式通報表格。項目包含車籍資料、事件時間、地點、天候、路況、傷亡及財損情形等等。   NHTSA收到的回報資料,原則上會在將個人資料去識別化後對大眾公開,惟若系統製造上或營運商主張部分資訊為商業機密,可另行向NHTSA之諮詢辦公室通報審核。如逾期未報或隱匿資訊,可處每日最高22,992美元罰金,累計最高罰金為114,954,525美元。

TOP