合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/03/23)
引註此篇文章
你可能還會想看
2005 台日科技高峰論壇 揭示綠色環保的新契機

  「 2005 台日科技高峰論壇」於本﹙九﹚月 16 、 17 日在台北圓山飯店盛大展開,與會者包括台日高階產官學研代表,分就環境政策、環保科技及綠色產品等議題進行交流,研擬未來可能進行的合作模式。   於第一天開幕式中,亞東關係協會科技交流委員會主任委員蕭萬長即表示,藉由科技論壇可以增加政策和策略的相互了解,並減少重複浪費的研發 ; 藉由知識相互激盪可以維持競爭力和高度經濟成長,創造雙贏的局面。日本交流協會台北事務所的池田維代表則指出,先前日本於八大工業高峰會議中所倡議的 3R(REDUCE 、 REUSE 、 RECYCLE) 觀念,獲得各國極力贊成,他希望將日本特性表現在本次研討內容中,以加強彼此合作。   台日科技高峰論壇從 2003 年 4 月成立後,今年乃第三度在台灣舉行,與會貴賓包括日本眾議員水野賢一﹙ Mizuno, Kenichi ﹚ , 以「日本環境政策」發表專題演說;地球環境戰略研究機關理事長森 ( 山鳥 ) 昭夫﹙ Morishima, Akio ﹚則以「建構環保型產業」為題,自法律觀點說明,日本政府如何透過修訂法規之方式,逐步落實 3R 理念及其他永續發展措施;除此之外,日本 JST 、東京大學、北九州市立大學、日立製作所、東元電機、豐田汽車、福特六和汽車等台日環保科技代表亦分就「綠色產品」、「環保科技」等面向擬定專題發表談話。預料本次研討內容,對於未來台日科交流將能形成實質的幫助 , 並為未來科技發展指出綠色環保的新契機。

澳洲規劃研修「國家重型車輛法」並探討科技設備檢測疲勞駕駛相關規範

  澳洲國家交通委員會(National Transport Commission)與警覺、安全、生產力合作研究中心(Cooperative Research Centre for Alertness, Safety and Productivity ,Alertness CRC)於2016年12月攜手研究重型車輛駕駛員之疲勞駕駛影響,並特別探討科技設備檢測及因應的可行性,並著手研析重型車輛疲勞駕駛管理相關規範之評估規劃。   依據澳洲國家重型車輛法(Heavy Vehicle National Law,HVNL)規定,設有國家重型車輛管理獨立機構(The National Heavy Vehicle Regulator,NHVR)針對總重4.5噸之重型車輛進行規範監管。依國家重型車輛疲勞管理規則【Heavy Vehicle (Fatigue Management) National Regulation】規定針對1.超過12噸總重額(Gross Vehicle Mass,GVM)之重型車輛2. 車輛及聯結物超過12噸者3.超過4.5噸可乘載12名成人(包含司機)之巴士4.超過12噸總重額定值之卡車及聯結車,其附接工具或機械者,必須進行疲勞管制,其他對於有軌電車、工具機械車輛(例如:推土機、拖拉機)、露營車等則不在此管制對象。該法針對重型車輛工作和休息時間、工作及休息時間之紀錄、疲勞管理豁免(Fatigue management exemptions),及公司、負責人、合夥人、經理等的連帶責任,訂有相關規範。疲勞管理規則的規範核心在於駕駛員不能在疲勞的情況下行駛重型車輛,故即使符合工作和休息限制,駕駛員也可能因疲勞而受影響。   目前,因有限的證據表明工作安排對於重型車輛駕駛員疲勞的影響程度,亦很少有研究使用客觀和預測技術測量駕駛員的警覺性和疲勞,另對於駕駛員睡眠的質量和時間最低要求的資訊亦不足。因此,現行法律規範對重型車輛駕駛員疲勞的影響將受到挑戰。故警覺、安全、生產力合作研究中心將採取更精準的警報檢測方法和睡眠監測設備,進行相關研究測試,以作為未來國家重型車輛疲勞管理規則修訂之依據。   駕駛疲勞所引發的交通事故時有耳聞,往往造成重大危害與耗費社會成本。目前實務上已有利用科技設備偵測是否有疲勞駕駛情形,然而更重要的是,應落實行車前的疲勞管制,及相對應的解決方案,並加強公司及相關管理者之監督義務及連帶責任,才能有效降低疲勞駕駛肇事率,確保道路安全。

英國通過《2018自動與電動車法》

  英國於2018年7月通過自動與電動車法(Automated and Electric Vehicles Act 2018),對自動與電動車輛之定義、保險議題以及電動車充電基礎設施進行規範。   針對自駕車之保險議題,該法採取「單一保險人模式」(Single Insurer Model),無論是駕駛人自行駕駛或自動駕駛,駕駛人均應購買自駕車保險,讓所有用路人對於可能之安全事故均有保險可涵蓋並追溯責任。本法其他重要規定如下; 本法未直接賦予自駕車(Automated vehicle)明確定義,管理方式係由主管機關自行認定並建立清單。本法僅要求清單內之車輛應設計或調整為至少於某些特定狀況能安全行駛之自動駕駛模式。 已納保之自駕車行駛時所造成之損害,將由車輛之承保公司負擔損害賠償責任。 未納保之自駕車若發生事故,則車主應負擔損害賠償責任。 若由保險人負損害賠償責任,則受害人將可依現行法規提出損害賠償請求。保險人則可依普通法與產品責任相關規定,向應對事故負責之單位或個人提出損害賠償請求。   於電動車充電基礎設施之部分,該法之目的則是確保公共充電站適用於所有市面上之電動車輛,並就費用、付費方式以及相關安全標準進行規範,以增進消費者之信任。該法第20條並授權主管機關訂定相關授權辦法,以達上述目標。

日本推升農業資料契約指針成為補助計畫要點

  日本農林水產省(以下簡稱農水省)從2021年起於補助計畫要點中規定,農業關係人利用農水省補助金導入智慧農機、無人機、農業機器人、IoT機器等所產生資料,且為系統服務業者取得、保管的情況下,須符合2020年農業領域AI資料契約指引要求之相關程序(下稱GL合規)。系統服務業者可依據農水省網站所提供的GL合規CHECKLIST,自行向律師、專利師等諮詢,評估其與農業資料提供者間契約是否GL合規。農水省亦於2020年年底召開兩場相關說明會,條列出須GL合規之補助計畫清單,且相關計畫規定預計於2021年生效(2021年1月6日至2月10日公開招募之智慧農業實證計畫即已有相關規定)。   前述規定係源自於2020年7月17日日本閣議通過最新版「規制改革實施計畫」,其中與「農業資料利用」相關實施項目為:利用農水省補助金導入智慧農業機械時所締結之契約,應符合2020年農業領域AI資料契約指引之核心精神,保障農民可使用其提供給系統服務業者所保管之數據資料。日本政府為促進農業關係人提供資料,於2020年制定農業領域AI資料契約指引,做為農業資料提供者與智農機具系統服務業者訂立契約時之參考。為更進一步促使系統服務業者獲得農業資料提供者的信賴,透過規制改革實施計畫,將該農業資料契約指針推升成為補助計畫要點,可作為我國農業領域推動資料提供、保護、或流通運用機制之借鏡。

TOP