合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/02/23)
引註此篇文章
你可能還會想看
英國通過《2018自動與電動車法》

  英國於2018年7月通過自動與電動車法(Automated and Electric Vehicles Act 2018),對自動與電動車輛之定義、保險議題以及電動車充電基礎設施進行規範。   針對自駕車之保險議題,該法採取「單一保險人模式」(Single Insurer Model),無論是駕駛人自行駕駛或自動駕駛,駕駛人均應購買自駕車保險,讓所有用路人對於可能之安全事故均有保險可涵蓋並追溯責任。本法其他重要規定如下; 本法未直接賦予自駕車(Automated vehicle)明確定義,管理方式係由主管機關自行認定並建立清單。本法僅要求清單內之車輛應設計或調整為至少於某些特定狀況能安全行駛之自動駕駛模式。 已納保之自駕車行駛時所造成之損害,將由車輛之承保公司負擔損害賠償責任。 未納保之自駕車若發生事故,則車主應負擔損害賠償責任。 若由保險人負損害賠償責任,則受害人將可依現行法規提出損害賠償請求。保險人則可依普通法與產品責任相關規定,向應對事故負責之單位或個人提出損害賠償請求。   於電動車充電基礎設施之部分,該法之目的則是確保公共充電站適用於所有市面上之電動車輛,並就費用、付費方式以及相關安全標準進行規範,以增進消費者之信任。該法第20條並授權主管機關訂定相關授權辦法,以達上述目標。

美國公布「2050淨零排放之路:美國長期策略」

  美國於2021年11月1日公布「2050淨零排放之路:美國長期策略」(The Long-Term Strategy of the United States: Pathways to Net-Zero Greenhouse Gas Emissions by 2050),確立美國未來十年溫室氣體減量發展方向,希望透過聯邦政府與各州、地方政府間合作,並結合社會整體力量,使美國可以在2050年實現淨零排放,並支持更加永續、具彈性且平等的經濟發展,實現完全的零碳污染、強化經濟及提升大眾健康。   本報告首先強調從現在開始至2030年約十年間溫室氣體排放減量的重要性,並說明美國接下來將以溫室氣體排放減量,作為未來達成淨零排放目標之基礎。為了達成淨零排放,美國計畫自能源、產業的排放結構著手推動轉型,報告中公布五項具體目標: 電力脫碳化:近年來因為風力及太陽能等潔淨能源發電成本急遽降低,能源轉型的腳步也逐漸加快,在此基礎上,美國訂定2035年達到100%潔淨電能的目標,並預計電力部門可於2050年以前達到真正的淨零排放。 電動化或轉換為潔淨能源:推動各部門電動化,使交通、建築物及工業製程可以使用合理成本且具一定效率的電力作為主要能源;針對航空、海運及部分工業製程等以現行科技水準較難實現電動化的經濟活動,則推動轉換為氫能、永續生質能等較潔淨的燃料。 減少能源浪費:透過新技術的開發,提升能源使用效率,例如於新建建築物使用能源效率較優的設備、更新既有建物之設備、改善工業製程的能源效率等。 降低甲烷等非二氧化碳溫室氣體排放:採取適當措施以減少甲烷、氫氟碳化合物、氮氧化物等非二氧化碳溫室氣體之排放,包括於石油及天然氣系統加裝甲烷洩漏感測器,以監控其洩漏狀態,以及將冷卻設備中的制冷劑從氫氟碳化合物更換為環境友善的其他物質。 移除大氣中二氧化碳:增加自然碳匯,或以目前可實際運用的技術吸收大氣中的二氧化碳。   美國預計結合聯邦、地方政府,以及產業、學術機構、投資人等社會各界,透過政策執行,強化推動能源、運輸、土地利用等經濟活動的溫室氣體減量工作;同時,配合資金導入,支持並給予各部門足夠的誘因投入潔淨技術的開發,並透過合作,以減少技術開發時可能遭遇的障礙及付出的成本,帶動美國整體朝淨零目標邁進。

電玩角色身上之「刺青」著作權歸屬議題

  隨著遊戲產業不斷提升遊戲畫面的精緻程度,遊戲角色也更加貼近於真實。近期,一款由Take-Two(遊戲開發商)推出名為「NBA 2K」的遊戲,遭到Solid Oak(集合刺青家授權,保護刺青著作權)控告遊戲角色(NBA球星)身上的刺青出現在遊戲中,是侵害刺青圖案著作權的行為。   本案之爭點為遊戲中出現的刺青是否納入著作權保護範圍內及遊戲開發商對於刺青的再次使用及展示有無違著作權法。Solid Oak顯然符合關於著作權法對於原創性(original works)的要求,惟由於刺青師與運動員並無任何著作權協議,因此推斷刺青師仍保有著作權。Take-Two主張在遊戲的使用上屬於公平且微量的。他們在遊戲中所呈現之畫面,其唯一目的是保持運動員真實性形象,若不去暫停或者放大畫面,幾乎看不清楚那些圖案(刺青)。由於本案仍在訴訟中,未來是否能肯認此為合理使用,並未明確。現階段如要避免此類爭訟,或許遊戲開發商得考慮直接向刺青師(藝術家)取得授權,或由運動員與刺青師簽約並取得授權,進而使遊戲開發商出版遊戲時,得透過與運動員或聯盟等簽訂使用球員形象之合約,間接使用該等圖案。   隨著科技的發展,從虛擬實境內容涉及實體藝術品之著作權,到真實人物形象於遊戲中呈現的著作權歸屬,智財權議題越趨多元。未來在快速變遷的時代,在智財權保護及科技發展之衡平上,更應保留彈性不設限範圍。

行動生活之隱私爭議-現行法制能否妥善處理位置資訊衍生問題

TOP