合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/02/01)
引註此篇文章
你可能還會想看
日本規制改革推進會議促進農業數據利用

  日本政府規制改革推進會議係由內閣府發布政令所成立,具跨部會協調性質、推動日本法規調適之委員會,規制改革推進會議於今(2020)年7月2日向安倍晉三首相報告,從去年10月起歷經8個月審議規制改革項目的審議結果後,最新版「規制改革實施計畫」於7月17日通過閣議決定。規制改革實施計畫中關於農林水產領域「促進智慧農業普及」項目,除了促進無人機、自動行走機普及、農作物栽培設施設立而調和相關規定外,「農業數據利活用」項目首見於規制改革實施計畫,實施項目包括以下四項: 利用農林水產省補助金(見註1)導入曳引機、農業機器人、無人機、IoT機器等智慧農業機械時,應符合以下要件:根據農業領域AI數據相關契約指引,農民可以使用其所提供給系統服務業者所保管之數據,該契約條文應包含於數據契約中。 農林水產省與農機廠商合作建構OPEN API數據環境,透過使用農機時所取得位置座標、作業紀錄等數據,未來農民可以將此數據使用於非出自該農機廠商的其他軟體。 農林水產省於2022年度預算開始,利用補助金導入農機廠商的農機時,須符合上述第2點OPEN API要求。 農林水產省將發出以下明確通知:因鳥獸害、緊急救難、搜索犯人、農業道路塌陷等應配合公家機關等具高度公共性事務,以及為保護人的生命身體財產等必要之情況,農機廠商如事前已徵得農民的概括性同意,可提供從農民方所取得之數據予有關當局。   日本政府為加速智慧農業落地普及,藉由調和農林水產省補助金規定促進農業數據流通運用,保護農民數據使用權利,且將農業數據擴散利用於公共事務,凸顯日本政府對於農業數據保護與運用的重視,值得我國做為借鏡。 註1:補助金不限於「有關補助金等預算執行適正化相關法律[昭和 30 年法律第 179 號]」(補助金等に係る予算の執行の適正化に関する法律[昭和 30 年法律第 179 号])的補助金,包括其他交付金、委託費。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

惠普 : 軟體專利是必要之惡

  智慧財產權議題涉及專利、著作權和商業機密,近年來因開放原始碼軟體而備受矚目。開放原始碼軟體可共享、修改和重新發布,和傳統專屬軟體的保密性和發布限制迥然不同。   許多開放原始碼與自由軟體倡議人士都痛批軟體專利,相形之下,惠普以擁有大量的專利為傲。2004年惠普一共獲頒1,775項美國專利,在美國排名第四。   惠普Linux負責人表示,開放原始碼程式設計師或許厭惡軟體專利的概念,但最好還是試著自我調適,因為軟體專利是不會消失的。且開放原始碼軟體是在著作權法的基礎上發展而成的,而專利比較麻煩,是因為程式設計師把專利視為削弱他們的自由。另一方面,企業則把專利看待成自家珍貴創意的保護傘。   惠普Linux副總裁Martin Fink批評開放原始碼促進會(Open Source Initiative;OSI)核准開放原始碼授權證書的作法太草率。去年8月,Fink曾指出,開放原始碼授權證書多達52種,實在太多了。現在數目變得更多,因為他抱怨OSI核准任何符合開放原始碼定義的申請案,卻不試著加以整併以強化開放原始碼業的基礎。只基於符合規格就核准授權證書,而未顧及進一步鞏固開放原始碼經營模式的能力,這會構成明顯而迫切的危險。   一家銷售智財權法律免責保險的公司說,調查顯示,Linux作業系統的核心(kernel)可能涉及283項專利侵權。惠普2002年也提醒眾人,微軟可能醞釀對開放原始碼軟體提出專利訴訟。但目前為止這些威脅尚未發生,而紅帽公司(Red Hat)和Novell揚言運用自家專利反制那類威脅,IBM和昇陽也表明不會針對開放原始碼侵犯的數百項專利提出告訴。

美國專利及商標局(USPTO)因應COVID-19提出相關救濟措施

  今年全球受到新型冠狀病毒(下稱COVID-19)影響,許多產業遭受嚴重衝擊。美國政府於2020年3月27日頒佈「新冠病毒援助紓困經濟安全法(簡稱CARES)」,對此專利及商標局(USPTO)也針對受COVID-19影響之專利或商標申請案,給予延長申請期限、付款等寬限措施。   由於寬限措施將於今年5月31日到期,USPTO認為COVID-19爆發的影響可視為37 CFR 1.183所指的特殊情況。因此,USPTO將允許專利權人通過EFS-Web或專利中心,提交符合某些條件之專利及商標救濟申請。   商標救濟措施部分,因COVID-19影響商標審判與上訴委員會之訴訟,可提出延長或新時間之申請。其他未能即時對主管機關的訴訟提出答覆,致使放棄商標申請案,得提出恢復請求;未能於法定使用期限36個月內或維護申請截止日前申請,致使放棄商標申請或商標註冊被取消或期滿,得提出請願書。上述請願書中若附有COVID-19聲明,USPTO除免除相關費用,並可延續救濟措施至6月30日。   專利救濟措施部分,針對小型和微型企業(small and micro entities)之專利申請提交期限,由原先6月1日延長至7月1日;大型企業(large entities)於5月31日後,依個案申請提供延期,包含請願書及所需費用;對於所有企業,USPTO將免除6月30日及先前因COVID-19影響所提出審查、請願書等費用收取。

內政部、經濟部發佈「新建建築物節約能源設計標準」,自七月一日施行

TOP