合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/01/22)
引註此篇文章
你可能還會想看
脫歐協議草案:英國將繼續保護已註冊或已授予的智慧財產權

  歐盟委員會(European Commission)於2018年2月28日公佈了歐盟與英國脫歐協議草案(The draft Brexit Withdrawal Agreement),其中規定在英國將會持續地保護先前已註冊或已授予的智慧財產權。   根據該協議草案第50(1)條規定,先前在歐盟已註冊或被核准的商標、設計或植物品種權的持有人,在過渡期結束之前,不須再經任何復審,視同已在英國註冊且具可實施性的智慧財產權。而關於地理標誌、原產地名稱和地方傳統特色,在第50(2)條亦有類似規定。   該協議草案有:智慧財產權註冊程序之規定(第51條);英國繼續就歐盟特定會員國已註冊之商標或外觀設計提供保護(第52條);英國繼續就未註冊的共同體設計提供一定程度的保護(第53條);繼續保護數據庫(第54條);申請歐盟商標和共同體之植物品種權享有優先審查權(第55條);在英國申請植物補充保護證書享有優先權(第56條)及權利耗盡(第57條)等規定。   惟歐洲專利體系以歐洲專利公約(European Patent Convention)為基礎。 因此,有關專利的相關規定未在英國脫歐協議草案出現,亦未在將來的一元專利系統(Unitary Patent system)中被提及,而此系統係源自於兩項歐盟的規章。   目前該協議草案已由歐盟委員會提出,首先將讓歐盟各成員國和歐洲議會先進行磋商,最後再與英國進行協商。

專利連結

  專利連結(patent linkage,亦有稱patent registration linkage)是1984年美國《藥品價格競爭及專利期回復法(Hatch-Waxman Act, HWA)》所創設。傳統上,醫藥主管機關與專利主管機關的權責是有所區分的。然而,醫藥主管機關因為醫藥管理制度與專利制度的連結,使得醫藥主管機關須審查專利相關事務,即醫藥主管機關在審查學名藥上市許可申請時,必須同時判斷該藥品是否侵害專利藥公司就該藥品所掌握的專利。   專利連結制度可以採取幾種形式,最簡單形式的專利連結可能涉及了以下的要求:當有學名藥廠對專利藥公司所生產的的專利藥品提出學名藥,並尋求醫藥主管機關批准時,則應向專利藥公司告知學名藥廠的身份。強度較強的專利連結,在該專利藥品的專利到期或者無效之前,可以禁止醫藥主管機關核發上市許可給學名藥品。而更強的專利連結不僅可以禁止核發上市許可,也可以禁止在專利期間內對學名藥品的審查。   我國目前並未採納專利連結制度,但在我國目前擬積極參與的《泛太平洋夥伴協議(TPP)》中則要求成員應採納專利連結制度,故未來我國動向將值得關注。

<開原碼條例>建置醫療資源共享架構

  UCLA醫學中心以開放原始碼軟體Zope建置資訊系統,展開一項稱為「治療成效開放式架構」(OIO, Open Infrastructure for Outcomes) 的計畫,構築起未來醫療資訊系統的新基石。讓治療成效的資訊,能在一個共通的平台架構上進行資源分享。   長期以來,醫療資訊系統面臨的挑戰主要來自於下列三個面向:一、如何讓資訊系統提供令人滿意的服務功能,以取代將醫療記錄登載在紙張上的傳統方式。二、資訊系統的需求經常會改變,如何快速因應系統的改變需求。三、如何與其他醫療團隊夥伴,共同分享資料與工具。   OIO計劃透過資訊共享可加速醫療研究。開放式架構計畫的主要目的,並不是用來要求臨床工作者與醫療研究中心分享病歷資料,而是提供一個分享管理工具的機制,讓使用者能夠利用這些管理工具,進行資料的收集與分析,並和特定的診療研究人員進行溝通,而透過系統安全的機制,在過程當中並不會讓其他人得知資料內容。不過,如果有人想要進行管理工具或資料的進一步加值利用,僅需額外投入相當小的成本。   另外, 開放式架構計畫的設計極具彈性,除了目前所專注的治療成效資訊統計之外,其系統概念也可以用來管理客戶資訊、進銷存資訊、會計資訊等。整個系統開發環境是針對使用者而設計,而非程式人員,並且以網頁應用程式來實作,力求操作的便利性,目的之一是讓使用者能夠動手創造出自己所需的表格資料。另一方面,設計上也面對來自於法律與技術層面的挑戰,例如取得病患的同意及對系統的信任感,促使這套系統在實作時,必須能夠提供高度的修改彈性與安全性。   由於 OIO 在設計上,包含低成本、高效益、使用者導向、架構具有彈性等特色,並以開放源碼開發模式來鼓勵使用者測試及提供回饋意見,目前的應用效果持續擴大中。

歐盟考慮設立中央網路犯罪防制機構

  歐盟部長理事會(Council of Ministers)已於今(2010)年4月27日要求執委會檢視其網路犯罪防制目標,並調查是否有需要設立一中央機構,以儘速達成下列幾項目標,包括:提高調查人員、檢察官、法官及法院相關人員的專業標準、鼓勵各國警方資訊分享以及協調歐盟27個會員國間打擊網路犯罪所採取之方式。   部長理事會提議由執委會進行設立專責機構之可行性調查研究,擬由該專責機構負責前述目標之達成,亦須評估並監督預防性與調查性措施之實行。該調查研究中應特別考量欲設立專責機構之目的、範圍及可能的經費來源,另外亦需考慮是否將其設置於位於海牙的歐盟刑警組織(European Police Office, Europol)中。考量網路犯罪跨國界之特性,為使打擊網路犯罪之相關措施更有效,必須有良好的國際合作及司法執行互助配合。部長理事會認為藉由專責機構之設立,不僅能夠協助培訓法官、警方及檢察官,亦能做為聯繫網路使用者、受害者組織及其他私部門的常設機構。   本部長理事會將歐盟現有之網路犯罪防制相關計畫分成短、中、長期計畫,要求執委會定期追蹤各項相關計畫之執行情況,亦將設立網路犯罪防制專責機構列入執委會後續四年所持續執行有關犯罪與安全治理的斯德哥爾摩計畫(Stockholm Programme)中。   此外,部長理事會也呼籲歐盟各國追蹤用於網路犯罪之IP位置及網域名稱,同時要求執委會協助建立共通的廢止機制,以進行網路犯罪防制。   位於希臘的歐盟網路與資訊安全機構(European Network and Information Security Agency, ENISA),是現階段歐盟網路犯罪防治的研究機構,其進行資訊安全威脅行為之調查,並提供相關建議,但僅是資訊服務單位,未實際投入打擊犯罪行動。

TOP