合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/06/23)
引註此篇文章
你可能還會想看
歐盟智慧財產局公布2020年智財侵權狀況報告

  歐盟智慧財產局(European Union Intellectual Property Office)於今(2020)年第三季公布最新智財侵權狀況報告,研究報告為其智庫「歐盟智慧財產權侵權觀察平台(The European Union Observatory on Infringements of Intellectual Property Rights)」所執行,並結合經濟合作暨發展組織(Organization for Economic Cooperation and Development)之數據資料,每年以不同主題呈現當年世界智財侵權狀況。今年以「智財權為何重要、智財侵權與打擊仿冒之戰爭」為主題,重點如下: 智財密集產業對歐盟經濟貢獻占整體GDP的45%、就業人數占歐盟就業人口的29%、出口貨物量占96%。 企業對智財的重視比例增高,重視智財的企業雇員平均收入較不重視智財權者高出32%;運用智財於營運策略的中小企業成長潛力高於無智財權者,如依權利運用類型區分,其成長率分別是10%(商標)、16%(商標結合專利)、27%(商標與設計權),以及33%(三種權利組合)。 全球仿冒品占其貿易總量約3.3%,市值高達1,210億歐元。 除日常藥品,抗生素、癌症或心臟疾病藥物仿冒情形均趨於嚴重;2019年爆發新冠肺炎後,偽造商更是將仿冒移轉至檢測試劑與個人防護用品。   尤其進入AI與5G時代後,智財密集產業對世界經濟貢獻度可望逐年上升,但侵權狀況恐怕亦同,咎因於該產業之興盛與背後龐大的潛在利益。因此持續推動建立企業的智財意識與防護能力,有其必要性,以助於提升產業發展潛力與整體營運獲利。

基因改良作物命運大不同

  身為世上最大基因改良( GMO)棉花生產者的 中國大陸 ,已經批准將經過基因改良的混種棉花進行商業化,預料可以解決生活日用品上的短缺。相對於此, 歐盟 的農業部長們,卻對於是否批准編號1507的基因改良玉米,陷入一個進退維谷的困境。但是經過8年激烈的反對, 丹麥 卻允許基因改良玉米的進口。   而在 美國 有 85﹪的大豆,76﹪的棉花,45﹪的小麥是經過基因改良的。至於 澳洲 農業與資源經濟局則最近則對基因改良作物做出一份報告,認為各省禁止基因改良食品會減小經濟效益,使 澳洲 面對世界各地日益增多的基因改良作物發展,屈居弱勢。至終可能會在十年後造成1.5億到6億澳幣的損失。

新加坡科學家研究出奈米載體有效送藥抗癌

  新加坡科學家研究出新的抗癌方法,新加坡生物工程與奈米科技研究院宣佈,研究出智慧奈米載體,可以攜帶抗癌藥物準確送入癌細胞裏,有效地把癌細胞殺死,減少副作用。    星國科技研究局生物工程與奈米科技研究院宣佈,研究出以聚合物製成的智慧奈米載體,大小少過二百奈米,也就是大約頭髮直徑的五百分之一,這種微粒載體內部中空,可以裝載抗癌藥物,而載體的外殼可以保護藥物免受消化液消化掉,在一般環境裏結構穩定,解決過去載體結構不穩定的問題。    領導這項研究的科學家楊義燕博士表示,這種奈米載體可用酸鹼度和溫度變化來控制,當微粒載體碰到成低酸度的癌細胞組織和細胞質時,就會沈澱變形,同時釋放出內部的藥物分子殺死癌細胞。過去也有科學家研究出類似的微粒載體,但必須由體外透過溫度變化來控制微粒在體內的行進,控制不易;這次研究的載體,只要靠酸鹼度變化就可以把抗癌藥物帶到深層組織或細胞群,控制容易。    載體釋放藥物的過程:當智慧奈米載體遇到癌細胞組織,會附在癌細胞組織表面,同時載體外部也附上生物訊號,能夠協助載體辨識和深入癌細胞內部,當癌細胞吸收了載體後,載體反過來吸收癌細胞內的質子,並把藥物分子釋放到細胞質和細胞核裏。    研究團隊在進行老鼠乳癌細胞臨床實驗顯示,透過智慧奈米載體把用來治療白血病和各種癌症的阿黴素送到癌細胞內,有效抑制腫瘤生長,卻不會產生對正常細胞的毒害作用及副作用。

美國太空軍是否已經輸掉了第一場戰爭—商標戰爭

  美國在2019年12月20日建立一支新的軍種—太空軍(Space Force)。這代表以往存在於科幻的宇宙部隊將躍然於現實,但美國太空軍可能會在商標戰爭中,輸給Netflix的喜劇影集「Space Force」。Netflix早於美國政府在歐洲、澳洲、墨西哥等地取得「Space Force」商標,但其並非為搶先美國政府進行註冊,而係為能銷售相關商品。   美國商標法採取先使用主義,即使後使用者先進行註冊,先使用者還是可以取得商標。Netflix自2019年初即開始即在全球廣泛採用「Space Force」做為商標,基本上「Space Force」之商標權應歸屬於Netflix。美國空軍則是在同年3月以「Space Force」申請商標做為一般的使用。然而,美國政府長期以來也有諸多關於軍事資產涉及商標保護之案例,例如派拉蒙影業(Paramount Pictures)在1995年至2005年間六次申請註冊「JAG」(Judge Advocate General)商標,但政府立場並未特別反對。   美國國防部(簡稱:DOD)針對商標授權使用,於商標許可指南(DOD Trademark Licensing Guide)中,說明對於美國軍隊徽章及標緻之使用方式,並於2007年推出了國防部品牌和商標許可計畫(DoD Branding and Trademark Licensing Program)。在此之後,美國海軍陸戰隊開始向大部分銷售標示有「USMC」T恤之電商,請求不得再銷售標示有相關文字之T恤。回到本事件,美國太空軍發言人表示,對於與Netflix可能存有商標爭議並不知悉,但希望Netflix能延續該節目,以做為良好的宣傳。

TOP