合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/03/23)
引註此篇文章
你可能還會想看
歐洲央行提出7500億歐元之「緊急債券收購計畫」以因應新冠肺炎疫情

  歐洲央行(European Central Bank, ECB)於2020年3月18日提出7500億歐元之「緊急債券收購計畫」(Pandemic Emergency Purchase Programme),紓困金額占歐盟年GDP之7.3%,以協助歐盟面臨新型冠狀病毒(covoid-19)所帶來之經濟衝擊,同時也減緩再生能源產業因疫情所帶來之影響。   就此,歐洲央行總裁Christine Lagarde表示,對於紓困對象及方法,歐洲央行將採取不分產業類別自市場購買公債或私人債券之方式,以因應疫情所帶來之影響,其中也包含歐盟投資銀行(European Investment Bank, EIB)所發行之「綠色債券」(Green Bond)。又綠色債券係歐盟投資銀行於2007年所發行,又名「氣候意識債券」(Climate Awareness Bond),職是故,歐洲央行針對歐盟投資銀行綠色債券進行紓困將使再生能源產業蒙受其利。   依歐洲央行之「緊急債券收購計畫」,歐洲央行僅得自次級市場(Secondary Market)購買債券,而不得直接自初級市場(Primary Market)購買,亦即歐洲央行僅得自價證券買賣之交易市場購買債券,而不得直接購買首次出售之有價證券,此項限制,也包含歐盟投資銀行所發行之綠色債券。   以歐盟投資銀行綠色債券為例,歐洲央行之操作機制在於透過此項購買手段,提升歐盟投資銀行綠色債券之市場價格,同時讓歐盟投資銀行面對投資人時,可以享有較為優渥之議價空間,以降低歐盟投資銀行未來所要付給投資人之利率。同時歐洲央行可再進一步降低對於歐盟投資銀行之利息,進一步降低歐盟投資銀行因發行綠色債券所帶來之利息壓力,促使綠色產業得以因應疫情之衝擊。   如此歐洲央行即達成其目的,減緩投資市場之震盪,同時達到振興經濟產業效益。這也是為何,歐洲央行僅得自次級市場(Secondary Market)購買債券,而不得直接自初級市場(Primary Market)購買債券之原因。

何謂電子菸?

  由於電子煙係利用電流通過霧化器,加熱煙彈(液)內之液體,因該液體混有尼古丁、丙二醇(分子式為C3H8O2,可作為食品添加物)及其他香料,可模擬吸菸時產生類似煙霧的蒸氣及味道。惟縱使電子煙不含焦油,仍可能混有尼古丁和其他化學物質,對於身體健康仍有一定的影響。因此,許多國家基於國民健康等因素,且電子煙之煙彈(液)因可能混合薄荷、水果香味等,造成未成年人誤以為非一般菸品而進行吸食,故多採取必要之管制,例如:禁止電子煙廣告、促銷或贊助。   依我國菸害防制法第14條規定,任何人不得製造、輸入或販賣菸品形狀之糖果、點心、玩具或其他任何物品。違反者,依同法第30條規定,對製造、輸入業者,處新臺幣1萬元以上5萬元以下罰鍰,並令限期回收;屆期未回收者,按次連續處罰;對販賣業者,處新臺幣1千元以上3千元以下罰鍰。此外,違反藥事法第69條規定,非藥物不得為醫療效能之標示或宣傳之規定,故電子煙如宣稱具有「幫助戒菸」、「減少菸癮」或「減輕戒斷症狀效果」等有醫療效能的詞句,即在禁止之列。

日本正式敲定今年版智慧財產權推動計畫

  日本為了提高產業競爭力,於 2002 年提出智財戰略計畫,並於內閣中設戰略本部,由首相小泉純一郎領導,每年並仔細擬定當年度的智慧財產權推動計畫。在今年剛定案的「二零零六年智慧財產權推動計畫」中,以開發或利用大學的智慧財產及加強與產業界的合作並提出對付仿冒品等的對策為重點。   根據「二零零六年智慧財產權推動計畫」,未來將加強整合大學內部的大學智慧財產本部與民間的技術移轉機關( TLO ),以便集中運用人才、研究成果。計畫也將建立一套可簡便利用專利或論文的資料庫系統,預期明年四月起可供利用。   日本的大學院校去年在國內取得專利權的有三百七十九件,大學將專利技術移轉至民間組織件數在二零零四年度有八百四十九件,藉由技術轉移所得收入為三十三億日圓,雖然這些表現相較於以往年度均有所成長,但日本不論在專利件數或收益上,都與美國相差甚遠,日本政府為了加強國際競爭力,認為有必要加強產、學界的合作,故「二零零六年智慧財產權推動計畫」也規劃,大學院校若有意到海外申請專利權,政府將補助申請費;此外,原本只限定優惠大學正副教授的專利申請費減免措施,也將及於研究所的學生等,以期促進大學內部研發。

歐盟議會通過電信改革法案

  歐盟議會在2009年11月24日通過歐盟電信改革法案,其中包含12項重要改革: 1. 消費者要求以攜帶電話號碼方式變換電信公司時,只需一個工作日; 2. 強化對消費者資訊之傳達,包含使消費者充分知悉所訂購之服務內容、服務品質、賠償和退費機制; 3. 保障歐洲人民網路接取自由(Internet access); 4. 新的網路開放及網路中立(open and neutral net)保護措施,賦予國家及權責機關,得對網路服務之最低品質限度做出規範,且須於簽約前對消費者告知流量控管之技術,和該技術對其服務之影響; 5. 消費者個人資料保護及垃圾郵件(spam)之處理; 6. 更方便的緊急通訊服務; 7. 國家電信規範將更加獨立; 8. 新的歐洲電信主管機關將會協力確保公平競爭和電信市場規範之一致性; 9. 歐洲執委會被授予法規範補償制度之檢視權利; 10. 在面臨競爭問題時,國家通信機構可採取功能性分離(Function Separation)措施; 11. 加速全歐洲之寬頻接取普及率; 12. 鼓勵對下世代網路(NGA)之競爭與投資。   至於先前飽受爭議之三振法案,在多方溝通下,歐盟議會決議,人民之網路自由,是歐洲公民重要之權利,但在保護智慧財產權和藝術創作方面,需要找尋更新、更現代化,且更有效率的保護方法。至於切斷網際網路之服務,除非有「先前的、公正、無偏見」且「有效率並即時」的司法審訊程序,否則不應限制人民網路接取之權利。

TOP