合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2025/12/12)
引註此篇文章
你可能還會想看
美國環保署擬針對兩項奈米材料納入顯著新種使用規則

  奈米材質之特性雖有助於開發新穎產品,但對於環境與人體健康是否會造成危害,迄今仍未有定見;為避免奈米科技毫無節制地發展,2008年9月以降,美國環保署(Environmental Protection Agency,EPA)以毒性物質管制法(Toxic Substances Control Act,TSCA)管理奈米材料,並在10月底考慮將奈米碳管納入前述法規中;11月初,更進一步依據毒性物質管制法5(a)(2)發布「顯著新種使用規則(Significant New Use Rule,SNUR)」,將以矽氧烷(siloxane)所改造之奈米矽微粒(silica nanoparticles)與奈米鋁微粒(alumina nanoparticles)列入管理範圍內。   一般而言,化學物質如未列於由EPA所公佈之「化學物質目錄」者,皆應向環保署提出製造前通知(Premanufacture Notice,PMN);而顯著新種使用規則以指定特殊新種化學物質的方式,配合適用製造前通知制度,要求業界針對製造、加工、銷售與使用等過程,提出具體因應措施。申言之,關於前述兩項奈米物質,一旦涉及有別於以往的重大創新製造活動,業者即應於正式進行製造前之90天先行通報環保署,再由其評估該業者是否符合相關條件要求,否則得予以禁止或限制之。   根據環保署既有之測試資料,可以確認奈米微粒得由呼吸與皮膚接觸等方式進入人體。以矽氧烷所改造之奈米矽及奈米鋁,泰半係作為添加劑之用;然而,觀察過往製造前通知所登載之內容,該兩項化學物質無論在呼吸或皮膚接觸所造成之暴露程度尚屬輕微;因此,針對該等奈米材料而向環保署所為之通報流程及審查作業,可能會對於業者後續之生產製造活動形成不確定的阻礙。   有鑒於奈米材料可能對人體健康產生未知風險,為保障奈米工作環境中人員的安全,顯著新種使用規則將於2009年1月起正式生效,作為管理特殊化學物質的監督方式。對於製造或使用奈米材料所可能引發之風險,美國環保署正著眼於環境、健康與安全議題,逐漸採取較為謹慎的政策設計方向,以維護大眾利益。

美國FDA更新軟體預驗證計畫,以明確化數位健康科技的軟體器材審查流程

  美國食品及藥物管理局(the U.S. Food and Drug Administration)於2019年1月更新「軟體預驗證計畫(Software Precertification Program)」及公布該計畫「2019測試方案(2019 Test Plan)」與「運作模式初版(A Working Model v1.0)」,使審查流程更加明確及具有彈性,並促進技術創新發展。   在更新計畫中,FDA聚焦於審查架構的說明,包含考量納入醫療器材新審查途徑(De Novo pathway)及優良評估流程(Excellence Appraisal process)的審查內涵。在優良評估流程中,相關研發人員須先行提供必要資訊,以供主管機關驗證該軟體器材之確效(validation)及是否已符合現行優良製造規範(current good manufacturing practices)與品質系統規範(Quality System Regulation, QSR)的要求。而由於以上標準已在此程序中先行驗證,主管機關得簡化上市前審查的相關查證程序,並加速查驗流程。   在測試方案中,則說明FDA將同時對同一軟體器材進行軟體預驗證審查及傳統審查,並比較兩種途徑的結果,以確保軟體預驗證審查途徑中的每一個程序都可以有效評估產品上市前所應符合的必要標準。最後,FDA綜合軟體預驗證計畫及測試方案,提出「運作模式初版」,以協助相關人員了解現行的規範架構與處理程序,並期待藉此促進技術開發者及主管機關間的溝通。FDA並於運作模式文件中提到,將在2019年3月8日前持續接受相關人員的建議,而未來將參酌建議調整計畫內容。

加拿大上訴法院判決”iPod tax”違法

加拿大上訴法院判決MP3播放器不在空白錄印媒體複製著作權物課稅的範疇,本案仍有上訴最高法院之可能。   根據本案審判法官Mr. Justice Marc Noel之見解,其認為雖然加拿大著作權法允許加拿大著作權委員會(Copyright Board of Canada)對空白可複製媒體(Blank Media)課稅,然法條中並未允許其可課徵MP3播放器製造商類似的費用。   Noel法官坦承其亦認知到,著作權委員會是本著希望補償著作權人因為點對點網路下載而致生損害的立場,惟重點在於「主管機關仍應依法行政。」就此而論,對 MP3播放器交易加以課稅仍非合法。   2003年12月加拿大開始針對可複製媒體課稅,而著作權委員會進而主張,MP3播放器製造業者每賣一部少於1GB容量的播放器應被課以2美元、1至10GB容量者課以15美元,以及超過10GB容量之播放器課以25美元,以補償著作權人因為點對點網路複製音樂所生的損失。   根據加拿大著作權法,著作權委員會可針對空白重製媒體進行課稅以補償著作權人因為個人目的重製(Private Copying)所生之損失,2000年開始針對可複製CD媒體課稅,包括空白影音帶。   播放器業者想當然並不接受這項義務的課予,因此起訴,而 本案判決的結果可預見將造成MP3播放器業者的降價行為。同時,一些將課稅所得分配與著作權人(包括演奏家或唱片公司)的機構,如加拿大個人重製組織(Canadian Private Copying Collective),已在評估是否將上訴至最高法院。不過至少,他們有可能將遊說加拿大政府以修正著作權法之方式,將MP3播放器的情形納入,以及若有可能,將未來類似性質之商品一併納入考量。

宣傳板畫上商標及「即將開業」 Chanel控訴藝術展侵權

  奢侈品牌Chanel即將在加拿大郊區開設新的據點?在2014.05,一個嶄新的Chanel即將在此營業的招牌顯立在加拿大東丹佛區。   原來,這是一個名為丹佛藝術節(Art of the Danforth)即將於2014.05.11展開,在東丹佛舉辦、超過20個展覽作品的大型免費的公眾藝術活動。藝術節總監Asad Raza表示,這個展品由藝術家Mahmood Popal負責構思,期望能藉此探討「去高檔化」議題,並透過展品「抓住第一間奢侈品店進入尋常百姓家的一刻」。因此,在一塊黑色大型展板上,畫上Chanel的商標和名稱,並寫上「即將開業」字樣。而這樣的表現方式,並未有實際銷售或與Chanel競爭的目的,僅僅是作為一個豎立在地面上的裝置藝術。   對此,Chanel加拿大發言人表示,Chanel即代表了其品牌精神、價值及形象,如果任何人有需要使用,應事先知會Chanel,並獲得Chanel授權同意:「我們希望在使用前應要向我們提出詢問,主要是為了確保這樣的使用方式或內容符合Chanel的品牌價值、形象、及企業願景。此外,Chanel標識之使用有一定的規範,從不會以其他的變動方式去使用Chanel標識,避免發生減損Chanel的品牌形象的情況。舉例來說,我們從來不使用這個標誌的方式與雙“C”以上的香奈兒標誌。如果使用人在用之前,可以事先與我們做溝通,我們也可以進行相關的控制,並使它看起來更真實。」   針對本件的使用,Chanel加拿大發言人事後表示,當確定是公共藝術的使用時,就未採取相關的訴訟措施,但如果未獲授權使用品牌Chanel的商標而有侵權情形時,將會考慮提起訴訟。

TOP