合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=16&tp=1 (最後瀏覽日:2025/10/07)
引註此篇文章
你可能還會想看
爭議多時的日本P2P軟體Winny開發者,獲無罪判決確定

  日本著名的P2P(Peer to Peer)檔案共享軟體Winny因有侵害著作權法之公開傳輸權之爭議,兩名利用該軟體的使用者於2003年11月被日本群馬地檢起訴。隔年5月Winny軟體開發者「金子勇」因涉嫌構成幫助犯,被京都地檢起訴。全案歷經2006年京都地裁一審之有罪判決、2009年大阪高裁二審判決逆轉無罪、而檢方再上訴日本最高裁判所等程序。檢方於日前撤回上訴,並於2011年12月20日經最高裁判所裁定維持大阪高裁無罪判決,全案定讞。   大阪高裁認為,軟體的開發者未必能認識使用者會將軟體使用在非法目的上,難謂構成幫助之行為,因此,開發者本身對軟體的非法使用並不需要負責。不法行的情形應該是軟體開發者去鼓勵使用者利用軟體進行非法行為。   金子勇在20日召開記者會表示,網路上下載未經授權著作的問題還很多,將竭力解決相關問題,對自己之前開發的軟體而引起之相關侵權訴訟感到遺憾,並呼籲使用者誤濫用Winny,以實現更好的資訊社會。   而日本「電腦軟體著作權協會」(the Association of Copyright for Computer Software)向來致力於著作權之保護工作,協會對此結果表示並不否定P2P技術本身的價值中立性,但是將來會與相關著作權保護團體攜手合作,對於類似Winny的共享軟體之非法侵害,持續推動應對之策,並運用各種手段實現著作權受保護之健全環境。

台灣每人二氧化碳排放量逐年增加 全球第二十二名

  台灣自一九九○年至二○○四年止,平均每人排放量自五‧五七公噸大幅增加至十一‧五九公噸,以國際能源總署 (IEA )截至2002年統計,全球排放量前三名為美國、中國及俄羅斯,台灣則排名全球第22名。   主計處表示,依 IEA 統計資料庫顯示,二○○二年全球二氧化碳排放量前六名為美國(57.1億噸,占全球23.3﹪)、中國(34.7億噸,占14.2﹪)、俄羅斯(15.2億噸,占6.2 ﹪)、日本(11.8億噸,占4.8 ﹪)、印度(10.5億噸,占4.3﹪)及德國(8.5億噸,占3.5 ﹪)。台灣則排第 22 名(1990年為第28名),排放量占全球總量約1﹪,而經濟發展程度與我國相近的南韓、新加坡排名分別為第9名(4.7億噸,占1.9﹪)及52名(5500萬噸,占0.2﹪)。    行政院主計處據工研院能源與資源研究所統計,公佈最新「我國燃料燃燒排放二氧化碳」概況,台灣溫室氣體排放以二氧化碳為最大宗,佔八成以上,至二○○四年為 2.6億噸。   主計處指出,為抑制人為溫室氣體排放導致全球氣候變遷加劇現象,聯合國在一九九二年通過「聯合國氣候變化綱要公約」,且為落實排放管制工作,具有約束效力的「京都議定書」,已在今年二月十六日正式生效,期使在二○○八至二○一二年間,六種溫室氣體排放量平均應削減至比一九九○年低五‧二 %水準。在全球持續增溫、海平面上升及氣候變遷加劇下,台灣雖非京都議定書締約國,但政府相關部會順應國際永續發展潮流,正積極落實檢討溫室氣體排放減量政策。

FDA對於食品製程中應用奈米科技者發布產業指引草案

  FDA於今年(2012年)4月12日分別發布了兩項有關於評估應用奈米科技於化妝品及食物影響之產業指引草案(draft guidance)。其中就奈米科技應用於食品(以下簡稱奈米食品)之影響,FDA於「產業指引草案:評估包括使用新興科技在內之重要製程,改變對食品原料、與食品接觸物質及食品色素安全性及法規狀態之影響」(Draft Guidance for Industry: Assessing the Effects of Significant Manufacturing Process Changes, Including Emerging Technologies, on the Safety and Regulatory Status of Food Ingredients and Food Contact Substances, Including Food Ingredients that are Color Additives,以下簡稱新興科技衍生食品產業指引草案)中,對於食品製造商應採取哪些步驟以證明使用奈米科技之食品及食品包裝之安全性,有較為具體之說明。   於新興科技衍生食品產業指引草案中,明確表示奈米科技為此文件之涵蓋範圍,惟其聲明將奈米科技納入文件並不代表FDA認定所有內含奈米物質之產品皆屬有害,僅說明FDA認為依據奈米食品之特性,應進行特別的安全性評估以確保安全。文件中也強調,FDA對於食品製程中應用奈米科技所作之考量,與應用其他科技於食品製程者無異,並認為應用奈米科技所產出之最終產品,在原定用途之使用下,其特性及安全性與傳統製程產出者相同。   針對奈米食品之安全性評估,新興科技產業指引草案中指出,應就該食品所使用物質於奈米尺寸下之特性為其判斷基礎,而有可能必須進一步檢驗此等特性之影響,例如該物質對於生物可利用率及其於器官間運輸之影響等。此外,文件中亦提及FDA於過去針對食品添加物、色素及與食物接觸物質之化學及技術數據所作成之產業指引,於此應同樣被遵守,而將奈米食品所涉及與安全性相關之文件提供給主管機關。而FDA也將持續地向產業提供諮詢服務,以確保產品之安全性。   由FDA所發布之相關產業指引觀察,縱使FDA仍秉持美國對於奈米科技不具危害性之基本立場,其仍透過強化安全評估之科學工具及方法,以審慎之態度來取得大眾對於此類產品安全之信任。

知名歌手Bruce Springsteen拒絕與美國作曲家、作詞家、出版商協會共同要求康諾利酒吧和餐館支付著作權授權費用

  美國作曲家、作詞家、出版商協會American Society of Composers, Authors and Publishers (以下簡稱協會)與知名搖滾歌手Bruce Springsteen(以下簡稱Springsteen),和流行歌曲作者Clinton Ballard, Jr.對於紐約州的康諾利酒吧和餐館提出訴訟,原因在於酒吧和餐館沒有支付授權年費就允許樂團演奏Springsteen的歌曲。     當協會的代表發表此一聲明時,Springsteen實際上並不知道此一訴訟。Springsteen的代表指出:Springsteen事先並未被詢問是否要作為此案的原告,該協會是自作主張的將Springsteen列為此案的原告,而且即便協會事先詢問,Springsteen也不會同意作為此案的原告,也就是說不會提起此訴訟。     紐約每日新聞指出,因為協會並未獲得Springsteen的同意,Springsteen的名字應該會被移除。 協會資深副總裁Vincent Candilora(以下簡稱Candilora)表示,康諾利酒吧與餐館目前尚未發表任何聲明,而康諾利酒吧與餐館允許樂團於去年夏天演奏Springsteen的歌,但卻沒有支付授權年費給協會的行為可能會面臨三萬美元的罰金。   Candilora同時表示,為什麼這些有支付授權金的酒吧或餐館在有同樣法律約束的地區,要處於一個不利的競爭條件。提出此訴訟是給予有付授權費用的紐約酒吧一個公平的環境。

TOP