合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/17)
引註此篇文章
你可能還會想看
歐盟執委會提出「2050低碳經濟策略規劃藍圖」

  為邁向低碳經濟時代,建立歐洲成為具競爭力之低碳經濟體,歐盟執委會(European Commission)於2011年3月8日向歐洲議會(European Parliament)提出「2050低碳經濟策略規劃(A Roadmap for Moving to a Competitive Low-Carbon Economy in 2050)」,並設定2050年低碳總目標,宣示將透過加強低碳技術研究發展、推動能源效率使用等方式,降低對石化燃料依賴,並提昇區域內更多就業機會。   隨著近期中東與北非地區石油危機,原油價格節節高升,已嚴重影響歐洲國家每年能源支出經費,並降低未來各國經濟成長率。歐盟執委會認為,必須積極促進歐洲國家,經由投入科技研發、提昇能源效率,有效抑制不斷提昇的能源成本,推動歐盟邁向低碳經濟社會;並且,所設定目標及推動措施,倘若有所遲緩或推延,越晚投入將導致日後所需投入經費成本更為昂貴,悔不當初。「2050低碳經濟策略規劃」所設定之目標為,規劃透過各種符合成本效率(Cost-Efficient)措施及方法,推動歐盟區域內溫室氣體排放量至2030年降低40%、至2040年降低60%、至2050年降低80%(以1990年排放量為基準),達成低碳經濟願景目標。     歐盟執委會表示,未來應強化推動低碳技術之研究發展,促進未來更廣泛運用,並強調應更全面加強推動策略性能源科技研究計畫(Strategic Energy Technology Plan , SET-Plan),未來10年內歐盟將再額外增加50 billion歐元投資,加強推動能源科技相關研發工作,及未來可供運用之工具措施。   「2050低碳經濟策略規劃」中,詳細規劃推動步驟,並區分各大領域分別施行。以電力部門(Power Sector)領域為例,運用低碳技術、潔淨技術設備所產製電力,至2020年將達到降低45%--60%比例之排放量,到2050年,所有發電技術之溫室氣體排放量更將降低至可接近於0;而對於「工業部門」所設定目標,2050年達成降低80%之目標,對於「家庭及辦公建築」部份,設定2050年可降低90%之目標,而「運輸部門」則設定於2050年達成降低60%之目標。此外,歐盟執委會更指出投資「智慧電網(Smart Grid)」的重要性,將可促使「需求端(Demand-Side)」更具效率性,更廣泛且分散之電力調配中心,以及啟動運輸系統電力化之時代。   低碳經濟社會所帶來福祉,並可降低歐盟每年能源支出,及對於石化燃料進口依賴程度,也促成轉變改以低碳技術產製電力能源,作為可行的替代因應方案;以及,低碳經濟社會型塑推動,除了投入經費研發技術外,相關運用更須透過教育、訓練、推廣,廣泛使大眾接受且樂於使用新興技術,如此未來將可衍生種類與數量均會更多之就業機會,也有助益於經濟成長;此外,推動低碳經濟亦可改善生活品質及健康生活,未來實際效應可改善公共健康、減少醫療費用支出、及降低對生態環境消耗破壞,均屬良善效益。   然而,歐盟執委會這些推動措施,亦傳出有反對聲音。「歐洲商業(Business Europe)」團體就對外表示,他們反對「2050低碳經濟策略規劃」所設定的這些超高標準,他們認為相關推動措施,未來將會嚴重傷害歐盟境內企業發展,因為主要競爭者如中國、日本及美國,相較而言,均未設定這麼高的推動目標。未來歐盟執委會這些規劃藍圖是否落實達成,值得後續觀察。

加拿大聯邦政府預計2018年於全國落實碳排放費用徵收

  加拿大總理賈斯汀.杜魯道(Justin Trudeau)於2016年10月提出一項改革方案,要求全國各省份或地區於2018年開始,須擇一實施碳稅(Carbon tax)制度或碳交易系統(Cap-and-Trade System):前者,聯邦政府將制定徵收下限,從2018年每噸10元,逐年提高10元,直至2022年每噸50元為止;至於碳交易系統,則須設立嚴格管控規範,以達聯邦政府實施碳稅制度所得減少碳排放量之預期值。同時,杜魯道更進一步表示,費用將交由各省區自行向排放者進行徵收,並可就其所得作自由運用,反之,倘若未確實執行該項政策者,聯邦政府則將強制介入實施。   事實上,綜觀國際間徵收碳稅制度,主要有兩種類型:一類為全國落實碳稅徵收,例如:荷蘭、丹麥、德國或南韓等,其中尚可再細分是否作為一獨立稅目進行徵收,前述荷蘭及丹麥二國,即直接設立碳稅進行徵收,至於德國與南韓,則是將碳排放作為能源稅之計算因子之一作收取;另一類為國內部分地區自行決定收取,如:美國加州地區及原先加拿大不列顛哥倫比亞省與魁北克省等。   至於未來觀察重點,應在於加拿大實施上述碳排放費用徵收政策後,勢必對於民生消費習慣具相當程度影響,諸如:暖氣、民生用電、交通工具燃料、公共運輸、食品、服裝或其他消費服務,預期均有相應之漲幅,再者,各省區之經濟政策及投資環境,亦可能有不小程度之衝擊,此兩處後續發展,均值得作持續性觀察。

MPAA 藉由 BT 網站伺服器記錄對 P2P(BT) 軟體用戶提起訴訟

  追蹤、定位、起訴,所有 P2P(BT) 軟體使用者的噩夢再次上演。全美製片業團體「美國電影協會」 ( Motion Picture Association of America ; MPAA ) 在 8 月 25 日對美國境內 286 位居民提起訴訟,成為首宗利用 P2P(BT) 網站伺服器記錄 ( server logs ) 追蹤 ( track down ) 盜版電影下載者的案例。   今年 2 月,著名 BT 網站 LokiTorrent 與 MPAA 的大戰告一段落。德州法院下令 LokiTorrent 關閉網站外,並命令 LokiTorrent 將伺服器記錄轉交給 MPAA 的調查員 ( investigator ) 。 MPAA 的發言人聲稱本月 25 日的訴訟與此事件無關,但所有人都明白 MPAA 正是憑此線索,最終找到了 P2P(BT) 用戶的行蹤。好萊塢希望藉此行動阻嚇免費下載電影的行?, MPAA 資深副總裁 John Malcom 聲稱「下載盜版電影的人要當心了,當你為著作權侵害行為時,網路上並不會有朋友站出來替你撐腰。」   儘管 P2P(BT) 軟體背負著助長盜版的惡名,但 P2P(BT) 的合法用途也在逐漸增加,例如使用 P2P(BT) 技術分發 ( distribute ) 開放原始碼軟體 ( open-source software ) ,網路瀏覽器軟體公司 Opera 即在新版的程式中內建了此種技術。 BT 技術的發明人 Bram Cohen 曾警告用戶,使用 P2P(BT) 軟體下載盜版是個蠢主意,因?軟體在設計時並未刻意隱藏用戶的識別資訊,這也是為何 MPAA 此次能憑藉著伺服器記錄對用戶提起訴訟的主要原因。

美國國會議員(Patrick Leahy)提案(PROTECT IP Act)封鎖違反智慧財產權的非法網站

  美國國會議員日前提案,擬立法對抗違反智慧財產權的非法網站。該法案(Preventing Real Online Threats to Economic Creativity and Theft of Intellectual Property Act, 或稱PROTECT IP Act)主要係針對侵害智慧財產權的非法網站,擬賦予美國司法部或著作權人,可向法院聲請於網路上封鎖該網站,或者不讓其在搜尋引擎上顯示,亦即讓該非法網站從網路徹底消失。同時,經營網路金流的業者以及網路廣告商,也不得再提供服務給予這些違反智慧財產權或者是販售贗品的非法網站。   該法案明確的規定,舉凡與非法網站相關的資料、數據、索引、超連結等,皆需從網際網路上移除。亦即,美國人民在網路上將不會再看到這些非法網站的任何資訊,若該法案通過,將連帶影響到Google、Yahoo等搜尋引擎的實務運作。有反對者指出,此舉將使得美國政府可以決定美國人民在網路上應該看什麼內容,因此戲稱該法案為網路審查法案(Internet censorship bill)。   網路巨擘Google執行長(Eric Schmidt)也於今年5月中聲明反對該提案,認為該提案已經嚴重侵害言論自由。執行長Eric Schmidt表示,美國政府試圖以立法手段解決複雜的網路侵權爭議,以立法封鎖、移除非法網站所有資料,跟中國限制網路言論自由的方式如出一轍。   目前該法案尚未通過,已出現不少反對聲浪,財產權以及言論自由同樣是憲法上保障的權利,究竟應如何在保障著作財產權人與言論自由間取得平衡,該法案未來發展值得密切注意。

TOP