合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/09)
引註此篇文章
你可能還會想看
歐盟數位經濟公平稅負指令草案無共識,法國國民議會批准數位服務稅

  2018年3月21日,歐盟執行委員會(European Commission)發布數位經濟公平課稅(Fair Taxation of the Digital Economy)指令草案,指出在數位經濟模式中,由於創造利益的用戶資料地並不受限於營業處所,因此銷售貨物與提供勞務之增值發生地,與納稅主體之納稅地點分離,而無法為現行來源地原則所評價,嚴重侵蝕歐盟境內稅基。對此,該草案分別提出了數位稅(Digital Tax)與顯著數位化存在(Significant Digital Presence)兩份提案,用以針對特定數位服務利潤制定共同性數位稅制,以確保數位服務業者與傳統的實體公司立於平等的市場競爭地位。   值得關注的是,該草案之長遠解決提案以「顯著數位化存在」(Significant Digital Presence)修正國際間課稅權歸屬之重要人事(Significant People function)功能判斷,並認為建立利潤分配原則時,應參考經濟合作暨發展組織(Organization for Economic Cooperation and Development)稅基侵蝕與利潤移轉(BEPS,Base Erosion and Profit Shifting)行動計劃中DEMPE模式(Development Enhancement Maintenance Protection Exploitation function),決定獲利之分配,作為未來增值利益的認定。   然而不少持反對意見的國家認為,數位經濟只是傳統公司面對數位化,利用無形資產的商業模式改變而已,而此種新興模式並不足以作為開徵數位稅收新稅種。縱使數位經濟下無形資產產生之價值必須重新界定,現行稅收歸屬與國際間租稅協定本身並無不妥,而應強調各國稅捐機關之租稅資訊之合作。愛爾蘭已與捷克共和國、芬蘭、瑞典發表反對聲明,表示數位經濟課稅的方案不應背離BEPS行動計畫之期中報告,並應考慮到國際間因租稅引起的貿易戰爭,以及避免對數位經濟的扼殺。   目前,法國政府為了回應黃背心運動(Mouvement des gilets jaunes)對於稅制改革的要求,已先行針對數位服務提出了稅收草案,並於2019年4月9日經國民議會(Assemblée Nationale)批准。該法案將針對全球營收超過7.5億歐元之數位服務業者,以境內網路社群利潤,推估大型數位企業之應稅所得,課徵百分之三的數位服務稅。該法案將在2019年5月21日在法國上議院進行審議。

澳洲政府制定ISP反垃圾郵件從業規則

  澳洲政府於 3 月 28 日 發布了反垃圾郵件( anti-spam )從業規則( code of practice ),強制網路服務提供者( ISP )採取反制措施,以防堵大量、不請自來的電子郵件;業者若未配合新法的要求,將面臨鉅額的罰款。   繼 2003 年頒布的「垃圾郵件法」( Spam Act )後,澳洲通訊及媒體局( Communications and Media Authority )此次依據垃圾郵件法規定,針對 ISP 業者進一步制定了從業規則,成為對抗垃圾郵件的另一項重要工具。新法課予 ISP 業者的主要義務包括了: (1) 向用戶提供過濾垃圾郵件的服務選項; (2) 合理限制用戶電子郵件的發送;及 (3) 設立相關的投訴機制等。   為給予業者相當的緩衝時間,新法將自今年的 7 月 16 日 實施,屆時主管機關將針對澳洲當地近 700 家 ISP 業者進行檢查。一旦發現有違規情事,澳洲聯邦法院可對之處以 1,000 萬澳幣以下的罰款。

歐盟「未來工廠」發展計畫

  歐盟執行委員會依展望2020 (Horizon 2020)於2016年4月14日至15日召開未來工廠公私夥伴合作 (FoF cPPP)研討會,並展示目前資助的研究與創新成果,透過本計畫將協助歐盟內製造業,特別是中小企業,將資通訊及關鍵技術與整個工廠生產鏈結合,達到整體製造業升級。   計劃具體目標如下:(1)以資通訊技術為基礎的解決方案導入製造業生產過程,增加產品獨特性、多樣化、可大規模生產,及保有高度靈活性,以迅速反應瞬息萬變的市場。(2)縮短進入市場的研發製程,提升產品質量,並透過數位化設計、成型、模擬實作及預測分析,提升工作效率。(3)改善整合生產環境的人為因素。(4)透過現代資通訊基礎的生產技術使得資源、材料、能源更有持續性。(5)促進並強化製造領域的共同平台及其生態系統。(6)從獨特的地理位置創建虛擬價值鏈,從而善用優秀人才的潛力。   我國為整合新創能量,以創造製造業下一波成長動能,今年亦陸續公布「智慧機械產業推動方案」與「數位國家‧創新經濟發展方案」,以具高效率、高品質、高彈性等特徵之智慧生產線,透過雲端及網路與消費者快速連結,打造下世代工廠與聯網製造服務體系。

歐盟執委會發布《2019歐盟產業研發投資計分板》,美國和歐盟為世界研發投資最主要地區

  歐盟執委會(European Commission, EC)於2019年12月18日發布《2019歐盟產業研發投資計分板》(The 2019 EU Industrial R&D Investment Scoreboard)。產業研發投資計分板是歐盟每年出具一次的報告,2019年計分板報告包含2500家在2018-2019年間投入最多研發資金的企業,分別位於全球44個國家/地區,每一企業的研發投資金額超過3000萬歐元,總計約為8234億歐元,為全球研發支出的90%。在這2500家企業中,551家來自歐盟公司,為投資總額的25%;769家來自美國,為投資總額的38%;318家來自日本,佔13%;507家中國公司,佔12%。   報告中指出,2018年企業研發投資總額較2017年增加8.9%,主要是中國在全球研發資金投入比例不斷增加。另外,研發投資高度集中於大型企業;在這2500家企業中,前10大、前50大企業分別佔研發總額的15%和40%。前50大企業中,最多者為美國企業22家和歐盟企業17家。再從研發投資領域觀察,前三大領域分別為資通訊產業(38.7%)、健康(20.7%)和汽車產業(17.2%),佔總量的76.6%。但每一個國家重視的領域不盡相同,例如歐盟投資20%在資通訊、21.6%在健康、31%汽車,而美國的資通訊研發投資佔了52.8%、26.7%在健康,僅有7.6%在汽車。   再從個別企業研發投資排名來看,前四大企業分別為Alphabet、Samsung、Microsoft和Volkswagen。另外,報告統計在過去的15年中,有8家企業在全球研發投資金額排名中上升了70名以上,分別為:Alphabet、華為、蘋果、Facebook、阿里巴巴、Celgene、Gilead Sciences和德國馬牌;也代表這15年間資通訊、生技與汽車產業發展的重要性。

TOP