合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/16)
引註此篇文章
你可能還會想看
歐盟數位經濟公平稅負指令草案無共識,法國與奧地利將先行交付立法

  2018年3月21日,歐盟執行委員會(European Commission)發布數位經濟公平課稅(Fair Taxation of the Digital Economy)指令草案,指出在數位經濟模式中,由於創造利益的用戶資料地並不受限於營業處所,因此銷售貨物與提供勞務之增值發生地,與納稅主體之納稅地點分離,而無法為現行來源地原則所評價,嚴重侵蝕歐盟境內稅基。對此,該草案分別提出了數位稅(Digital Tax)與顯著數位化存在(Significant Digital Presence)兩份提案,用以針對特定數位服務利潤制定共同性數位稅制,以確保數位服務業者與傳統的實體公司立於平等的市場競爭地位。   值得關注的是,該草案之長遠解決提案以「顯著數位化存在」(Significant Digital Presence)修正國際間課稅權歸屬之重要人事(Significant People function)功能判斷,並認為建立利潤分配原則時,應參考經濟合作暨發展組織(Organization for Economic Cooperation and Development)稅基侵蝕與利潤移轉(BEPS,Base Erosion and Profit Shifting)行動計劃中DEMPE模式(Development Enhancement Maintenance Protection Exploitation function),決定獲利之分配,作為未來增值利益的認定。   然而不少持反對意見的國家認為,數位經濟只是傳統公司面對數位化,利用無形資產的商業模式改變而已,而此種新興模式並不足以作為開徵數位稅收新稅種。縱使數位經濟下無形資產產生之價值必須重新界定,現行稅收歸屬與國際間租稅協定本身並無不妥,而應強調各國稅捐機關之租稅資訊之合作。愛爾蘭已與捷克共和國、芬蘭、瑞典發表反對聲明,表示數位經濟課稅的方案不應背離BEPS行動計畫之期中報告,並應考慮到國際間因租稅引起的貿易戰爭,以及避免對數位經濟的扼殺。對此,歐盟監管審查委員會(Regulatory scrutiny Board)亦認為,草案並未針對數位稅的有效稅率進行量化分析,嚴重忽略了數位稅對於區域內經濟的衝擊。   由於未能獲得歐盟會員國的共識,法國為了回應黃背心運動(Mouvement des gilets jaunes)的要求, 12月17日法國財政部長已公開表示2019年3月前,將自行針對數位廣告所得與數位資料所得稅收法案送交國內立法程序,該法案將直接以境內網路社群利潤推估大型數位企業之應稅所得,並支持「顯著數位化存在」的認定原則。同時奧地利財政部長也表示,會跟進數位稅收的立法並於2019年1月底公布稅收草案。

挪威推動修法舒緩泛歐盟區域內國際漫遊費率問題

  挪威交通部(Ministry of Transportation)甫於本月推出電子通訊法(Electronic Communication Act)修法草案,其主要針對1-5、2-12、4-14條之規定進行修正,期望透過確認主管機關對費率和爭端處理程序等事項之管轄權和財務補貼,解決歐盟(European Union;EU)和歐洲經濟區(European Economic Area;EEA)內,長期爭議不決的國際漫遊費率問題。   強調區域整合的泛歐盟經濟體(含27個EU會員國和挪威、列支敦士登、冰島3個EEA會員國),雖在貨物、人口、服務、貨幣之自由流通等,各項單一市場上的努力上相當成功,但其電信漫遊之跨國界服務,卻經常受到各界批評,主要問題即源自於居高不下的跨國漫遊費率。因歐洲地理和人口分佈稠密度甚高,居民極容易使用跨國電信服務,但卻需負擔動輒數倍的國際漫遊費用問題。近年來歐盟有意對此尋求解決之道,而挪威此次修法即為初步重要嘗試之一。

外掛程式開發公司Bossland GmbH指控暴雪娛樂竊取外掛程式的原始碼

  曾開發「暴雪英霸」、「暗黑破壞神」、「魔獸世界」等多款人氣電玩遊戲的暴雪娛樂公司(Blizzard Entertainment, Inc.)素來對遊戲中的作弊外掛程式採取嚴厲的打擊手段。暴雪娛樂日前對於「暴雪英霸」遊戲中的外掛全自動機器人程式(cheating bot)採取行動,對外掛程式開發公司德商Bossland GmbH的開發者James Enright及數名匿名工程師提出著作權侵權訴訟,並指控其外掛程式讓玩家在遊戲中作弊,影響遊戲的公平性及其他玩家的娛樂,而且損及暴雪娛樂公司的獲益。James Enright最後與暴雪娛樂達成協議,交出外掛程式的原始碼。   隨後,Bossland GmbH公司控訴暴雪娛樂公司偷走他們的原始碼。Bossland GmbH的執行長Zwetan Leschew表示,James Enright所交出外掛程式原始碼的智慧財產權屬於Bossland GmbH公司,James Enright是Bossland GmbH公司的自由程式開發者,暴雪娛樂公司已經於德國參與了數個對自動機器人程式開發者的訴訟,對於James Enright與Bossland GmbH之間的關係應有所了解。從暴雪娛樂公司和James Enright的協議可以看出,暴雪娛樂公司要求James Enright將程式原始碼交出,以換取訴訟的停止。   暴雪娛樂公司發布聲明表示,暴雪娛樂已在德國贏得了多起與Bossland GmbH公司的訴訟,儘管他們利用策略手段來拖延正在進行的訴訟程序,仍堅信法院制度會繼續證實我們的主張,而且最終會阻止作弊全自動機器人程式的散布。

歐盟執委會通過《歐洲互通法案》,以強化歐盟公共部門的跨境互通與合作

  歐盟執委會於2022年11月21日通過《歐洲互通法案》(Interoperable Europe Act)(下稱本法案),以強化歐盟公共部門的跨境互通與合作,加速數位化轉型。跨境互通將使歐盟及其成員國為公民與企業提供更優良的公共服務,並預計為公民節省550萬至630萬歐元的成本;為與公共行政有業務上往來的企業節省57億至192億歐元的成本。   《歐洲互通法案》為歐盟的公部門建立一套合作模式,該模式有助於建立安全的跨境資訊交換及可互通的數位共享解決方案(如開源軟體、指引、IT工具等),使彼此之間合作更有效率,進而帶動公部門創新。舉例而言,Covid-19疫情期間,互通性政策使醫院間得共享重症監護病床之數量資訊,以提供人民最即時的醫療資源。本法案架構如下:   1.結構化的歐洲合作:由歐盟成員國和區域、城市共同合作,制定跨境互通的共同戰略議程,並得到公共和私人的支持,實施互通性解決方案與進度監控。   2.強制性評估:評估跨境互通之IT系統對歐盟的影響。   3.共享和再利用解決方案:透過歐洲入口網(Interoperable Europe Portal)及社群合作的一站式平台,提供支持共享與再利用的解決方案(如開源軟體)。   4.提供創新和相關支持措施:包括監理沙盒(sandboxes)、GovTech計畫及訓練措施等。    自2010年以來,歐洲互通性框架(European Interoperability Framework, EIF)一直作為歐盟互通性政策的主要參考依據,惟始終不具有約束力。本法案將使EIF成為單一參考依據,使歐盟公共服務部門擁有互通性政策,並未來互通性合作框架將由歐洲互通委員會(Interoperable Europe Board)指導,該委員會由歐盟成員國、歐盟執委會、地區委員會(Committee of the Regions)及歐洲共同體經濟和社會委員會(European Economic and Social Committee)之代表組成。   可互通的數位公共服務對建構數位單一市場至關重要,除提升經濟效益和行政效率外,案例研究亦表明,互通性對提高政府信任可產生正面積極影響,同時本法案充分尊重現有的隱私與資料保護規則,以符合歐盟創建以人為中心的規範方法,提升個人基本權利。

TOP