合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/13)
引註此篇文章
你可能還會想看
Google的下一步:行動廣告市場

  美國網路搜尋龍頭Google於2009年11月提出一項以7億5千萬美金收購行動廣告網絡商ADMob的計畫,大張旗鼓地準備涉足這個目前於所有廣告型態中,規模相對微小的區域。然而,美國二大消費者團體Consumer Watchdog及Center for Digital Democracy卻不認同這項收購計畫,甚至認為Google此舉將使其於行動廣告市場中形成獨占,以及甚有侵害消費者隱私權的可能,從而向聯邦交易委員會(Federal Trade Commission, FTC)喊話,要求FTC阻止Google此次的商業併購行為。   然而,消費者團體的擔憂亦非毫無道理,蓋Google在網路搜尋與線上廣告均有難以撼動的地位,而ADMob目前在行動廣告市場之佔有率亦為前茅,是故兩者一旦合併,消費者團體認為,Google此舉即是在為自己日後於此一極具發展潛力的市場中,先行買下一席位子。此外,由於GPS技術的發達,Google附加的Google Map定址應用更有可能因其實質跨足提供行動服務而有侵害使用人隱私權的可能。   雖言如此,FTC仍未明確表示對該項交易的意見,此外,無獨有偶地,蘋果電腦對行動廣告的市場亦開始有所行動,根據另一行動廣告服務提供者Quattro Wireless指出,蘋果公司正在計畫其中的細節。由此可見,不論FTC最後的結論為何,資訊業者之於行動廣告的戰爭已經開始。

美國最高法院認定州政府得對電商業者課徵銷售稅

  美國最高法院在今(2018)年1月12日決定接受南達科塔州的上訴,就South Dakota v. Wayfair一案(下稱Wayfair案)進行審理,以決定州政府是否有權對網路零售業者課徵銷售稅。依據最高法院在1992年Quill v. North Dakota (下稱Quill案)所確立之原則,若網路零售商在該州無實體呈現 (physical presence),州政府即不得對該零售商向該州居民所銷售之貨物課徵銷售稅。   在1992年Quill案中,最高法院認為州政府對於遠距零售者(remote retailer)課稅,將違反潛在商務條款(dormant commerce clause),理由是對於無具體呈現的零售商課稅,將使其面對許多不同的課稅管轄權,造成零售商巨大的負擔,並增加州際商務的複雜性。南達科塔州認為科技的進步已使得零售商商所面臨課稅的複雜度降低,故在2016年通過法案對無實體呈現之電商業者課稅,因而引發相關爭訟。   本案在今年6月21日宣判由南達科塔州勝訴,判決指出隨著電子商務的成長及資訊科技的進步,課稅並不如過往會對業者造成具大的負擔,同時也可滿足正當程序與潛在商務條款的要求;此外,Quill案將會造成市場的扭曲,其所造成的稅捐保護傘將對具有實體呈現的業者造成不公平的競爭。因此認定Quill案已難以適用於現在的電子商務市場。   但本案仍有四位大法官反對,認為應由國會立法來糾正此一錯誤。因為國會並未明確授權州政府可對跨州零售交易課稅,因此才有潛在商務條款的適用,換言之,國會實際擁有立法授與各州徵收遠距交易之權力,在115期國會當中,也已經有相關的法案被提出,包括Remote Transaction Parity Act of 2017 (H.R. 2193)、Marketplace Fairness Act of 2017 (S.976)。在最高法院完成此一判決後,後續可繼續觀察美國國會是否會以立法的方式,授與州政府對跨州商業貿易課徵租稅。

歐盟考慮設立中央網路犯罪防制機構

  歐盟部長理事會(Council of Ministers)已於今(2010)年4月27日要求執委會檢視其網路犯罪防制目標,並調查是否有需要設立一中央機構,以儘速達成下列幾項目標,包括:提高調查人員、檢察官、法官及法院相關人員的專業標準、鼓勵各國警方資訊分享以及協調歐盟27個會員國間打擊網路犯罪所採取之方式。   部長理事會提議由執委會進行設立專責機構之可行性調查研究,擬由該專責機構負責前述目標之達成,亦須評估並監督預防性與調查性措施之實行。該調查研究中應特別考量欲設立專責機構之目的、範圍及可能的經費來源,另外亦需考慮是否將其設置於位於海牙的歐盟刑警組織(European Police Office, Europol)中。考量網路犯罪跨國界之特性,為使打擊網路犯罪之相關措施更有效,必須有良好的國際合作及司法執行互助配合。部長理事會認為藉由專責機構之設立,不僅能夠協助培訓法官、警方及檢察官,亦能做為聯繫網路使用者、受害者組織及其他私部門的常設機構。   本部長理事會將歐盟現有之網路犯罪防制相關計畫分成短、中、長期計畫,要求執委會定期追蹤各項相關計畫之執行情況,亦將設立網路犯罪防制專責機構列入執委會後續四年所持續執行有關犯罪與安全治理的斯德哥爾摩計畫(Stockholm Programme)中。   此外,部長理事會也呼籲歐盟各國追蹤用於網路犯罪之IP位置及網域名稱,同時要求執委會協助建立共通的廢止機制,以進行網路犯罪防制。   位於希臘的歐盟網路與資訊安全機構(European Network and Information Security Agency, ENISA),是現階段歐盟網路犯罪防治的研究機構,其進行資訊安全威脅行為之調查,並提供相關建議,但僅是資訊服務單位,未實際投入打擊犯罪行動。

歐盟執委會發布《歐盟晶片調查報告》提出四點發現以利未來晶片法相關計畫制定

  歐盟執委會(European Commission)於2022年8月2日發布《歐盟晶片調查報告》(European Chips Survey Report,下稱調查報告),調查結果顯示業界至2030年為止,對晶片之需求將倍數成長。調查報告於2022年2月啟動,其目的在收集有關晶片和晶圓(wafer)現行及未來需求的初步資訊,作為了解晶片供應危機對歐盟產業影響的第一步。調查報告總共收到141份來自半導體供需雙方廠商之回饋意見,其中有54.9%來自大型企業、17.3%來自中型企業、19.5%來自小型企業、8.3%來自微型企業。調查報告對上述意見進行分析,以提供來自半導體價值鏈洞察與預測的觀點。   調查報告主要包括以下四點:   (1) 預計2022年至2030年間晶片需求將倍增,未來對領先半導體技術的需求將顯著增加。   (2) 在選擇製造地點時,建立新晶片製造設施的公司將著重合格的勞工及遵循政府法令。   (3) 供應危機影響所有生態系統,預計至少會持續到2024年,迫使企業採取代價較高的緩解措施。   (4) 半導體研發資金主要與供應方相關,但補助計畫(support initiatives)也與需求方相關。   2022年2月8日歐盟執委會提出《歐盟晶片法草案》,旨在處理半導體短缺以及加強歐洲技術領先地位。隨著歐洲半導體專家小組開始研究監控與盤點架構,調查報告的結果可以協助制定《歐盟晶片法草案》與相關計畫。

TOP