合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/06/14)
引註此篇文章
你可能還會想看
美國公布「2050淨零排放之路:美國長期策略」

  美國於2021年11月1日公布「2050淨零排放之路:美國長期策略」(The Long-Term Strategy of the United States: Pathways to Net-Zero Greenhouse Gas Emissions by 2050),確立美國未來十年溫室氣體減量發展方向,希望透過聯邦政府與各州、地方政府間合作,並結合社會整體力量,使美國可以在2050年實現淨零排放,並支持更加永續、具彈性且平等的經濟發展,實現完全的零碳污染、強化經濟及提升大眾健康。   本報告首先強調從現在開始至2030年約十年間溫室氣體排放減量的重要性,並說明美國接下來將以溫室氣體排放減量,作為未來達成淨零排放目標之基礎。為了達成淨零排放,美國計畫自能源、產業的排放結構著手推動轉型,報告中公布五項具體目標: 電力脫碳化:近年來因為風力及太陽能等潔淨能源發電成本急遽降低,能源轉型的腳步也逐漸加快,在此基礎上,美國訂定2035年達到100%潔淨電能的目標,並預計電力部門可於2050年以前達到真正的淨零排放。 電動化或轉換為潔淨能源:推動各部門電動化,使交通、建築物及工業製程可以使用合理成本且具一定效率的電力作為主要能源;針對航空、海運及部分工業製程等以現行科技水準較難實現電動化的經濟活動,則推動轉換為氫能、永續生質能等較潔淨的燃料。 減少能源浪費:透過新技術的開發,提升能源使用效率,例如於新建建築物使用能源效率較優的設備、更新既有建物之設備、改善工業製程的能源效率等。 降低甲烷等非二氧化碳溫室氣體排放:採取適當措施以減少甲烷、氫氟碳化合物、氮氧化物等非二氧化碳溫室氣體之排放,包括於石油及天然氣系統加裝甲烷洩漏感測器,以監控其洩漏狀態,以及將冷卻設備中的制冷劑從氫氟碳化合物更換為環境友善的其他物質。 移除大氣中二氧化碳:增加自然碳匯,或以目前可實際運用的技術吸收大氣中的二氧化碳。   美國預計結合聯邦、地方政府,以及產業、學術機構、投資人等社會各界,透過政策執行,強化推動能源、運輸、土地利用等經濟活動的溫室氣體減量工作;同時,配合資金導入,支持並給予各部門足夠的誘因投入潔淨技術的開發,並透過合作,以減少技術開發時可能遭遇的障礙及付出的成本,帶動美國整體朝淨零目標邁進。

美國白宮為因應TikTok威脅頒布行政命令,以維護資通訊技術與供應鏈國家安全

  美國白宮為因應TikTok威脅,於2020年8月6日頒布第13942號行政命令,以確保資通訊技術與供應鏈國家安全,禁止在美國管轄範圍內的任何人或相關實體,與中國大陸「字節跳動(ByteDance)」及其子公司為任何交易行為。本行政命令係依據美國《國際緊急經濟權力法》(International Emergency Economic Powers Act, IEEPA)、《國家緊急狀態法》(National Emergencies Act, NEA)及《美國法典》(United States Code, U.S.C.)第3篇第301條,以及2019年5月15日頒布的第13873號行政命令,要求國家應維護資訊、通信技術和供應鏈安全,並採取措施以應對國家緊急情況。由中國大陸企業開發及所有的行動應用程式,例如TikTok及WeChat等已威脅到美國國家安全、外交政策及經濟利益,必須採取應對措施。據查TikTok會自動從使用者方擷取大量資料,包括網際網路、定位資料及瀏覽紀錄等。此種資料蒐集行為將使外國人及政黨可以取得美國個人的專屬敏感資訊,追蹤到聯邦政府人員及政府承包廠商位置,建立個人資料檔案進行勒索和商業間諜活動。美國國土安全部、美國運輸安全管理局(Transportation Security Administration, TSA)和美國武裝部隊,已禁止在聯邦政府的通訊設備上使用TikTok,防止資料被竊取並傳輸至境外伺服器。   面對美國全面封殺中國大陸資通訊產品,中國大陸近來亦透過出口管制方案進行反制,2020年8月28日中國大陸商務部會同科技部,調整《中國禁止出口限制出口技術目錄》,將涉及軍民兩用的53項技術,納入出口管制清單。凡涉及向境外技術移轉,無論是採用貿易、投資或是其他方式,皆須申請省級商務主管部門的技術出口許可,獲得批准後方可對外進行實質性談判,簽訂技術出口契約。其中,因TikTok的人工智慧與演算技術,已被含蓋在目錄的管制清單內,若是TikTok要從中國大陸境內轉讓相關技術服務予境外,應暫停相關交易及實質性談判,先履行申請許可程序再為後續行動。

歐盟考慮設立中央網路犯罪防制機構

  歐盟部長理事會(Council of Ministers)已於今(2010)年4月27日要求執委會檢視其網路犯罪防制目標,並調查是否有需要設立一中央機構,以儘速達成下列幾項目標,包括:提高調查人員、檢察官、法官及法院相關人員的專業標準、鼓勵各國警方資訊分享以及協調歐盟27個會員國間打擊網路犯罪所採取之方式。   部長理事會提議由執委會進行設立專責機構之可行性調查研究,擬由該專責機構負責前述目標之達成,亦須評估並監督預防性與調查性措施之實行。該調查研究中應特別考量欲設立專責機構之目的、範圍及可能的經費來源,另外亦需考慮是否將其設置於位於海牙的歐盟刑警組織(European Police Office, Europol)中。考量網路犯罪跨國界之特性,為使打擊網路犯罪之相關措施更有效,必須有良好的國際合作及司法執行互助配合。部長理事會認為藉由專責機構之設立,不僅能夠協助培訓法官、警方及檢察官,亦能做為聯繫網路使用者、受害者組織及其他私部門的常設機構。   本部長理事會將歐盟現有之網路犯罪防制相關計畫分成短、中、長期計畫,要求執委會定期追蹤各項相關計畫之執行情況,亦將設立網路犯罪防制專責機構列入執委會後續四年所持續執行有關犯罪與安全治理的斯德哥爾摩計畫(Stockholm Programme)中。   此外,部長理事會也呼籲歐盟各國追蹤用於網路犯罪之IP位置及網域名稱,同時要求執委會協助建立共通的廢止機制,以進行網路犯罪防制。   位於希臘的歐盟網路與資訊安全機構(European Network and Information Security Agency, ENISA),是現階段歐盟網路犯罪防治的研究機構,其進行資訊安全威脅行為之調查,並提供相關建議,但僅是資訊服務單位,未實際投入打擊犯罪行動。

日本經濟產業省利用巨量資料(BIG DATA)及人工智慧(AI)開發及測試新的經濟指標

  日本經濟產業省利用網絡積累巨量資料(BIG DATA)及人工智慧(AI)技術,應用民營企業相關資訊,開發和測試新經濟指標,分別於2017年7月19日及2018年1月8日公開該指標。為達到及早準確掌握經濟動向,對巨量資料等新資料之利用期待越來越高,政府部門也將利用巨量資料及人工智慧技術等方法,針對統計技術進行改革,。   新開發之指標有:1.SNS×AI商業信心指數(SNS×AI景況感指数):乃是透過人工智慧抽取關於商業信心的網路文章,並進行情緒(正/負)評估計算指數,期待有效地估計以每日為頻率之商業信心。2.SNS×AI礦工業生產預測指數(SNS×AI鉱工業生産予測指数):利用人工智慧選取有關工作和景氣之網路相關文件,結合「開放數據」之統計等技術,並利用人工智慧「機械學習」之手法,來預測「工業生產指數」。3.銷售點資訊管理系統(POS,point-of-sale)家電量販店銷售趨勢指標(POS家電量販店動向指標):透過收集具有銷售點資訊管理系統(POS)的家用電子大型專賣店的銷售資料,期待可以掌握每一日之「銷售趨勢」。   新的指數與既存統計指數,如景氣動向指數、中小企業信心指數、工業生產指數、商業動態統計等,其調查週期、公布頻率等,既存指數每月調查公布,新指數則進步至每日調查或每週公布等,在計算及呈現頻率上較既有更為精細。日本政府並設立「Big Data-STATS」網站,以實驗性質公佈上述經濟指標,並廣泛收納民眾意見以提高新指標的準確性。

TOP