合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/24)
引註此篇文章
你可能還會想看
數位資產正式納入美國懷俄明州州法,並將虛擬貨幣視為金錢

  美國懷俄明州(Wyoming)於2019年1月18日提出S.F. 0125法案,經參眾議院三讀及州長簽署通過後,將在同年7月1日生效,代表數位資產(digital assets)正式納入懷俄明州州法第34編第29章。該法定義數位資產為表彰經濟性、所有權或近用權,並儲存於可供電腦讀取之格式(computer readable format)中,又區分為數位消費資產(digital consumer assets)、數位證券(digital securities)及虛擬貨幣(virtual currency)等三類。   數位消費資產,是指為了消費、個人或家用目的使用或購買的數位資產,包含:(1)除法律另有規定外,開放區塊鏈代幣(open blockchain tokens)視為個人無形資產(intangible personal property),(2)非屬本章數位證券和虛擬貨幣範圍內之數位資產;數位證券則是指符合懷俄明州州法第17編第4章有價證券定義的數位資產,但排除數位消費資產及虛擬貨幣;又,虛擬貨幣是指使用數位資產作為交易媒介(medium of exchange)、記帳單位(unit of account)或具儲存價值(store of value),且尚未被美國政府視為法定貨幣(legal tender)。   本次修法規定數位資產均為個人無形資產,另將數位消費資產視為該州州法下之一般無形資產,數位證券視為該州州法下之有價證券及投資性財產,虛擬貨幣則視為金錢,有論者表示本次修法有助於促進數位資產流通,並鼓勵各州跟進修法。然此舉是否有助於該州推行數位資產產業,尚待持續觀測,始能得知其對業界與政府監管所造成之影響。

美國國防部發布《國防部資訊技術發展戰略》,以促進IT變革並為未來奠定基礎

美國國防部(Department of Defense, DoD)於2024年6月25日發布「關鍵點:國防部資訊技術發展戰略」(Fulcrum:DoD Information Technology (IT) Advancement Strategy),將持續促進DoD之IT變革,並為未來奠定基礎。 本戰略描述作戰人員在推動IT方面應達成之目標與重要性,並列出提供聯合作戰IT能力、資訊網路與運算現代化、最佳化IT治理、栽培第一數位人力等四大目標(Line of Effort, LOE),簡述如下: (1)提供聯合作戰IT能力(Provide Joint Warfighting IT Capabilities):在現今不斷變化且充滿競爭的全球環境中,該目標以使用者為中心,提供具功能性、可擴增、永續且安全之IT功能。並以改善作戰人員可用資訊為重點,以利在快節奏、多領域(multi-domain)作戰中獲得決策與競爭優勢。 (2)資訊網路與運算現代化(Modernize Information Networks and Compute):該目標著重於迅速滿足任務與商務需求,利用卓越技術與以資料為中心的零信任(Zero Trust)資通安全方法,提供安全且具更快資料傳輸速度、更低延遲與高度彈性的現代化網路。 (3)最佳化IT治理(Optimize IT Governance):該目標將提高傳送效率、節省成本,且透過從治理到資料獲取系統的簡化政策,以轉變治理制定更好的決策,包括使用強大資料功能。 (4)栽培頂尖的數位人才(Cultivate a Premier Digital Workforce):該目標將確保作戰人員為新興技術之布署做好準備,並持續致力於識別、招募、發展並留住最佳數位人才。其擴展DoD網路人力框架(DoD Cyber Workforce Framework, DCWF),著重於更廣義的數位人力,包括資料、人工智慧、軟體工程的工作角色。

2005年我國對美專利申請件數落居外國申請人第4名

  在獲准件數方面,2005年我國人民向美國專利商標局申請獲准專利案件計5,993件,較上年減少16.84%,維持第3名,次於日本(31,834件)及德國(9,575件);向日本特許廳申請專利獲准案計2,305件,較上年增加24.33%,居所有外國人專利核准案件數第2名,次於美國;向歐洲專利局申請專利獲准案件計133件,較上年成長17.70%。   專利可反映一個國家或區域的創新活動,同時可展現該國或區域發揮知識力量,並將其轉換為有潛力的經濟產出的能力。專利獲准的條件是必須具新穎性、進步性及產業利用性,因此,專利的數量及其相關指標可說是衡量研究及發展(R&D)投入所獲產值的最佳工具。   根據智慧財產局最近發布之「2005年我國與美日歐專利申請暨核准概況分析」, 2005年我國向美國專利商標局、日本特許廳及歐洲專利局之申請與核准專利件數較往年雖有成長,但我國向美國申請專利件數已由2004年的居所有外國申請人之第3名下降為第4名,被南韓所超越,南韓的大幅成長值得關注。   美國依然是我國人民提出專利申請的主要國家,2005年我國人民向美國專利商標局申請專利案計16,617件,較上年增加10.36﹪,居所有外國人新申請案第4名。而南韓向美國專利商標局提出專利申請案自2003年之10,411件,成長至2004年之13,646件,2005年更以17,217件超越我國,攀至第3名。在日本方面,我國人民向日本特許廳申請專利每年超過3,000件,2005年排名第3,次於美國(9,177件)、韓國(5,990件);而在歐洲專利局方面,2005年我國人民共申請679件,有逐年增加趨勢,在亞洲國家中次於日本(21,461件)、南韓(3,853件)。

大阪框架(Osaka Track)

  2019年6月28日於日本大阪舉行的G20高峰會上,大阪框架(大阪トラック、Osaka Track)再次躍上國際檯面,日本首相安倍晉三在G20高峰會的數位經濟議程當中,倡議建立大阪框架作為資料跨境流通之標準。安倍強調數位化對促進各國經濟發展與創新意義重大,而在數位時代下資料作為重要的成長動力來源,為了能最大化資料運用的可能性與發展潛力,建立一套國際通用的資料流通機制顯然已勢在必行。   「大阪框架」概念的首次提出,源自2019年1月23日安倍首相於瑞士達沃斯所舉辦的世界經濟論壇(World Economic Forum)中所發表的演講,強調資料將是21世紀經濟發展的關鍵資源,透過建立一套國際通用的資料自由流通機制,將有助於確保在數位時代下各種新興科技的創新與發展,不會受到各國管制措施及資料在地化(data localization)政策所阻礙。   「大阪框架」的核心為建立「可資信任的資料自由流通機制」(Data Free Flow with Trust,簡稱DFFT),透過建構國際所共同信任的資料跨境流通機制,將有助於推動包含電子商務在內等各式資料之流通與利用,進而促進數位創新;安倍宣示2019年大阪G20高峰會為大阪框架的起始點,並強調基於此前提出之WTO電子商務共同聲明,期許能透過WTO各會員國的合作,實現建立國際通用的資料跨境流通機制之目標。

TOP