合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/05)
引註此篇文章
你可能還會想看
美國商標註冊發布新規定:外國人需透過美國執業律師代理其商標業務

  美國專利商標局(簡稱USPTO)公告新商標規定於8月3日生效,國外申請人、註冊人及商標訴願暨上訴委員會(TTAB)程序的當事人均須透過合法美國執業律師代理其商標業務,包含:向USPTO提出商標申請註冊、商標糾紛。此要求適用於所有商標申請人、註冊人和永久合法居住地或是主要業務所在地於美國境外的當事人。   近期,USPTO發現愈來愈多的國外申請人、註冊人和當事人向USPTO提交不正確或有詐欺嫌疑的文件,其不符合美國商標相關法規或USPTO規則。此次新規定目的在於: 加強外國人遵守美國商標相關法規。 改善向USPTO提出商標案的正確性。 維護美國商標註冊的完整性。   數十年來,全球許多其他國家都有須透過當地律師代理執行業務的相關要求。USPTO局長Andrei Iancu表示:「企業靠著USPTO的商標註冊,決定品牌的重要法律決策,為了確保商標註冊的正確、完整性與公眾利益,USPTO必須要有適當的規定來強制所有申請人和註冊人遵守規定。」;USPTO商標專員Mary Boney Denison亦表示:「相信新規定將有助於提高外國人向USPTO提交的文件品質。」 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」

美國國際貿易委員會(USITC)發布「全球數位貿易報告」,推動數位經濟新機會

  2014年8月,美國國際貿易委員會(USITC)發布「美國與全球經濟體之數位貿易」政策報告,該報告係應美國國會參議院財政委員會(Senate Committee on Finance)之要求所進行之調查,期能夠深入了解數位貿易(Digital Trade)在美國與全球經濟體之間的發展,無論係透過網際網路(Internet)所進行之在地化商業行為抑或國際貿易,能夠有效指認出阻礙美國進入全球數位貿易市場之阻礙。   報告指出,數位貿易當有助於整體經濟之正面發展,例如促進通訊、加快商業交易、增進資訊近取,並能夠增進中小企業之市場機會。然而,根據所回收之調查數據顯示,目前存在著影響國際間數位貿易若干法制障礙,分別為:在地化的要求(localization requirements)、市場進入的限制(market access limitations)、資料隱私與保護規範要求(data privacy and protection requirements)、智慧財產權侵害(IPR infringement)、不確定之法律責任(uncertain legal liability)、公部門網路管制(censorship),以及在地消費者之不同要求(compliance with customs requirements)。   然而,報告也指出十項對於企業與消費者的新機會: 第一,在內容產業,將有助於扶持獨立的創作者;第二,在旅遊與住宿產業,可促進更佳的利用率;第三,網際網路有助降低求職摩擦,降低失業率;第四,增進線上服務之合作與整合,例如應用軟體介面經濟面之貢獻;第五,保險產業界運用巨量資料分析帶動之創新發展;第六,透過M2M通訊,改善製造流程;第七,農業界之數位創新;第八,網路使用者之資料蒐集,在隱私權考量與相關正面效益間取得平衡;第九,增進美國網路公司之全球競爭力;第十,促進中小企業之出口。   因此,對於欲進軍全球聯網市場之我國資通訊高科技業者來說,應當留意相關之法制障礙,遵循不同國家之法律規範,掌握聯網新興科技所帶動之下一波龐大商機。

線上遊戲「Second Life」大筆玩家資料外洩

  線上遊戲新奇的聲光效果與眾多同儕參與的凝聚感,吸引全球玩家爭先投入此一新興娛樂領域之際,遊戲本身的安全性卻也格外值得重視。知名的線上遊戲「 Second Life 」驚傳個人資料外洩事件,遊戲營運商「 Linden Lab 」 9 月 10 號發布公開聲明,表示「 Second Life 」遊戲伺服器於同月 6 日遭到駭客入侵,總計約有 65 萬名玩家的個人資料遭竊。   廣受全球玩家青睞的多人線上角色扮演遊戲( Massive Multiplayer Online Role Playing Game ; MMORPG )「 Second Life 」採取全然的 3D 介面( three-dimensional ),遊戲當中所有的虛擬物件,包括角色、道具與各式各樣的配件均由個別玩家設計與創造,玩家可在遊戲中從事虛擬土地及建築物的買賣並賺取遊戲虛擬貨幣( Linden Dollars );玩家亦可將遊戲中獲取的虛擬貨幣於真實社會中進行現金交易。   營運商「 Linden Lab 」表示,此次駭客係利用「 Zero-Day Exploit 」技術滲透遊戲伺服器,外洩的個人資料包括了玩家姓名、住址、帳號密碼及其信用卡卡號等。 Linden Lab 除已要求所有的玩家立即更改密碼,並將在遊戲的部落格( blog )中提供新的安全方案。

何謂英國金融科技創新計畫( Project Innovate )?

  為了全力打造英國成為「FinTech 全球領導者地位」,及引領FinTech 國際監管規則的大國,英國金融業務監理局(Financial Conduct Authority, FCA)於2014年10月啟動了金融科技創新計畫(Project Innovate),目的就是能夠追蹤進入金融市場的新興商業模式,其中最重要的建立監理沙盒制度(Regulatory Sandbox),旨在提供企業可以在安全空間內對創新產品、服務、商業模式等進行測試,而不會立即招致參與相關活動的所有監管後果。   金融科技創新計畫增設創新中心(Innovation Hub),為創新企業提供與監管對接等各種支持。   金融科技創新計畫通過促進破壞式創新鼓勵挑戰現有的商業模式,而創新中心主要透過政策與金融科技業者交流,了解是否監管政策能夠更好的支持創新。

TOP