合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/02/09)
引註此篇文章
你可能還會想看
歐盟議會通過「視訊媒體服務指令」

  歐盟議會於2007年5月24日正式通過「視訊媒體服務指令」 (Audiovisual Media Service Directive) 以取代原有的「電視無國界指令」(Television Without Frontiers Directive)。新指令對於視訊媒體服務的規範不僅包括傳統的電視服務,尚擴及至透過電腦網路及隨選服務系統等傳輸的視訊媒體服務。此外,新指令要求視訊服務提供者必須向閱聽人揭露置入性行銷手法的運用。   有關新指令是否應適用於播客(podcasting)與網路上非商業活動性質影片(如網路使用者上傳至YouTube網站上的短片)的爭辯。歐盟媒體委員會強調,新指令之主要目的雖在於將所有新興電視服務業納入規範,但並不是涵蓋所有在網路上播放的視訊媒體內容。執行長Viviane Reding認為新指令為視訊服務供應者奠定一個有利的競爭架構,以避免因過多的管制而妨礙電視技術與服務之匯流發展。   新指令具有幾項重要特點,首先是擬透過單一完整的法律架構規範所有視訊媒體服務業,以降低監管成本;其次,擬定現代化的電視廣告管理規則,以改善視訊媒體節目製作的資金籌措管道;最後,其他諸如鼓勵媒體服務供應者致力於提昇視覺與聽力障礙者的近用能力亦是本指令所重視者。   據新指令之規定,歐盟會員國有兩年時間將新指令落實為國內法,預期於2009年底在歐洲全面適用。

日本發布電力、天然氣及石油部門之去碳轉型金融路徑圖

  日本經濟產業省於2022年2月4日發布電力、天然氣及石油部門的「去碳轉型金融路徑圖」(トランジション・ファイナンスに関するロードマップ),作為各部門轉型金融之指引,確保資金持續投入,協助二氧化碳主要排放部門朝去碳化轉型,以實現2050年碳中和目標。   電力、天然氣及石油部門之「去碳轉型金融路徑圖」,係以科學根據為基礎,依據日本國內電力、天然氣、石油部門之現況及相關政策規劃,導入現階段具可行性之技術,確實推動減少二氧化碳排放;同時並針對未來技術的發展與革新目標訂定時間表,確保技術與各部門未來之發展能有助日本於2050年達成碳中和目標。一方面於企業欲透過轉型金融取得資金時,指引企業針對其現行氣候變遷對策進行檢討;另一方面,亦可協助金融機構審視企業於轉型融資時所提出之轉型策略與措施,以判斷是否符合轉型金融之資格。各部門主要重點如下: 電力:2020年開始導入轉型燃料(生質能、氫、氨與天然氣之混和燃燒),並逐步淘汰傳統火力發電;2030年確立去碳燃料(純生質能、氫、氨火力發電、再生能源等)相關技術,並推動商用化。 石油:2020年起開發石油製程節能技術,並推動轉型以天然氣為主要燃料;同時發展氫氣製造技術、二氧化碳捕捉技術,於2030年達成商用化。 天然氣:2020年起針對天然氣、液化石油氣進行節能製程、燃料利用效率、合成燃料相關技術開發,並擴大建置都市天然氣管線、確保液化石油氣配送途徑等。

英國將建立全國性的身份證資料庫

  英國財政部於表示新成立的身份與護照服務 (Identity and Passport Service, IPS) 將接管由國家統計局 (Office for National Statistics) 所負責的市民資訊計劃 (Citizen Information Project) ,此一計劃之目的係為建立一個包含個人姓名、住址、生日以及一個獨特的身份證字號的成人人口註冊系統 (Adult Population Register) 。   IPS 將負責發展全國身份登記系統 (National Identity Register , NIR) 以作為成人人口資料庫 (Adult Population Database) 。之後,將以 NIR 中所儲存的資料為最終的個人聯絡資料來源。目前此一資料庫只針對年滿 16 歲的成人進行聯絡資料的蒐集,不含兒童的聯絡資料在內,至於是否要建立兒童人口資料庫則有待更進一步的商討。

美國總統發布行政命令啟動創世紀任務,整合AI資源加速科學發現,鞏固AI技術領導地位

美國總統川普於2025年11月24日發布行政命令(Executive Order)啟動創世紀任務(Launching The Genesis Mission),旨在建立美國科學與安全AI平臺(下稱AI平臺),整合聯邦政府長期累積之科學資料集、國家研發及運算資源,訓練可自動化研究、加速科學發現之AI模型,強化國家安全、提高勞動生產力及研發投資報酬率,鞏固美國AI技術領導地位。 行政命令重點如下: (1)權責分配:由能源部長(Secretary of Energy)確保將執行創世紀任務所需資源統一整合至AI平臺,並訂定安全計畫。由總統科學技術助理(Assistant to the President for Science and Technology, APST)領導,透過國家科學技術委員會(National Science and Technology Council, NSTC)協調所有參與之行政部門。 (2)AI平臺之運作:提供能源部國家實驗室超級電腦、安全雲端運算環境等高效能運算資源、AI建模與分析框架、運算工具、各學科領域基礎模型,並在適法前提下,提供聯邦政府所管理之資料集、開放科學資料集或能源部生成之合成資料集。 (3)識別國家科學技術挑戰:能源部長應提交創世紀任務優先應對之國家重要科學技術挑戰清單,涵蓋先進製造、生物科技、關鍵原物料、核能、量子資訊科學、半導體與微電子學領域,經APST審查並與NSTC參與成員研議後定案。 (4)跨部門協調及外部參與:召集相關部門參與,訂定資源配置計畫整合各部門可用資料與基礎設施。提供獎補助,鼓勵私部門參與符合任務目標之AI驅動科學研究。設立研究獎學金、實習與學徒制計畫,提供AI平臺使用權及AI賦能科學發現培訓。在維護聯邦研究資產安全及公共利益最大化之前提下,建立標準化合作夥伴機制,與擁有先進AI、資料、運算能力或科學專業知識之外部夥伴合作。 行政命令就前述事項設定執行時程,且明定自發布之日起1年內及此後每年,能源部長應向總統提交報告,說明各事項之運作情況與達成成果。

TOP