合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/06)
引註此篇文章
你可能還會想看
美國擬投入110億美元扶持半導體研發,並成立國家半導體技術中心

美國白宮於2024年2月9日宣布從《晶片與科學法》(CHIPS and Science Act)撥款110億美元執行「CHIPS研發計畫」(CHIPS Research and Development (R&D) programs),並將設立投資基金,協助美國新興半導體公司技術商業化發展。 CHIPS研發計畫源係於美國國會於2022年8月通過《晶片與科學法》,提供527億美元的經費支持美國半導體產業,其中390億美元用於補助半導體生產,110億美元用於半導體研發。此次CHIPS研發計畫的具體作法如下: (1)建置國家半導體技術中心(National Semiconductor Technology Center,簡稱NSTC):為CHIPS研發計畫的核心項目,將投資50億美元建置NSTC,協助美國先進半導體研發與設計,確保美國於半導體領域的領先地位。NSTC將向公眾共享設施與專業知識,幫助創新者取得相關專業知識與能力。此外NSTC亦將推動利益團體(Community of Interest),將開放所有利益相關者就NSTC的規劃提供意見。 (2)投資半導體人才(Investing in the Semiconductor Workforce):創建人才勞動卓越中心(Workforce Center of Excellence),以培育、訓練美國半導體產業所需人才,並促進產業界與學術界的合作。 (3)投資其他關鍵領域研發之需求(Investing in Other Key R&D Needs):向美國晶片製造研究所(CHIPS Manufacturing USA Institute)投資至少2億美元,以創建美國首座半導體製造數位孿生研究所(Semiconductor Manufacturing Digital Twin Institute),以降低晶片研發製造的成本,加速創新技術商業化之週期;以及投資3億美元於先進封裝產業,以提升半導體系統之效能。以外亦投資1億美元資助「CHIPS量測計畫」(CHIPS Metrology Program)的29個項目,幫助研發新型測量設備與方法,以滿足為電子產業的技術需求。

Regolith的試煉:太空物質私有化

  美國國家航空暨太空總署(National Aeronautics and Space Administration,NASA)向企業購買月球Regolith(岩屑層)與岩石物質,並於2020年9月提出《月球Regolith採購工作績效聲明》(Lunar Regolith Purchase Request Performance Work Statement)。惟月球的物質,是否可以開採?   依據《各國探索與應用外太空、月球暨其他天體之活動管理原則條約》(Treaty on Principles Governing the Activities of States in the Exploration and Use of Outer Space, Including the Moon and Other Celestial Bodies)第2條,外太空、月球與其他星體,非任何國家可藉由使用、占領與其他方式,或應用國家經費,而宣稱擁有主權。針對NASA的月球物質採購計畫,是否合乎該條約?NASA署長Jim Bridenstine指出,Artemis計畫增加商業參與,要求企業蒐集小型的月球「塵埃」(dirt),或月球表面的岩石。Jim Bridenstine並認為此項提案,充分遵守該條約與其他國際義務。申言之,NASA認為月球之物質,具有私有化之可能性。   為採購企業蒐集之月球物質,NASA擬定《月球Regolith採購工作績效聲明》,規範企業的義務為:1、自月球表面蒐集50克至500克的Regolith或岩石物質;2、提供NASA蒐集與物質的影像,該資料足以識別蒐集地點為月球表面;3、就地(in-place)移轉NASA蒐集物質的所有權,此些物質並將成為NASA得以使用的私有財產(sole property)。企業得以決定在月球表面的任何地點蒐集,且無須評估蒐集的材料;NASA係採購蒐集狀態(“as-collected” condition),並有權利獨立確認企業蒐集物質的聲明。亦即企業的任務為採購物質,並提出證明;對月球物質的評估,則由NASA為之。   企業對NASA採購月球物質之履行,須於2024年以前完成;NASA對契約的獎勵,並不以月球物質蒐集的數量為基準。NASA對企業採購月球物質的支付依據:10%來自於企業完成NASA概念審查的提案;10%係企業為此蒐集任務,而由企業系統發射航空器至太空;80%為達成移轉NASA太空物質的所有權。另外,機器人登陸器(robotic lander)的設計與建構,並非屬NASA向企業徵集太空物質之內容。換言之,NASA之採購計畫並非強調太空物質之蒐集數量,而係著重於太空物質所有權之移轉。   綜上所論,NASA向企業採購月球Regolith與岩石物質,並以所有權之移轉為主,開啟太空物質私有化的可能性。

美國聯邦加強導入節能績效保證專案,並規劃採購實務增訂規範

  美國總統歐巴馬於2011年12月發布備忘錄(Presidential Memorandum),要求美國聯邦政府應加強「導入節能績效保證專案(Implementation of Energy Savings Projects and Performance-Based Contracting for Energy Savings)」,並宣布未來24個月內最少將投入20億(billion)美元經費,推動聯邦機構採購實施節能績效保證專案,以改善建築物能源效率。基於政策指示,美國能源部(Department of Energy)下屬聯邦能源管理推動機構(Federal Energy Management Program,以下簡稱FEMP),研議規劃配套機制,協助導入「節能績效保證專案(Energy Savings Performance Contract,以下簡稱ESPC)」,更精簡、效率、低成本之實施模式,並助益美國能源技術服務產業(Energy Service Companies,以下簡稱ESCO)發展。   美國FEMP於2012年2月公告ESPC採購關於「資金(Financing)」部分之「資訊徵求意見書(Request for Information,RFI)」,廣詢實務各界意見,希望能繼而落實於政府採購規範及契約範本之研議,並協助ESCO業者能更順利取得資金,並協助ESCO業者能更順利取得資金,及降低資金取得成本,如此亦可有利益於所採購導入之聯邦機構。   FEMP主要係規劃探討關於ESPC融資資金,最合理且有吸引力之利率,所應考慮各項要件及利率定價模式,並且規劃建立資金協助者之優先名單(Preferred Financiers),以利配套選用。再者FEMP為推動整合,特別探討ESPC跨專案(Project Aggregation (Combining))時,可能影響資金協助者之融資與財務評估,例如數ESPC專案、數ESCO業者、由同一資金協助者承接,或是數ESPC專案、數實施地點、同一ESCO業者,同一資金協助者,亦或者數ESPC專案、數實施地點、數ESCO業者、但同一政府機構、且同一資金協助者,研析相關影響要件。   以及,FEMP並探討ESPC實施「量測驗證(Measurement and Verification),對於取得融資評估過程是否增加複雜影響因素,以及資金協助者對於量測驗證機制,是否認為將增加風險並致更高融資利率,均為重要探討議題。此項意見徵求書,未來將落實於聯邦機構政府採購之實務規範上,相關內容再持續觀察追蹤。

生物遺傳資源歸屬之國際規範分析

TOP