合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/02/20)
引註此篇文章
你可能還會想看
美國聯邦交通部公布自駕車4.0政策文件

  美國交通部(Department of Transportation)於2020年1月8日公布「確保美國於自動駕駛技術之領導地位:自駕車4.0」(Ensuring American Leadership in Automated Vehicle Technologies : Automated Vehicles 4.0)政策文件,提出三個核心原則及相對應的策略規劃: 一、 使用者與社會的保護: 整合自動駕駛技術之安全性,包括防堵對自駕車性能之詐欺或誤導行為,以強化民眾對此新興技術的信心。 與自駕車技術開發商、製造商及服務商合作,預防與降低惡意使用自動駕駛技術所造成的公共安全威脅及犯罪,如制定網路安全標準、於運輸系統之資料傳輸媒介及資料庫設計能夠防止、反應、偵測潛在或已知危險之可行作法。 要求製造商於設計和結合相關自動駕駛技術時,採取具整體風險考量之方式,以確保資料安全性與公眾隱私保護,特別是針對駕駛者與乘客,以及第三人資料存取、分享及使用。 支援與協助自動駕駛技術研發,並透過提供多樣化商品和服務,滿足消費者需求並增加自駕車的普及性,使國人能使用安全且能負擔的移動載具。 二、 保障市場效率: 採取靈活及技術中立政策,由大眾選擇具經濟及有效率的運輸方案。 透過相關智慧財產法規,保護相關技術,並持續推動經濟增長之政策及提升國內技術創新競爭力。 收集與研擬國內外法規資料,並使自動駕駛技術產品及服務能夠與國際標準接軌。 三、 促進與協調各方合作: 積極協調全國自動駕駛技術研究、法規和政策,以利有效運用各機構資源。 參考國際間自動駕駛技術標準及監理法規,並與各州政府及業界共同研擬與整合自動駕駛技術至現行運輸系統標準與相關法規。

強制蒐集人體生物資料的人權標準-聯合國人權事務委員會的見解

美國聯邦第七巡迴上訴法院宣告電業以設置智慧電表手段蒐集用電戶即時用電資訊合法

  美國聯邦第七巡迴上訴法院於2018年08月16日宣告,美國伊利諾伊州杜佩奇縣內珀維爾市(Naperville)所經營之「獨占性」公用售電業,以裝設智慧電表手段蒐集用電戶即時(Real Time)用電資料,並保存長達三年之行為,並無違反美國憲法第四條修正案以及伊利諾州憲法第一條第六項所宣示之不得以不合理手段對於民眾居住隱私資料進行搜索之限制。   美國聯邦第七巡迴上訴法院闡明,本案爭點有二:第一,內珀維爾市(Naperville)所經營之獨占性公用售電業以裝設智慧電表手段蒐集用電戶即時用電資料,並保存長達三年之行為,是否構成美國憲法第四條修正案以及伊利諾州憲法第一條第六項所謂之「對於民眾居住隱私資料之搜索」?第二,如內珀維爾市(Naperville)所經營之獨占性公用售電業以裝設智慧電表手段蒐集用電戶即時用電資料係構成「對於民眾居住隱私資料之搜索」,則內珀維爾市(Naperville)所經營之獨占性公用售電業是否有更高之公益,可合理化此一對於「對於民眾居住隱私資料之搜索」之行為?   美國聯邦第七巡迴上訴法院認定內珀維爾市電業以智慧電表手段蒐集民眾用電資訊,確實是構成美國憲法第四條修正案以及伊利諾州憲法第一條第六項所謂之「對於民眾居住隱私資料之搜索」。但是由於珀維爾市電業蒐集這些用電資訊,是基於更高之公益目的,因此仍屬以合理手段對於民眾居住隱私資料進行搜索。因此判決本案珀維爾市電業勝訴。   於第一爭點,美國聯邦第七巡迴上訴法院認定智慧電表之紀錄內容包含「電器負載特徵(load signature)」以及「用電戶電力消耗慣性」,對比Kyllo v. United States, 533 U.S. 27, 31-32(2001)乙案下警方以熱感應器方式偵測住宅整體熱能有無之行為,更高度細緻化、具有侵入性,且智慧電表之設置,於現今尚非普及(not in general public use),因此構成對於民眾居住隱私資料之搜索。又內珀維爾市(Naperville)所經營之獨占性公用售電業雖辯稱用電戶於裝設智慧電表時,皆已經同意電業蒐集其個人用電資訊,然美國聯邦第七巡迴上訴法院認定,內珀維爾市(Naperville)所經營之公用售電業具有高度獨占性,故用電戶裝設智慧電表之同意難謂有效,且用電戶同意用電,不代表用電戶即同意分享其用電資訊。   惟於第二爭點,美國聯邦第七巡迴上訴法院認定,由於內珀維爾市(Naperville)所經營之獨占性公用售電業已經聲明不會將此類用電資訊分享予有關政府機關,且本案對於用電戶用電資訊之蒐集,其目的亦與刑事追訴無關,是以應以低密度審查標準看待本案即可,又本案內珀維爾市(Naperville)所經營之獨占性公用售電業裝設智慧電表之目的在於促使電網現代化,並且可使發電業供應更加穩定之電力,並且也可以透過時間電價(Time-Based Pricing)之方式促使用電戶節電,並且減少電網負載,同時也可以使發電業節省查表之人事成本,因此雖然內珀維爾市(Naperville)所經營之公用售電業透過裝設智慧電表之手段蒐集用電戶即時用電資訊係構成對於用電戶之民眾居住隱私資料之搜索,然由於其具有更高之公益性,因此仍可合理化此一對於「對於民眾居住隱私資料之搜索」之行為。   綜上,本案美國聯邦第七巡迴上訴法院判定內珀維爾市(Naperville)所經營之獨占性公用售電業勝訴。

2024年保護美國人資料免受外國對手侵害法案即將於2024年6月生效,為美中資料傳輸增加限制

2024年保護美國人資料免受外國對手侵害法案(Protecting Americans’ Data from Foreign Adversaries Act of 2024, PADFA)於2024年6月生效。該法案為美國國家安全補充法案(H.R. 815, the National Security Supplemental)的一部分。美國總統拜登在2024年4日24日簽署通過國家安全補充法案以及該法案所包含的PADFA,而PADFA將於簽署日後60天發生效力。 PADFA禁止資料經紀人將美國人民的敏感個資(personally identifiable sensitive data)傳輸到指定的外國對手國家,以及由這些國家控制的實體,如公司等。 PADFA所指之資料經紀人(data broker),是指以出售、授權、租賃、交易、轉讓、發布、揭露、提供存取權或其他方式,將個人資料提供給特定實體,並收取對價者。而該法所稱之敏感個資,定義則相當廣泛,從個人日常活動資料如行事曆資訊、電子郵件,到個人醫療、財務資料皆包含在內。 目前PADFA指定之外國對手國家,是引用自美國法典第十編4872(d)(2)條(4872(d)(2)of title 10, United States Code.),包含中華人民共和國、朝鮮民主主義人民共和國、俄羅斯聯邦、伊朗伊斯蘭共和國。而外國對手國家控制的實體則包含以下幾類 : 1.前述國家擁有20%以上所有權的實體。 2.主要營業據點、總部、住所位於前述國家的實體。 3.依前述國家法律建立的實體。 4.受前述國家指導、控制之人。 由於PADFA適用範圍廣泛,未來美中兩國資料傳輸將受更多限制。該法案生效後將由美國的聯邦貿易委員會(Federal Trade Commission)執行,該委員會將有權對違規者進行民事處罰。

TOP