合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2025/12/03)
引註此篇文章
你可能還會想看
蘋果申請新專利,使點餐不再需要大排長龍

  蘋果電腦設計一項系統,能使個人利用數位裝置來進行點餐,未來將不用在咖啡店或是速食店排隊等候也可訂到美味餐點。   蘋果公司就此項技術已經向美國商標專利局申請專利,倘若此項專利變成產品,那蘋果公司的產品就不再只限於電腦、iPod、線上音樂收費的市場。不僅如此,蘋果將變成餐廳、咖啡店甚至是零售商與顧客間的媒介。蘋果在2007年12月20日就此項技術申請專利,在申請案中,說明人們可以利用這項系統對餐廳進行點餐,而餐廳也能利用此項系統接收訊息。未來餐廳運用此項系統後,消費者就可以藉由數位PDA、手機來進行點餐,點餐者只須在線上排隊,無須為了他們喜愛的漢堡、飲料在店裡大排長龍。   此外,此項技術不僅僅是點咖啡的工具,蘋果在去年九月宣佈與星巴克簽約,所提供的技術還包括下載音樂,使用者將可以在喝咖啡時利用i-phone下載音樂並播放,消費者可以一邊享用咖啡,一邊聽喜愛的音樂。

美國FTC警告科技公司,不應迫於外國勢力而削弱對消費者之隱私與資料安全保障

美國聯邦貿易委員會(Federal Trade Commission)主席Andrew N. Ferguson於2025年8月21日發信給13家科技公司,其中包含Alphabet、Amazon、Apple、Microsoft、Meta、X等國際知名科技公司,警告他們有義務保護美國消費者隱私與資料安全,若在外國政府施壓下審查美國公民的資料,將有違反《聯邦貿易委員會法》(Federal Trade Commission Act, FTC Act)之虞。 信中指出,科技公司可能為遵循外國法規或迫於外國政府壓力,削弱對美國公民的隱私及資料安全保護。如歐盟《數位服務法》(Digital Services Act)、英國《網路安全法》(Online Safety Act)期望科技公司審查用戶言論內容;而英國《調查權力法》(Investigatory Powers Act)則為滿足英國政府取得用戶儲存資料之目的,要求科技公司削弱原本對用戶採行之點對點加密措施。Ferguson主席更表示:「外國勢力審查及削弱加密措施等行動,將侵害美國公民的自由或使美國公民遭受各種危害,例如受外國政府監視、增加身分盜用與詐騙風險」。 信中亦提及,科技公司在遵守外國法律及相關要求的同時,仍須遵守FTC Act第5條規定,亦即禁止企業在市場中進行不公平或欺騙性行為的規定。同時也表示,過去20年來,FTC已對未能履行消費者資料安全或隱私承諾之公司提起數十起訴訟,並將持續要求蒐集、使用、分享或傳輸消費者個人資料的公司,應採取合理的安全措施,藉此確保消費者權益。

美國專利商標局再審結果,將影響Motorola 與Aruba Networks間的專利侵權訴訟結果

  美商Motorola 公司(下稱MOT) 旗下Symbol Technologies, Inc.及Wireless Valley Communications, Inc.公司於2007年8月27日在美國德拉瓦州(Delaware)地方法院對美商Aruba Networks公司(下稱ARUN)提起專利侵權訴訟,指出ARUN侵害他們的無線區域網路連結技術(WLAN)等四項專利,並向法院申請永久禁制令及金錢上的損害賠償。     2008年9月,ARUN向法院申請反訴並向美國專利商標局(USPTO)對上開四項專利申請再審,指出MOT所據以主張的專利權申請日晚於ARUN之現有技術(Prior Arts)實施日。     今(2009)年2月,美國專利商標局已陸續對於ARUN所提的再審核發初審報告。其中,US Patent No.6625454中12/14說明項被認定為無效;US Patent Nos.6973622, 7173922之再審初審報告指出全部說明項都被認定為無效;目前還有1件ARUN申請的專利再審案在審查中,而根據MOT於法院上的陳述,美國專利商標局所受理的再審專利案件中,也多將原專利權認定為無效或變更。 ARUN所提的再審結果雖然尚未確定,但多數分析師認為再審結果多有利於ARUN。待再審結果確認後將會影響MOT v ARUN的訴訟結果,對於損害賠償判定也會有重大影響 。

美國國家標準與技術研究院公布物聯網設備核心網路安全基礎指南草案

  美國國家標準與技術研究院(National Institute of Standards and Technology, NIST)於2019年8月1 日公布「安全物聯網設備之核心網路安全特徵基準(Core Cybersecurity Feature Baseline for Securable IoT Devices)」指南草案,提出供製造商參考之物聯網設備網路安全基本要素,該指南草案中提出幾項重要核心要素如下: 設備辨識:物聯網設備必須有可供辨識之相關途徑,例如產品序號或是當連接網路時有具獨特性之網路位址。 設備配置:獲得授權之使用者應可改變設備的軟體以及韌體(firmware)之配置,例如許多物聯網設備具有可改變其功能或是管理安全特性之途徑。 資料保護:物聯網設備如何保障其所儲存以及傳送之資料不被未經授權者使用,應清楚可被知悉,例如有些設備利用加密來隱蔽其儲存之資料。 合理近用之介面:設備應限制近用途徑,例如物聯網設備以及其支持之軟體應蒐集並認證嘗試近用其設備的使用者資訊,例如透過使用者名稱與密碼等。 軟體與韌體更新:設備之軟體應可透過安全且可被調整之機制進行更新,例如有些物聯網設備可自動的自其製造商取得更新資訊,並且幾乎不需要使用者特別之動作。 網路安全事件紀錄:物聯網設備應可記錄網路安全事件並且應使這些紀錄讓所有人或製造商可取得,這些紀錄可幫助使用者與開發者辨識設備之弱點以近一步修復。

TOP