合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/26)
引註此篇文章
你可能還會想看
營業秘密管理概要

歐盟提出現行個資保護指令規範之修正草案

歐盟提出現行個資保護指令規範之修正草案 科技法律研究所 2013年10月07日 壹、事件摘要   歐盟於1995年所制定之「個人資料保護指令」(Data Protection Directive,95/46/EC,下稱個資保護指令),其基本原則確保了歐盟會員國個人資料基本權利之保障,後續也成為國際相關立法時之參考依據。但由於個資保護指令制定時為框架式立法模式,歐盟各會員國仍須將相關規定內國法化,導致各會員國間對於個人資料保護標準產生差距。 貳、重點說明 一、立法緣起   歐盟現行之「個資保護指令」是第一部解決關於個人資料處理與自由流通保護之指令,主要在於提供歐盟境內關於個人資料及隱私權保護之規定。但由於該指令使各會員國之規範不具統一性,且制定之時科技尚屬發展階段。為解決科技發展與各國形成之保護差距,歐盟執委會(European Commission)在2012年1 月25 日,向歐洲理事會(European Commission)及歐洲議會(European Parliament)正式提出「一般個人資料保護規則」(General Data Protection Regulation)草案共91 條。預計於2015年施行,並取代現行個資保護指令,全面並一致性適用於各會員國。 二、關鍵改變   本次一般個人資料保護規則草案相較於現行個資保護指令,主要有資料當事人權利行使新增與強化、當事人同意要件標準提高、適用主體擴大、申訴權力強化、資料管理人資料保護責任之加重、損害賠償與相關罰則之規定等,並將各項規定更加明確化,以解決長期以來歐盟會員國間因保護水準不一所形成之衝突現象。 參、事件評析   一般個人資料規則草案提出後,歐盟與英國分別針對新規則草案進行評估。歐盟執委會認為,新規則可協助歐盟境內解決長期以來因個資法保護水準不一所形成之衝突,進而為當地企業帶來約23億歐元之效益;但英國當地卻持反面見解,認為新法將使企業提高所需擔負之行政成本,且高規格之法遵要求也使資料管理人陷入難以遵守之情況,進而影響歐盟之競爭力。國際上激烈的討論聲浪與分歧之見解,也使得該規則草案自提出至今已一年多的時間,仍未正式拍板定案。   歐盟於1995年制定之個資保護指令,自1998年生效之後,不僅在各會員國進行個資保護時扮演關鍵性角色,更為國際上個人資料保護或隱私保護之參考依據,其動向更為各國所專注與留意。而隨著時代轉變與科技演進,歐盟期許未來不只是在歐盟境內,更可將個人資料或隱私保護相關資訊與要求,擴及歐盟以外之國家,因而於2012年提出新規則草案,而後續相關發展,更值得我們持續留意跟進。

美國食品藥物管理局(FDA)提案更新食品營養標示

  為了讓美國消費者可以完全明瞭日常購買食品所蘊含的營養內容,美國食品藥物管理局(Food and Drug Administration, FDA)於二月提案更新現行食品營養標示(Nutrition Facts Label)所必須彰顯的營養物內容。本次食品營養標示的調整,主要是針對從最新飲食建議、共識報告與全國調查數據所彙整出的結果,就攸關消費者疾病、健康與日常需求的營養物,重新就標示內容進行調整,以強化食品安全的資訊透明,落實保障消費者在選擇食品的資訊平等地位。以下,將針對本次主要調整事項分別作簡要說明:   在新的食品營養標示中,首先,要求額外列出添加糖(added sugars)的數量,以避免消費者因食用過多的糖分而導致肥胖(obesity)或促發其他疾病的發生;第二,要求更新食品營養物份量(serving size),對於食品營養標示需顯示消費者「實際食用」的份量,而非顯示消費者「可能食用」的份量;第三,要求標示鉀(potassium)與維他命D(vitamin D)的含量,以反應相關報告顯示美國人普遍對於鉀與維他命D有攝取不足的現象;第四,調整不同營養素(例如:鈉、膳食纖維與維他命D)的每日攝取標示,使消費者瞭解食品所含營養素內容;第五,持續要求標示總體脂肪(Total Fat)、飽和脂肪(Saturated Fat)與反式脂肪(Trans Fat),並去除卡路里來自脂肪的標示,以提供消費者攸關其健康更有用的資訊;最後,針對食品營養標示的型式進行調整,強調例如像是卡路里、份量與每日攝取比率之標示,以緩和美國近來日益嚴重的肥胖與心臟疾病等問題。   考量美國公共健康問題日益浮出檯面,FDA近來針對食品營養標示型式與內容進行調整,希望藉由資訊透明化的方式,讓消費者明瞭市售食品營養素是否影響自身健康,以作為挑選食品時的首要考量,進而降低不健康食品對消費者所帶來的危害。鑑於近來台灣食安問題日益嚴重,衛生主管機關是否亟需就食品營養標示,參酌美國或國外規範重新另作檢視,來確保消費者買得放心、食得安心,並吃出健康,則是現行衛生主管機關需另考量的重點。

國際海事組織建立海上自駕船舶監理架構

  國際海事組織(International Maritime Organization, IMO)所屬之海事安全委員會(Maritime Safety Committee, MSC)於2018年12月召開第100屆大會(MSC 100),本屆會議批准海上自駕船舶監管架構,要點如下: 一、盤點相關國際海事組織規範,以確認該規範: 是否適用於海上自駕船舶(Maritime Autonomous Surface Ships, MASS)及是否妨礙其運作與航行;或 是否適用於海事海上自駕船舶且不妨礙其運作;或 是否適用於海事海上自駕船舶且不妨礙其運作,但需要進一步調修。   MSC預計相關規範之盤點結論將於2019年6月前完成,並期待於2020年完成相關法規調適,盤點範圍包括:安全規範(SOLAS)、碰撞規範(COLREG)、載重線與穩度(Load Lines Convention)、海員與漁夫訓練(STCW, STCW-F)、搜尋與救援(SAR)、噸位丈量(Tonnage Convention)、貨櫃安全(CSC)、以及特殊貿易客船(SPACE STP, STP)。 二、 定義海上自駕船舶之自動化等級: 等級1:配備有自動化處理與決策支援船舶,海員仍於船上對船舶系統及相關功能進行控制。某些功能可以於無人監控下自動化運作,但船員於船舶上仍應於自動駕駛系統發生故障時進行人為介入。 等級2:有船員隨船之遙控控制船。該船舶係由岸上人員控制,惟船上之船員可於必要時介入並接手運作該船舶之自動駕駛系統與功能。 等級3:未有船員隨船之遙控控制船,該船舶由岸上人員控制。 等級4:全自動化船舶,船舶之自動駕駛系統可自行做出決策並反應。   此外,MSC預計提出海事海上自駕船舶航行指引(Guidelines on MASS trials),該指引將於下一會期(MSC101)之國際海事委員會會議進行草擬。

TOP