合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=86&tp=1 (最後瀏覽日:2025/08/21)
引註此篇文章
你可能還會想看
日本修訂《數位行政推動法》,完善行政機關雲端服務之使用環境

日本自2002年制定《活用資訊通信技術推動行政相關法律》(情報通信技術を活用した行政の推進等に関する法律,現簡稱《數位行政推動法》)以來,已歷經多次修正,旨在因應國家面臨數位轉型時代,持續調整法規以促使資訊通信技術有效應用於行政領域,並提升國家行政效率、改善國民使用政府服務之便利性為目的。日本數位廳(デジタル庁)於2024年12月9日向日本國會提出修正案,經通過後已於2025年3月8日開始施行。關於《數位行政推動法》本次修正重點簡要如下: 1. 增訂第18條第1項、第2項,要求中央(国家)與地方政府(地方公共団体)共用雲端服務環境之規章制度: 透過立法要求中央(国家)應採取相關必要措施,使地方政府(地方公共団体)能共用雲端服務,並促進公共資訊系統的有效利用,以及完善資訊系統之開發與維運,據以強化資訊共享基礎。 2. 增訂第18條第3項、第4項,使行政機關利用雲端服務之責任明確化: 明訂各行政機關,應提供行政事務專用的雲端服務,並開發符合服務需求之公共資訊系統,據以有效提升政府公共服務品質。 3. 增訂第19條第1項至第3項,要求中央(国家)與地方政府(地方公共団体)建立共同使用雲端服務之相關費用規章: 有關雲端服務提供者(Cloud Service Provider,簡稱CSP),包含AWS、Google Cloud、Microsoft Azure等,與行政機關簽訂相關之雲端服務合約,若地方或民間因使用同一雲端服務而須另支付CSP雲端使用費時,為強化公部門雲端服務基礎環境治理,依本條規定授權先由日本各府省廳、地方政府、行政法人等先向數位廳支付雲端服務使用費,再由數位廳統籌後向CSP支付款項,同時由數位廳訂下規格要求,以利公部門採購作業,促使行政機關與CSP之間的合約、雲端服務品質等得到一元化管理。 日本為了促進國家之行政事務能更有效率地推展,透過立法要求中央與地方間之行政機關應完善雲端服務基礎環境供行政事務專用,與建立相應之費用規章,以強化機關間資訊共享。不僅如此,依據本次修正之第18條「應採取必要措施」,其未來所採用之行政規則與具體實踐方式,如何有效提升行政資訊系統效率,仍可持續關注其發展情況。日本藉由持續完善法規與操作機制,打造中央與地方能夠共享、互通的公務體系雲端服務環境,提升人民使用數位化公共服務品質之作法,值得我國未來參考借鏡。

什麼是「日本Connected Industries」?

  Connected Industries為日本產業的未來願景,透過人、機器與科技的跨界連接,創造出全新附加價值的產業社會,以達到Society5.0理想目標。例如,物與物的連接形成物聯網(IoT)、人與機器合作拓展智慧與創新、跨國企業合作解決全球議題、跨世代的人與人連繫傳承智慧與技術、生產者與消費者接觸解決商業與社會問題等。   隨著第四次產業革命到來,IoT、大數據及 AI人工製會等技術革新,日本藉由高科技、技術人才及應變能力等優勢與數據技術相結合,目標是邁向以人類為中心、解決問題的新產業社會。Connected Industries的三大支柱分別為:   一、新數據社會(New Digital Society) 消除人與機械系統的對立,實現全新的數位化社會。解決新興科學技術如AI及機器人運用上的困難,並積極活用該技術幫助並強化人類解決問題的能力。   二、多層次合作(Multilevel Cooperation) 區域、世界及全球未來面臨複雜的挑戰,必須透過企業間、產業間及國與國間的連繫合作解決課題。   三、人力資源發展(Human Resource Development) 以人類為中心做思考,積極推展數據技術的人才養成,邁向智慧與技術的數據化時代。

美國衛生及公共服務部提出雲端服務適用健康保險可攜與責任法之相關指引

  美國醫療產業使用境內或境外雲端服務(Cloud Services)急速成長,導致「健康保險可攜與責任法」(Health Insurance Portability and Accountability Act,以下簡稱HIPAA)規範下之「適用機構」(Covered Entities)與其「商業夥伴」(Business Associate),對於雲端服務業者如何適用HIPAA感到疑惑。因此,衛生及公共服務部民權辦公室(Department of Health and Human Services, Office for Civil Rights)於10月7日公布相關業者如何適用HIPAA之指引,以釐清爭議。   於該指引中,該部指出,雲端服務業者若替適用機構或是商業夥伴創造、接收、維護、傳送被HIPAA所保護之「資療資訊」(Protected Health Information),則該雲端業者就被視為HIPAA下規範之商業夥伴,原因在於該服務具有儲存與維護醫療資訊功能,非屬該法排除適用之「網路服務業者」(Internet Service Providers)資料傳輸服務類型。   該指引有幾大重點:首先,雲端服務業者如將該醫療資訊提供加密儲存服務,仍應盡到HIPAA中規範商業夥伴之責任。原因在於加密資料不足以保護HIPAA有關資訊安全章節所要求醫療資訊之「機密性、完整性和可用性」之相關規範。再者,雲端業者皆須與委託方簽署商業夥伴協議(Business Associate Agreements)。此外,使用雲端服務儲存資療資訊時,委託方皆能使用行動設備進入雲端儲存之醫療資料,但應建立合乎HIPPA所要求相關之安全措施。最後,HIPAA並未禁止將醫療資訊儲存至伺服器為於美國境外之雲端業者,但使用前應自行評估該資訊遭駭客攻擊之可能性。

美國上訴法院:行為人不得以「主觀上對犯罪行為之無意識」阻卻著作權之侵害

  在電腦與網際網路普及與便利的今日,只要上網搜尋一些特定軟體,非常容易就能下載侵害智慧財產權的音樂或是影片,這樣的行為當然是非法的,但在美國出現爭議,若未成年人利用電腦非法下載,可否用「不知道這是犯罪行為」來抗辯侵權呢?   美國就發生了這樣的案例,現年22歲Whitney Harper,於2004年被美國唱片業協會(The Recording Industry Association of America,RIAA)控告其使用Kazaa分享軟體,下載阿姆(Eminem)、瑪麗亞凱莉(Mariah Carey)等37首歌曲,並將該37首歌曲透過線上分享軟體讓其他使用者亦得下載,RIAA認為此行為侵害了這些歌曲的智慧財產權,要求Whitney Harper每首歌曲需付750美元懲罰性賠償。   在訴訟中,唱片公司主張,其已於每張CD上貼上警示標籤;而Whitney Harper則抗辯自己不應該負擔如此高的罰款,係因當時她只有16歲,沒有意識到未經授權下載歌曲是違法行為,且認為下載就像利用網路聽收音機節目一樣,應該是免費的,認為自己無罪。   雖然有一些法官支持Whitney Harper的爭辯,不過第五巡迴上訴法院認為,無論Whitney Harper是否知悉其下載音樂之行為係屬違法,只要唱片公司有公告未經授權之重製行為即侵害著作權,與被告Whitney Harper之主觀意識無關。最後第五巡迴上訴法院確認Whitney Harper有罪,並判定 Whitney Harper共需賠償27,750美元。   Whitney Harper不滿其判決結果,向美國最高法院提起上訴,但法院拒絕其上訴。

TOP