合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/01/26)
引註此篇文章
你可能還會想看
日本修訂《數位行政推動法》,完善行政機關雲端服務之使用環境

日本自2002年制定《活用資訊通信技術推動行政相關法律》(情報通信技術を活用した行政の推進等に関する法律,現簡稱《數位行政推動法》)以來,已歷經多次修正,旨在因應國家面臨數位轉型時代,持續調整法規以促使資訊通信技術有效應用於行政領域,並提升國家行政效率、改善國民使用政府服務之便利性為目的。日本數位廳(デジタル庁)於2024年12月9日向日本國會提出修正案,經通過後已於2025年3月8日開始施行。關於《數位行政推動法》本次修正重點簡要如下: 1. 增訂第18條第1項、第2項,要求中央(国家)與地方政府(地方公共団体)共用雲端服務環境之規章制度: 透過立法要求中央(国家)應採取相關必要措施,使地方政府(地方公共団体)能共用雲端服務,並促進公共資訊系統的有效利用,以及完善資訊系統之開發與維運,據以強化資訊共享基礎。 2. 增訂第18條第3項、第4項,使行政機關利用雲端服務之責任明確化: 明訂各行政機關,應提供行政事務專用的雲端服務,並開發符合服務需求之公共資訊系統,據以有效提升政府公共服務品質。 3. 增訂第19條第1項至第3項,要求中央(国家)與地方政府(地方公共団体)建立共同使用雲端服務之相關費用規章: 有關雲端服務提供者(Cloud Service Provider,簡稱CSP),包含AWS、Google Cloud、Microsoft Azure等,與行政機關簽訂相關之雲端服務合約,若地方或民間因使用同一雲端服務而須另支付CSP雲端使用費時,為強化公部門雲端服務基礎環境治理,依本條規定授權先由日本各府省廳、地方政府、行政法人等先向數位廳支付雲端服務使用費,再由數位廳統籌後向CSP支付款項,同時由數位廳訂下規格要求,以利公部門採購作業,促使行政機關與CSP之間的合約、雲端服務品質等得到一元化管理。 日本為了促進國家之行政事務能更有效率地推展,透過立法要求中央與地方間之行政機關應完善雲端服務基礎環境供行政事務專用,與建立相應之費用規章,以強化機關間資訊共享。不僅如此,依據本次修正之第18條「應採取必要措施」,其未來所採用之行政規則與具體實踐方式,如何有效提升行政資訊系統效率,仍可持續關注其發展情況。日本藉由持續完善法規與操作機制,打造中央與地方能夠共享、互通的公務體系雲端服務環境,提升人民使用數位化公共服務品質之作法,值得我國未來參考借鏡。

美國發起「投資報酬計畫」(Return on Investment Initiative, ROI)全面檢視科研成果商業化法制

  川普總統在2018年4月發布「總統管理議程」(President’s Management Agenda)將國家科研成果商業化之發展視為「聯邦跨機關優先目標」(Cross-Agency Priority Goal, CAP Goal)。為維持美國全球科技創新領先地位,美國政府每年投資約1500億美元於各聯邦所屬大學與研究機構進行科技研究。美國國家標準與技術中心(NIST)與白宮科技政策辦公室(OSTP)聯合發起「投資報酬計畫」(Return on Investment Initiative, ROI),宗旨為釋放美國創新(Unleashing American Innovation),讓政府投資預算發揮科研補助之最大效益。   計畫目的包括:1.評估現行政府從事技術移轉指導原則,檢視應予以維持與待改革之處;2.吸引後期研發、商業化與先進製程的技轉投資,並降低法規阻礙;3.支持科研創新產官學合作模式與技轉機制;4.有效移除技轉阻礙以利加速技轉成效,並聚焦於國家重要產業發展的新興措施;5.評估聯邦政府資金運用指標成效;6.創造激勵學研機構提升技轉成效之誘因。   NIST調查指出,阻礙技轉發展之原因包括:1.技轉與智慧財產權協商所涉高額交易與時間成本;2.不同政府單位對法規之解釋、適用與實踐意見相歧;3.智慧財產權保護不足、技術授權使用限制與政府行使介入權(march-in rights)限制;4.公務員參與科技新創與衍生企業(spin-off)限制與利益衝突規範。此ROI計畫已於2018年7月30日完成各方意見徵詢,總計共104份。預計於2019年年初,做出完整分析報告與法制建議。

全球創新指數(GII)評估COVID-19對於全球創新的影響

  全球創新指數(Global Innovation Index,簡稱GII)為世界智慧財產權組織(WIPO)與歐洲工商管理學院(INSEAD)等單位,共同衡量全球經濟創新績效之參考指標,於今年(2020)9月2日所發佈的全球創新指數顯示,COVID-19嚴重的阻礙全球創新的發展,但卻也對於特定領域(如醫療衛生)帶來新的創新契機。   今年與2009年(全球經濟危機時)相比,世界金融體系運作仍保持平穩,但用於資助創新型企業的資金,由於全球投資者對於疫情影響新創企業營利表現擔憂,資金的投入也連帶受到影響。而在創新融資方面,鎖定新創早期階段投資的創投公司為確保日後競爭力,轉向對當今熱門標的(如生命科學等)等進行投資,若屬於研發密集型新創企業(研發時間較長)及非投資熱點(區域)的企業,投資方面則所受疫情衝擊較大。   觀察全球主要國家,雖然皆制訂相關補助計劃用以緩解因疫情所帶來之衝擊,例如中短期欲透過貸款擔保爲企業提供支持。然而,這些補助措施並非直接爲創新和新創企業提供資金。儘管如此,專家對於全球科學和創新受COVID-19的影響也非全然悲觀,部分源自於全球對於資本回報的期待,也預估未來風險投資及創新也將轉向醫療衛生、遠距教學、大數據、電子商務、機器人等領域。

日本總務省公布「2006年版資訊通信白皮書」

  日本資訊通信領域主管機關「總務省」 7 月 4 日 公布「 2006 年版資訊通信白皮書」。本年度白皮書除按照慣例闡述資訊通信政策之實施現況(第 2 章)以及今後推動方向(第 3 章)外,更本諸過去數年「 u 化社會」( ubiquitous network society )願景之研析成果與發展脈絡,將 u 化社會之願景與現實生活的技術或應用發展趨勢兩相比較,指出於逐步邁向該等願景的同時,社會整體經濟結構的特性也開始有所變化。   基於前開變化主係肇因於技術變遷、應用普及、逐步邁向 u 化社會願景之故,本年度白皮書第 1 章乃將之稱為「 u 化經濟」( ubiquitous economy ),並認為自宏觀角度而言,資通產業對於國家經濟實力之貢獻有增無減;另自微觀角度而言,個別用戶的重要性將會更加凸顯,資訊的流通傳遞也會更有效率,而本諸知識迅速累積分享的結果,生產力同樣可望大幅提昇。今後亦當本諸此等認知,規劃能令個別用戶放心使用之安全環境,弭平基礎建設未能完全普及之數位落差現象,預先具體指明可能發生之爭議課題,妥善探究適合 u 化社會願景實現之因應對策,以利全體國民均能充分享用 u 化社會所能帶來的福祉。

TOP