合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/06/09)
引註此篇文章
你可能還會想看
日本特許廳持續就專利商標查詢平台(J-PlatPat)進行效能優化

  國際智慧財產權的檢索、查詢,幫助技術、競爭的情報蒐集,是企業能夠規劃出智財布局的優先前提。日本特許廳為提升「專利商標查詢平台」(J-PlatPat)之功能及查詢便利性,規劃就現有平台機能進行擴充,預計在2019年5月時,全面改版完成。特許廳本次J-PlatPat的改版,主要更新或擴充項目包括:將設計專利及商標於審查、審判階段之文件納入可查詢之範圍,並縮短資料上傳時間,使相關文件於上傳隔日即可查詢;增加商標存續狀態之呈現,並增加已廢止商標之檢索;採用人工智慧進行翻譯,提升翻譯品質等;亦針對關鍵字、搜尋結果排序、圖面之運用、設計專利之圖面呈現方式進行優化。   改版後之專利、商標檢索系統便利性,大幅提升,使用上亦毋需支付任何費用。日本特許廳J-PlatPat(https://www.j-platpat.inpit.go.jp/)是個免費的資源,我國企業、學界的智財實務工作者可善加運用此平台,更有效率地達成技術和競爭情報檢索,在專利、商標的國際性競爭中勝出。

英國資訊委員辦公室首次對違反資料保護案件開罰

  英國資訊委員辦公室(Information Commissioner’s Office,ICO)於今(2010)年11月24日首次對違反資料保護案件開罰。   賀福郡理事會(Hertfordshire County Council)員工在今年6月兩度將載有高度敏感性資料的文件傳真予錯誤的收件人。ICO經調查後認定,由於賀福郡理事會未能防止兩次資料外洩事件發生,導致嚴重損害,而在首次外洩事件發生後,亦未採取足夠的預防措施避免類似情況發生,因此裁定十萬英鎊之罰鍰。   另一家發生資料外洩事件的人力資源服務公司A4e,則是因其員工將含有兩萬四千筆個人資料的筆記型電腦帶回家後遭竊,且包括個人姓名、出生年月日、郵遞區號、薪資、犯罪紀錄等相關資料並未加密。ICO認為,A4e並未採取適當措施避免資料外洩,且A4e允許其員工將未加密的筆記型電腦帶回家時,已知內含個人資料種類及數量,因此裁定六萬英鎊之罰鍰。   ICO表示,希望本次處罰能對於處理個人資料的機構有所警惕。   ICO今年4月被賦予裁罰權,至於裁罰的標準,則有裁罰指引(fine guidance)可參考。根據裁罰指引,若資料控制者(data controller)故意違反資料保護法(Data Protection Act),或可得而知可能違法之情形,卻未採取適當措施預防之,而可能造成相當損害時,ICO得處以相當罰鍰。

國內藥廠發起外銷策略聯盟

  經濟部工業局將協助國內製藥業成立「藥廠外銷策略聯盟」,集合藥界力量共同打開外銷市場,希望至少推動十幾個學名藥外銷,而明年外銷產值可達 20 億元,每年成長 20 %,五年後外銷產值可到 100 億元;主要鎖定美、日、歐為主的 PIC/S (國際藥品稽查協合會)市場,由熟悉市場的專家來協助製藥界一起拓展海外市場,目前已有近十家業者有意加入此聯盟。   由於過去國內藥廠都主攻健保市場,不過未來成長有限,國內藥廠必須積極拓展海外市場,才可以保持競爭力。今年 4 月,日本實施新藥事法後,採取產銷分離,國內製藥業者有機會爭取到代工的機會,工業局將協助國內業者爭取日本代工注射劑、口服液等機會,以及在台採購原料藥和其他藥劑。以歐盟為主的 PIC/S 市場,近年會員增多,美國 FDA 也有意加入,國內藥廠如能爭取成為會員,可以降低藥廠重複檢驗的成本,有利拓銷海外市場。   國內藥廠拓銷海外市場已漸有成績,如優良藥廠和永光化學合作避孕藥 GyMiso ,與歐洲 HRA 藥廠合作進軍歐盟市場,並順利通過 PIC/S 查核,取得產品製造許可。生達製藥和永信製藥都在美國設廠,努力耕耘美國市場十年後,已開始賺錢,不過仍希望和國內業者合作。南光則已有和日本代工非 PVC 材質注射劑的經驗。

國衛院生物製劑先導工廠 三年內投產

  慶祝國家衛生研究院成立十周年,國衛院表示將規劃成立生物製劑先導工廠,今年可發包動工,預計三年內完成,未來除了生產台灣本土性傳染病所需疫苗外,也協助衛生署流感疫苗自製計劃提供技術來源。行政院核准通過十二億元的生物製劑先導工廠,目前已進入招標階段,預計六、七月份可正式動工,預計三年後完工投產,未來將成為符合聯合國國際疫苗中心 (The International Vaccine Institute, IVI) 的規格的 GMP 生產線。   此外,配合衛生署的公共衛生計劃,國衛院疫苗研發中心也將建立本土性傳染病如腸病毒、 SARS 、白喉、百日咳、破傷風及日本腦炎的資料庫,部份疫苗市場潛力發展有限,但是透過國衛院的保存,讓我國具備完整的疫苗量產能力。政府計劃投資五十億元興建大型流行感冒疫苗工廠,國衛院將扮演技術提供的角色,包括參考實驗室,人員訓練,及微生物量產疫苗的開發,都將由生物製劑先導工廠負責。

TOP