合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/17)
引註此篇文章
你可能還會想看
精簡專利審查:加拿大專利法修正案即將生效

  因應加拿大-美國-墨西哥協定(Canada-United States-Mexico Agreement, CUSMA)中關於專利期間調整及精簡專利審查程序,加拿大政府對加拿大專利法進行重大修改,新法於2022年10月3日生效,其主要修正重點如下: 1.初步審查報告後之繼續審查要求 如專利申請人欲於3份審查意見報告做成後申請繼續審查(Request for Continues Examination),需支付816加幣之費用(小型企業之費用為408加幣)並可額外獲得最多2份審查意見,如專利仍未核准,申請人需另外再申請繼續審查。 2.超過20項專利請求項之超額費用 專利範圍中多於20項之專利請求項,每多1項專利請求項將被要求額外支付100加幣之超額費用(但小型企業僅需支付40加幣之超額費用),該費用將於以下2個情形產生: (1)當提出審查時,申請案中有超過20項之專利請求項; (2)當支付授予專利的最終費用時,專利請求項在審查過程中超過20項。 3.附條件之專利核准通知 一旦專利申請已接近核准階段,僅剩下次要的手續問題時,加拿大專利局可核發附條件之核准,使申請人修正該問題並支付最終費用以獲取專利。   加拿大政府於2021年7月出版的法規影響聲明(Regulatory Impact Analysis Statement)闡述該法修正理由,並對加拿大專利局無法於合理時間內完成專利審查表示擔憂,於2020年至2021年,加拿大專利審查至授予專利平均時間為31個月,且於本修正案前,對於專利局在授予專利或放棄專利前之審查報告數量未有限制,且無論花費的資源多寡,所有專利之審查費均相同。   該法規影響聲明亦提到加拿大專利申請案包含平均多於其他國家的專利請求項,導致專利審查效率低下,並解釋政府不鼓勵專利申請案包含不必要、過多的專利請求項,確保更快地給予專利,並預計本修正案施行後將減少專利申請量並提高專利品質。   另有論者指出,此修正案可能導致專利申請成本提高,使申請人於加拿大申請專利之意願降低,並認為加拿大專利制度尚待解決的問題在於雙重專利制度(double patenting regime)及專利適格性(subject matter eligibility),本法施行後的實務發展值得持續關注。   「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

關於軟體產品的智慧財產權保護建議

  近期軟體產品(特別是演算法)的智慧財產權保護受到各界廣泛注意,2022年12月美國實務界律師特別撰文對此提出相關智財權保護建議。軟體產品通常涉及演算法,指由人工智慧(AI)和分析組成,用於解決特定問題的一組規則。專利通常被企業預設為保護技術產品的最佳形式。   然而在2014年,美國最高法院在Alice Corp. v. CLS Bank International一案中可以發現將軟體申請專利保護可能存在風險,如:(一)軟體可能被認為是抽象概念(abstract ideas),非專利適格標的,而無法受專利法保護;(二)通常不易主張專利權,或可能在訴訟過程中因舉證責任造成機密資訊揭露等風險。因此該文作者認為難以受專利法保護之演算法、用於基於機器學習或訓練模型的資訊和資料集等軟體資料,亦可考慮透過營業秘密來保護,並提出以下營業秘密管理的建議: 1.員工教育訓練:建議企業可在僱傭的各階段(僱傭時、每年、終止時)採行相關措施、訓練,以減少營業秘密的竊用,及防止未來員工抗辯不知道該資訊是營業秘密。 2.機密標示:建議企業透過此階段審視組織對於機密文件之界定,再透過機密標示配合存取權限設定,協助企業控管與防止機密外流。 3.執行:瞭解需要受管理的營業秘密是什麼以及其為何重要。 4.監控和衡量員工參與度:建議企業採取相關監測機制檢視員工活動,及早發現離職動向與管控營業秘密資訊。 5.避免資訊揭露:建議企業應確保在向消費者或客戶行銷的過程中不洩露營業秘密,或至少採取相關保護措施,如簽訂保密契約。 6.確保資料安全:建議企業可建置網路安全策略、設置密碼、存取限制、外部設備使用下載或儲存限制等管控措施。   綜上所述,對於從事軟體開發的企業,除以專利保護產出成果外,還可從技術本質、後續是否容易主張、是否適合公開等面向,評估搭配營業秘密保護成果。並在選擇以營業秘密保護成果時,採行相關的管理措施避免營業秘密外洩而造成企業損失,包括:劃定需管理的營業秘密、制定員工教育訓練與相關管制措施,如機密標示、權限控管,並可搭配預警機制以便能夠即早發現異常。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

美國網路安全聯盟提出網路安全策略建議報告

  美國網際網路安全聯盟(Internet Security Alliance,ISA)日前公佈一份新的報告,期使歐巴馬政府之「網路空間政策檢討」(Cyberspace Policy Review)能更進一步的落實。     網路安全聯盟主席Larry Clinton指出:「ISA對歐巴馬政府的網路安全政策表示支持,而目前民間機構需要設計一套規範,去落實ISA與政府對於網路安全重要議題共通之協議。本次所提出的報告,就是為了要提供能解決此一關鍵問題的架構。」     此份報告之標題為「利用ISA之社會契約模型執行歐巴馬政府之網路安全策略」(Implementing the Obama Cyber Security Strategy via the ISA Social Contract Model),而此報告強調必須重視網路安全的經濟意義。     Clinton認為,一旦討論到網路安全議題,會發現所有的經濟因素都對攻擊者有利,攻擊者總是能以簡單、成本低廉之攻擊方式得到巨大的利益。相對地,防守者(網路使用者)卻往往要付出高昂的成本。需要防護的領域太廣,而投資的回收通常很有限。必須從經濟的角度去平衡考慮成本與回收,才能建立具實效性且持續穩固的網路安全系統。     此份報告包含下列事項之架構:1.在商業計劃層面,創設政府與民間機構的合作夥伴關係,以強化網路安全;2.提出關於網路安全的國際議題;3.維持全球IT產業供應鏈的安全;4.建立新式資訊分享範例。     上述架構均依循ISA之網路安全社會契約模型,此一模型是源自於20世紀早期美國政府為了提供民間企業電信與電力服務,所成功建立之夥伴關係。

德國聯邦內閣提出安全數位通訊及醫療應用法(E-Health-Gesetz)草案

  德國聯邦內閣於2015年5月27日提出安全數位通訊及醫療應用法(Entwurf eines Gesetzes für sichere digitale Kommunikation und Anwendungen im Gesundheitswesen, E-Health-Gesetz)草案。   德國聯邦衛生部部長說明因草案的形成一直有所爭議,以致過程冗長。而為了保證大量數據的資料維護及安全,德國資料保護及資訊流通之主管機關聯邦資料保護官(Bundesbeauftragten für den Datenschutz und die Informationsfreiheit, BfDI)及聯邦資訊安全局(Bundesamt für Sicherheit in der Informationstechnik, BSI),從一開始即密切參與其中合作。針對電子健保卡(die elektronische Gesundheitskarte)的資訊安全要求,德國聯邦衛生部將關注科技發展,持續更新相關規定。   本法案包括高安全標準之數位設施的建置期程,以及產生病人具體應用效益的時間規劃表,重要規定如下: 1.主檔資料管理(Stammdatenmanagement):被保險人主檔資料(Versichertenstammdaten)的測試及更新,自2016年7月1日起,於兩年內針對全國區域進行大範圍測試。 2.結合病人的緊急資訊(Notfalldaten):醫生能立即取得所有重要資訊,如過敏或過去病史等資料。當病人有該等需求之意願時,自2018年起健保卡即應包含緊急資訊。 3.藥物治療計畫(Medikationsplan):包含病人使用藥物治療的所有資訊,藥物治療計畫能於治療過程中使病人更加安全。而同時最少使用三種藥物的被保險人,自2016年起應採行藥物治療計畫。之後應可於電子健保卡取得藥物治療計畫相關資訊。 4.以電子方式發送醫療診斷報告(Arztbriefe):因目前為止醫療診斷報告仍係透過郵寄,然而為求重要資訊立即呈現,於2016年及2017年醫生以電子方式安全寄送診斷報告者,每份報告應收取55歐分的費用。 5.遠距醫療(Telemedizin):為推動遠距醫療的利用,自2017年4月1日起遠端傳輸X光照(Röntgenaufnahmen)的醫療診斷結果將收取費用。 6.醫療資訊系統的互通性:建立互通性指引(Interoperabilitätsverzeichnis)應可使醫療方面各類資訊系統所採行的標準透明化,且可使其規範更加標準化。而該指引應包含遠距醫療應用資料入口網站(Informationsportal)。 7.本法案所提期程,特別係針對實施的代表性自治組織(Organisationen der Selbstverwaltung),德國聯邦法定健康保險總會(GKV-Spitzenverband)、聯邦特約醫師協會(Kassenärztliche Bundesvereinigung)及聯邦特約牙醫協會(Kassenzahnärztliche Bundesvereinigung)適用。

TOP