合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2025/09/19)
引註此篇文章
你可能還會想看
聯合國人權高級專員辦公室發布《數位時代隱私權》調查報告

  聯合國人權高級專員辦公室(Office of the United Nations High Commissioner for Human Rights, OHCHR)於2021年9月15日發布《數位時代隱私權》(The Right to Privacy in The Digital Age)調查報告,分析各種人工智慧技術,例如側寫(profiling)、自動化決策及機器學習,將如何影響人民之隱私或其他權利,包括健康權、教育權、行動自由、言論自由或集會結社自由等,並提出對國家與企業應如何因應之具體建議。 一、針對國家與企業使用人工智慧之共同建議:在整個人工智慧系統生命週期中,包括設計、開發、部署、銷售、取得(obtain)或運營,應定期進行全面的人權影響評估(comprehensive human rights impact assessments),提高系統使用透明度與可解釋性,並應充分通知公眾與受影響之個人其正在使用人工智慧進行決策。 二、針對國家使用人工智慧之建議:應確保所有人工智慧的使用符合人權,明確禁止並停止販售不符合國際人權法運作之人工智慧應用程序。在證明使用該人工智慧系統能遵守隱私及資料保護標準,且不存在重大準確性問題及產生歧視影響之前,應暫停在公共場所使用遠端生物識別技術。並盡速立法及建立監管框架,以充分預防和減輕使用人工智慧可能造成不利人權的影響,以及確保在侵犯人權時能夠有相關之補救措施。 三、針對企業使用人工智慧之建議:應盡力履行維護人權之責任,建議實施商業與人權指導原則(Guiding Principles on Business and Human Rights),並打擊(combat)人工智慧系統開發、銷售或運營相關的歧視,進行系統評估與監測,以及設計有效的申訴機制。

何謂「專利審查高速公路」?

  「專利審查高速公路(Patent Prosecution Highway, PPH)」係指專利審查機關加速專利審查之程序。藉著各國專利局間合約之簽署,當某專利申請在第1間專利局取得至少1請求項(claim)之核准後,申請人得請求加速第2間專利局就該已經核准之請求項之審查程序。申請人得縮短取得專利之期間,參與之專利局亦得藉著利用第1間審查之專利局已有資料,降低審查工作之負荷。但此並不代表於第1間專利局獲准之專利之發明於第2間專利局亦會當然獲准。   台灣目前已與美國、日本、韓國及西班牙簽署備忘錄進行專利審查高速公路之計畫,日後專利申請人得利用此機制,縮短取得專利之時程,專利局的審查速度亦會加快。根據智財局之統計,至2016年6月底,平均首次OA(office action)期間(自PPH文件齊備至首次OA平均期間)為57.6天,平均審結期間(自PPH文件齊備至審結平均期間)則為136.6天。

政府重申並未放寬輸往中國大陸半導體晶圓製程設備之出口管制

  由於國際出口管制組織「瓦聖那協議」( Wassenaar Arrangement,WA)於去年(93)底修訂半導體晶圓製程技術水準之出口管制規定,由0.35微米放寬為0.18微米;國貿局為配合「瓦聖那協議」之修訂,亦於今年9月公告半導體晶圓製程技術之出口管制修正為0.18微米。   然,我國半導體晶圓製造廠商申請赴中國大陸投資,主要依據經濟部之「在大陸地區投資晶圓廠審查及監督作業要點」辦理,其中第四點申請要件明顯規定「大陸投資事業製程技術限於0.25微米以上」。此外,在國貿局「限制輸出貨品總彙表」更有規範半導體晶圓製造等相關設備之輸出規定121:需要有國貿局簽發輸出許可證;輸出規定488:(一)輸往大陸地區者,應檢附經濟部投資審議委員會核准投資文件;輸往大陸以外地區者,應檢附保證絕不轉售大陸地區之切結書。(二)外貨復運出口者,另檢附原海關進口證明文件。(三)屬戰略性高科技貨品列管項目者,除應申請戰略性高科技貨品輸出許可證,並檢附上述文件外,應另依戰略性高科技貨品輸出入管理辦法規定,檢附下列文件:1、進口國核發之國際進口證明書、最終用途證明書或保證文件。2、外貨復運出口者,如原出口國政府規定需先經其同意者,應另檢附原出口國政府核准再出口證明文件;其於原進口時領有我國核發之國際進口證明書、最終用途證明書或保證文件者,應再檢附該等文件影本。   國際貿易局強調,我國目前開放半導體晶圓製程技術輸往中國大陸仍限為0.25微米以上,並未放寬輸往中國大陸之出口管制。

美國「2009年經濟復甦暨再投資法」大幅度修正HIPAA隱私權條款

  2009年02月17日美國總統簽署通過「2009年經濟復甦暨再投資法」(America Recovery and Reinvestment Act, ARRA),將醫療產業列為重點發展項目之ㄧ,擬由政府預算進行醫療資訊科技化計畫,俾使電子病歷的傳輸與交換得兼顧效率及安全。而以規範醫療資訊安全為主的「醫療保險可攜及責任法」之隱私權條款(HIPAA, Privacy Rule),亦因此有重大修正。   其中,最主要的變革在於擴充HIPAA的責任主體,由原有的健康照護業者、健康計畫業者及健康照護資訊交換業者,擴充至凡因業務關係而可能接觸個人健康資訊的個人或業者,包含藥劑給付管理公司、代理人及保險業者等,這些機構或個人原本與醫療院所或病患間係依據契約關係進行責任規範,但被納入HIPAA的責任主體範圍後,則需依此負擔民、刑事責任。   而於加強資訊自主權部份,亦有數個重要變革如下:(一)責任主體之通知義務:依據新規定,資料未經授權被取得、使用或揭露,或有受侵害之虞時,責任主體應即早以適切管道通知資訊主體有關被害之情事,以防備後續可能發生的損害。(二)資訊主體之紀錄調閱權:以往資料保管單位得拒絕個人調閱健康資料運用紀錄之請求,有鑒於病歷電子化後,保存及揭露相關紀錄已不會造成過重負擔;依據新規定,資訊主體有權調閱近三年內個人健康資料被使用次數及目的等紀錄。(三)資訊主體資料揭露之拒絕權:以往責任主體得逕行提供個人醫療資訊作為治療、計費及照護相關目的之使用,無論資訊主體曾表達拒絕之意與否;依據新規定,資訊主體得禁止其向保險人揭露相關資訊,除非保險人已全額支付醫療費用。   以上HIPAA之新增規範,預計於2010年02月17日正式施行。

TOP