合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/01/27)
引註此篇文章
你可能還會想看
瑞士洛桑國際管理發展學院公布《2022年IMD世界競爭力年報》

  瑞士洛桑國際管理發展學院(International Institute for Management Development, IMD)於2022年6月15日公布《2022年世界競爭力年報》(IMD World Competitiveness Yearbook)(以下簡稱本報告)。本報告以「經濟表現」(Economic Performance)、「政府效能」(Government Efficiency)「企業效能」(Business Efficiency)和「基礎建設」(Infrastructure)四大指標(含333項子標)評比63個經濟體。評比結果:全球競爭力前5名依序為丹麥、瑞士、新加坡、瑞典與香港;而其他重要經濟體之排名,如臺灣第7、美國第10、中國第17、南韓第27與日本第34。   丹麥34年來首次位列第一,去(2021)年居首的瑞士則跌至第2名。究其原因,丹麥因公共債務與政府赤字的減少,其「經濟表現」大幅提升。至於新加坡,雖於2019年與2020年皆居於榜首,去年則滑落至第5名。對此,IMD主管Arturo Bris表示,新加坡嚴格的防疫政策,限制了國際服務與人員流動,致使去年的全球競爭力排名下滑。然新加坡今年排名上升係因「經濟表現」強勁,其「國內生產總值」增長,「國內經濟」、「國際貿易」和「科技基礎建設」等子標皆位居全球第一,但「經營管理」卻排名第14、「科學基礎建設」排名第16、「健康與環境」更排名第25,仍處於相對較後的位置。若欲提升排名重回榜首,新加坡政府需設法應對外部經濟發展所帶來的挑戰(如全球供應鏈中斷、商品價格上漲等)、協助仍受COVID-19疫情影響的行業復甦經濟,並幫助企業走向低碳未來等永續發展方面作改善。   而我國,由去年第8名進步至今年第7名,突顯我國在全球COVID-19疫情肆虐之情況下,整體競爭力仍獲國際肯定。政府亦將以本報告之評比結果為鑒,協助企業加強全球布局,並積極推動前瞻基礎建設、六大核心戰略產業、2050淨零排放等產業轉型升級,期盼能持續提升我國競爭力。

從匯流看我國電信與廣播電視產業之法律規範

非評論、批判之著作若具新目的之轉化亦屬合理使用範疇之新見解 - Patrick Cariou v. Richard Prince

  美國聯邦第二巡迴上訴法院針對Patrick Cariou v. Richard Prince一案做出侵害著作權之合理使用判斷新見解,合理使用之目的主要為平衡著作權與美國憲法第一修正案之間的衝突,故1976年著作權法第107條中編寫有關合理使用之條文─在第106和第106A之規定外,對一受著作權保護作品的合理使用,無論是透過複製、錄音或其他任何上述規定中所提到的手段,以用作批評、評論、新聞報導、教學、學術交流或研究之目的,不屬於侵權。上訴法院認為被告Prince使用雖不符合批評、評論、新聞報導、教學、學術及研究等,卻是另有目的,可構成合理使用,更進一步指出被告的創意方法、表現形式等都與原告作品本質上不同,甚至還比原作新穎,因此,在轉化測試法則上建立了若以不同美學表達且加入挪用藝術手法的話,即使不具批判卻另有目的並加入新元素於創作,使原作改變之轉化,則構成合理使用。至於轉化測試法則確立於1994年的Campbell案,最高法院指出戲謔仿作可藉由諷刺原著作而轉化成與原著作不同的另一著作。   此案可謂針對合理使用於判定著作權侵害案件時,合理使用原則第一項因素成立轉化測試法則與否之新指標。著作權合理使用原則發展亦可觀察出美國有逐漸將判斷標準擴大之趨勢,而轉化測試法則之發展亦將持續追蹤之。

歐盟公布行動健康(mHealth)公共諮詢報告

  歐盟在2014針對行動健康(mHealth)綠皮書進行公共諮詢,要求相關之人針對mHealth發展的十一個議題提出意見。進行的時間從2014年4月10日至7月10日,歐盟在2015年1月12日公布諮詢結果,總計有211位參與者回覆,其中71%由組織機構回覆,29%則為個人意見回覆。   在諮詢報告中所提列之十一項議題包含:1. 健康資料的安全性、2. 巨量資料、3. 於目前歐盟法規下的適用情況、4. 病人安全性與資訊透明化、5. mHealth在醫療照護系統的定位以及平等使用、6. 互通性、7. 補助機制、8. 責任歸屬、9. 研究與發展、10.國際合作、11. mHealth市場發展性等。   針對上述議題,諮詢報告提出幾項認為未來發展mHealth時面臨之問題以及應該如何因應。包含: 1. 多數認為應建立隱私安全保護工具,包括資料加密以及驗證機制。逾半數的人認為應該執行資料保護,將法規適用於mHealth相關器材。2. 近半數的人要求病人安全以及資料的透明性,因此,應可建立制度使這些mHealth APP經品質認證通過後上市。3. 對於mHealth的業者而言,認為需要有清楚的法規架構、互通性以及共通的品質標準建立,才能有助於產業的發展。4.透過立法、自律機制以及指導原則的建立,使mHealth APP所衍生之問題能有規範可供解決。5. 部分認為mHealth的成本效益需要有更多的數據證據分析來評估。例如,在美歐國家曾進行一項測試,mHealth可以減少50-60%肺部慢性疾病病人住院以及再次入院的比例。此外,mHealth亦可減少25%老人照護的成本支出。6. 歐盟以及各個國家應該確認mHealth的互通性,基於持續性的照護以及研究目的,能有共通可相互使用的電子醫療紀錄。7. 其次則是應該促使開放標準,並有醫療專家以及使用者積極參與使mHealth能完備進行。   在歐盟此的mHealth公共諮詢報告中,已提出未來可能面臨的問題,歐盟嘗試以既有之指令規範檢視mHealth衍生之問題是否能夠加以因應解決,其主要目的仍在於讓消費者能安全使用,同時亦希望能促進產業開發與進步,其後續發展值得觀察,同時亦可提供相關業者開發時之參考。

TOP