合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/05/06)
引註此篇文章
你可能還會想看
德國放寬胚胎幹細胞之研究限制,允許進口2007年5月以前所製造的胚胎幹細胞進行研究

  在德國,由於納粹的醫學實驗歷史,人類胚胎研究一向是極為敏感的議題,並且為了研究用途摧毀胚胎也有極大的倫理爭議。德國下議院於2001年立法禁止從胚胎中粹取幹細胞後,在現行法規下幹細胞研究者只可以進口2002年1月1日以前製造的胚胎幹細胞供使用。不過在科學家一再表達只有極少量的細胞株可有效提供研究的關切下,德國下議院日前以346票對228票通過幹細胞法之修正,將截止日期(cut-off date)之規定由2002年1月1日,修正為2007年5月1日,藉此放寬對人類胚胎幹細胞研究的限制。   不過此次國會的修法仍引起支持與反對胚胎幹細胞研究人士的激烈爭論,支持一方表示現行截止日期的規定強烈影響德國幹細胞的研究,德國研究基金會(German Research Foundation)即強調目前全球有超過500個細胞株,但德國研究人員卻只被允許使用21個老舊且部分遭到污染的細胞株。另一方面,在德國主教的集會上,佛萊堡(Freiburg)大主教鄒立區(Robert Zollitsch)則對放寬現行限制提出警告,他表示「研究的自由不該與對生命的基本保障等量齊觀」。   修法後,德國研究人員將可透過國際合作進口使用2007年5月1日以前所製造的胚胎幹細胞。這是正反雙方妥協下的結果,但是德國對於限制胚胎幹細胞研究的基本立場是否會由此開始鬆動,則仍待後續觀察。

歐盟法院裁定連結未授權影音串流網站之多媒體播放器違反著作權指令

  歐盟法院裁定連結未授權影音串流網站之多媒體播放器違反著作權指令 歐盟法院於2017年4月26日就Stichting Brein v Wullems案作出裁定,依據2001年的「歐洲議會與執委會關於資訊社會中著作權及著作鄰接權調和指令(Directive No. 2001/29/EC of the European Parliament and of the Council of 22 May 2001 on the harmonisation of certain aspects of copyright and related rights in the information society)」,認定販售多媒體播放器,其上安裝附加軟體使用戶可透過建立好的選單,連結到含有未獲著作權人同意影音授權的第三方串流網站之行為,符合著作權指令中「對公眾傳輸(communication to the public)」的定義。歐盟著作權指令第3條第1項並規定,會員國應提供著作權人授權或禁止任何對「公眾傳輸」其作品的權利,包含使用有線或無線的途徑使公眾可以任意地在任何時間地點接觸這些著作。   歐盟法院指出「公眾傳輸」的概念應包含兩個部分:「傳輸行為」以及「公眾。「傳輸行為」包含了各種形式的傳輸或再次傳輸,不管是透過有線或是無線;並且只要是讓公眾可得接觸作品的行為,即構成「傳輸行為」。至於「公眾」的意義為不特定的多數人,並應考慮潛在接觸用戶的可能性,且不僅是從單一時點接觸用戶多寡評斷,而是應觀察連續性累積的情況。    歐盟法院認定此販售多媒體撥放器之行為,考量該行為對於該著作一般利用的影響,對著作人合法權益產生不合理的侵害因而不符合該指令的重製權例外,故對著作權產生侵害。

歐盟推出給在中華區企業參考之網路犯罪與營業秘密保護指南

  歐盟執委會(European Commission)設有6區域中小企業智慧財產服務台(IP SME Helpdesk),其中歐洲智慧財產服務台(European IP Helpdesk)以及中華區小企業智慧財產服務台(China IP SME Helpdesk)於2022年9月聯合推出「網路犯罪與營業秘密保護指南」(Cybercrimes and trade secret protection : guide,下稱本指南),最大特色之處即在企業如何回應營業秘密遭網路竊取時之事後應對手段。   中華區中小企業智慧財產服務台透過提供免費資訊服務,支援歐盟(EU)中小企業(SME)在中國大陸、香港、澳門和臺灣保護和執行其智慧財產權(IPR),陸續發布如2020年「保護你在中華區的營業秘密」(Protecting your trade secrets in China)等一系列指導企業如何於中華區保護智財之指南。   本指南首先揭示企業營業秘密之事前保護手段,包括(1)技術手段:加強網路安全(加密資料、安裝防毒軟體、辨識雲端風險、制定網路安全策略)以及利用區塊鏈技術作為資料、證據保存的手段;(2)內外部人員管制手段:內部員工培訓與管理、第三方(市場、競爭對手)監控。而營業秘密遭竊之事後應對手段,包括(1)回應手段:確認資訊外洩原因、建立緊急處理機制(回報、蒐證流程)、採取法律步驟;(2)回復手段:控制損害(端視營業秘密是否被公開而有不同做法)、亡羊補牢(重新檢視企業智財布局、資安措施、緊急處理計畫),對於在中華區之企業,本指南作法具參考價值之外,資策會科法所發布之營業秘密管理指針2.0版亦可同步參考。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

Facebook 捲入商標糾紛

  Facebook公司因使用「timeline」一詞,而被設立於芝加哥的Timelines公司提商標侵權訴訟乙案,目前Facebook公司正積極準備進一步之辯護。   Timelines公司係於2011年9月控告Facebook侵害其所有之「timeline」商標權,且違反公平競爭法。Facebook則反訴Timelines公司,主張「timeline」為一般通用名稱,應不受商標法保護,故請求確認該商標無效且無侵權事實。   美國地方法院先前裁定Facebook無法提出證據以證明Timelines公司之商標為一般通用名稱。而原定2013年4月22日在芝加哥聯邦法院開庭之上訴程序,目前已延期,但法院並未明確說明延期原因。   Facebook公司主張「timeline」是一種可使人群組織並展現對其最有意義的事件與活動之工具,其功用係將記憶呈現為依時序整理,且可查詢之個人記述。Timelines公司則為一個,可讓使用者記錄並分享歷史經歷的網站。   Facebook在線上廣告市場上仍有巨幅成長的機會,因其具有廣泛的使用者基礎,且有跨時追蹤個人細節之能力,故在線上廣告市場中成為一股令人望之生畏的強大力量。   據報導,若將來判決對Timelines公司有利,則其打算請求總金額相當於Facebook因「timeline所取得之廣告收入」之損害賠償。由於至最終之審理結果出爐據信仍需要很長時間,故在現況下不排除庭外和解的可能性。

TOP