合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw//article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/01/26)
引註此篇文章
你可能還會想看
法國CNIL認Google於Gmail中投放之偽裝廣告及個人化廣告因欠缺當事人有效同意而違法,開罰3.25億歐元

法國國家資訊與自由委員會(Commission Nationale de l’Informatique et des Libertés, CNIL)於2025年9月1日針對一起由歐洲數位權利中心(noyb - The European Center for Digital Rights)提出的申訴做成決議,指Google未經Gmail使用者同意,將廣告偽裝為電子郵件進行「偽裝廣告」(Disguised Ads)投放,以及在對Gmail使用者投放個人化廣告前,未能於Gmail帳號申請流程中提供當事人提供較少cookies、選擇非個人化之通用廣告(generic ads)的選項,違反了《電子通訊法》(code des postes et des communications électroniques)與《資訊與自由法》(loi Informatique et Libertés)中關於歐盟《電子隱私指令》(ePrivacy Directive)之施行規定,對Google裁處了3.25億歐元的罰鍰,並要求改善。以下節錄摘要該裁決之重點: 一、 偽裝成電子郵件的偽裝廣告與電子郵件廣告均須獲當事人同意始得投放 歐盟《電子隱私指令》第13條1項及法國《電子通訊法》規定,電子郵件直接推銷(direct marketing)僅在其目標是已事先給予同意的使用者時被允許。CNIL,依循歐盟法院(CJEU)判例法(C-102/20)見解,認為若廣告訊息被展示在收件匣中,且形式類似真實電子郵件,與真實電子郵件相同位置,則應被認為是電子郵件直接推銷,須得到當事人之事前同意。因此,CNIL認定偽裝廣告即便技術上不是狹義的電子郵件,僅僅因其在通常專門用於私人電子郵件的空間中展示,就足以認為這些廣告是透過使用者電子郵件收件匣傳遞的廣告,屬於電子郵件廣告,而與出現在郵件列表旁邊且獨立分開的廣告横幅不同,後者非屬電子郵件廣告。 二、 Cookie Wall下當事人的有效同意:「廣告類型」的選擇、服務申請流程的隱私設計與資訊透明 CNIL參酌歐盟個人資料保護委員會(European Data Protection Board, EDPB)第2024/08號關於「同意與付費模式」意見,認為同意接受廣告在特定條件下得作為使用Gmail服務的條件。換言之,以「cookie wall」(註:拒絕cookie的蒐集即無法獲得服務之網站設計)取得之當事人「同意」,非當然不自由或無效。CNIL認為,在免費服務的框架下,cookie wall在維持提供服務與服務成本之間的經濟平衡上,要求服務申請者須接受投放廣告的cookie是合法的。惟CNIL認為,這不代表Google可以任意決定所蒐集的cookies和相應廣告模式的類型。 CNIL要求,當事人在cookie wall的框架內仍應享有選擇自由,才能取得蒐集為投放個人化廣告之cookies的當事人有效同意,亦即:在個人化廣告處理更多個資和對當事人造成更多風險的情況下,當事人應被給予機會選擇「等值的替代選項」,亦即通用廣告,並完全且清晰地了解其選擇的價值、範圍及後果。 然而,CNIL發現,Google將與廣告個性化相關的cookies拒絕機制設計得比接受機制更複雜,實際上阻礙了使用者拒絕隱私干預程度更高的cookies。這種拒絕途徑偏袒了允許個人化廣告的cookies的同意,從而影響了當事人的選擇自由。CNIL也發現,Google從未以明確方式告知使用者建立Gmail帳戶時面臨cookie wall,以及對此使用者享有甚麼選擇,而其提供的資訊更引導使用者選擇個人化廣告,導致選擇一般廣告的機會遭到犧牲。 三、 為何不是愛爾蘭資料保護委員會(Data Protection Commission, DPC)管轄? GDPR設有「單一窗口機制」,依據該合作機制,對Google進行的GDPR調查,應由作為主任監管機關(Lead Supervisory Authority)的愛爾蘭DPC管轄。惟在本案,CNIL認為並不適用於單一窗口機制。因為與cookies使用及電子推銷相關的處理並非屬於GDPR範疇,而是適用電子隱私指令,CNIL對法國境內的cookies使用及電子推銷處理享有管轄權。此爭議反映出即便GDPR旨在確保標準化單一市場內的數位管制,但尚不足以弭平成員國間監管強度之差異。

智慧財產局修法賦予動植物專利權,但將不及繁殖物

  我國專利法修法後,將全面開放動植物專利,其中,最引起各界關注的問題是動植物專利權的效力。動植物專利的保護,有助於發展國內生技產業,但保護過度,又會影響農漁民生計,故智慧局在五月初發布之專利法部分條文修正草案中,增訂動、植物專利權利耗盡之範圍包括必然導致繁殖之專利生物材料本身及其所繁殖之生物材料,但不包括為繁殖之目的而使用該繁殖之生物材料之行為。   根據現行專利法第56條第1項規定,獲得動植物相關發明的物品專利權人,專有排除他人未經其同意而製造、為販賣的要約、販賣、使用或為上述目的而進口該物品之權。惟專利法第5條規定,專利物品本身經第一次販賣後,專利權效力及不於後續的實施行為。動植物的繁殖特性,如果一經販賣後,專利權效力即不及,則勢必影響動、植物發明人的權益。   基於上述理由,智慧局經參考歐盟生物技術發明指令第八條,於專利法部分條文修正草案中明訂動植物等生物材料之專利權耗盡範圍,另為了保護農民權益,此次專利法修正草案中亦特別明訂農民免責,使農民自專利權人或其授權人處取得受專利保護之植物繁殖材料,可將收穫後之種子在其農地上進行繁殖使用,而為專利權效力所不及。

談日本基因改造實驗管理規範及其執行現況

歐盟對其成員國、其他歐洲國家以及區域鄰國的創新績效進行比較分析並公布2017年歐洲創新計分板報告

  於2017年6月20日,歐盟對於歐盟成員國、其他歐洲國家以及區域鄰國的創新績效進行比較分析,並發布2017年度歐洲創新記分板(European Innovation Scoreboard, EIS)年度報告。它涵蓋歐盟成員國以及冰島、以色列、前南斯拉夫的馬其頓共和國、挪威、塞爾維亞、瑞士、土耳其和烏克蘭。在全球少數指標中,EIS也對澳大利亞、巴西、加拿大、中國、印度、日本、俄羅斯、南非、韓國及美國進行了評估。   EIS 2017排名與以前的版本不同,EIS 2017的測量框架由27個指標組成,區分4個主要類別的10個創新層面: 政策框架是創新績效的主要驅動力,涵蓋3個創新層面:人力資源、有吸引力的研究體系及創新環境。 投資包括公共及私人投資研究與創新,區分外部融資支持及內部資源投資。 創新活動吸取公司層面的創新工作,涵蓋3個方面:創新者、中間者及智慧財產權。 創新如何轉化為整體經濟效益之影響力:就業影響及銷售效應。   EIS顯示歐盟的創新績效繼續增長,特別是由於人力資源的改善、創新型環境、自有資源投資以及有吸引力的研究體系。而瑞典仍然是歐盟創新領導者,其次是丹麥、芬蘭、荷蘭、英國以及德國,創新指數比歐盟平均值高出百分之二十。立陶宛、馬爾他共和國、英國、荷蘭以及奧地利則是增長速度最快的創新者。在全球創新比較中,歐盟僅次於加拿大及美國,但韓國及日本正急起直追,而中國在國際競爭中是發展最快的國家。

TOP