合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/18)
引註此篇文章
你可能還會想看
綠色商標之挑戰—歐盟智慧財產權局發布綠色歐盟商標報告

2023年7月歐洲創新理事會和中小企業執行機構(European Innovation Council and SMEs Executive Agency , EISMEA)撰文重申綠色商標的重要性與挑戰。隨著環境議題於國際上的重要性日益增加,綠色商標(Green trademarks)成為一個新興議題。許多敏銳的品牌於意識到多數消費者在消費選擇上更注重環保要素時,即開始開發環保相關商品或服務,並透過「綠色」相關之文字、圖像(Images)或標語(Slogans)等進行「綠色商標」布局,向消費者傳達品牌在環保、永續的投入,例如:商品為有機、對地球有益的,或可促進回收利用的等資訊。根據歐盟智慧財產權局(EUIPO)於2023年2月發布最新版之綠色歐盟商標報告(Green EU trade marks–2022 update)的統計資料顯示,綠色商標占總體商標申請的比例穩定上升中,從1996年的4%提升到2021年的12%,可以看出品牌對於綠色商標愈來愈重視。 該報告將綠色產品的商標分別九大類別。其中,能源生產和節能,合計占綠色商標申請的48%以上,污染控制占18%,交通占11%。品牌企業應確保於正確商品或服務類別進行綠色商標布局。除商品或服務註冊類別外,企業於商標註冊前之綠色品牌命名階段,應避免品牌名稱不具商標法要求的識別性,導致被智慧財產局駁回或撤銷商標註冊之風險,例如:以誤導性或純粹描述性(misleading or purely descriptive)的方式使用「生態(Eco)」或「綠色(Green)」等用語(terms)。建議綠色品牌命名應確保避免單純放入該些描述環保特性的用語,而必須考量商標法要求的識別性,能夠使相關消費者能識別綠色商品或服務來源,並得與他人的商品或服務相區別。 綜上所述,隨著近年企業推出綠色品牌、商品或服務,採用環保相關文字或標語作為綠色品牌名稱的情況逐漸增加,這也為商標申請人帶來挑戰。環保意識提升的消費者,對於這些環保相關用語的理解變得更加成熟,品牌商標更容易被認定為單純描述性的用詞(可能符合中華民國商標法第29條第一項不得註冊事由),商標申請人對於品牌商標獨特性的證明上將更加困難。因此,建議品牌擁有者應在商標註冊前之品牌命名階段,更發揮創意、注重商標法「具識別性」之註冊要件,避免品牌命名僅單純向消費者描述環保特色資訊,導致無法取得註冊商標,難以彰顯綠色品牌特色之後果。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

美國商務部、財政部以及司法部發布遵循美國出口管制與制裁規範聯合指引

美國商務部(Department of Commerce)、財政部(Department of Treasury)以及司法部(Department of Justice)於2024年3月6日發布出口管制與制裁法令遵循指引,以避免邪惡政權(malign regimes)與其他不法人士試圖濫用商業與金融管道,取得有危害美國國家安全與外交政策利益、全球和平與繁榮風險的貨品、技術以及服務,特別提供「非美國公司」(non-U.S. companies),降低相關風險的遵循指引。 該指引分享3則違反制裁法規的案例,重點如下: (1)某家總部位於澳洲的國際貨運代理和物流公司,運送貨品至北韓、伊朗以及敘利亞(皆為被制裁之目的地),且透過美國金融系統發起或收受交易款項,導致美國金融機構與被制裁之對象交易,並向受制裁的司法管轄區輸出金融服務。該公司最終繳納6,131,855美元罰款。 (2)某阿聯酋公司與杜拜以及伊朗公司共謀,透過在出口文件中將一家杜拜公司錯誤地列為最終使用人,然後從一家美國公司出口「儲槽清洗裝置」(storage tank cleaning units)到伊朗,構成違反出口管制規定行為。後與主管機關達成行政和解,繳納415,695美元罰款。 (3)某家總部位於瑞典的國際金融機構的子公司,因其客戶從被制裁的司法管轄區的IP位址,使用子公司的網路銀行平台,透過美國代理銀行向位於被制裁司法管轄區的交易對象付款,因此繳納3,430,900美元罰款。

美國專利商標局結束專利申請審查後試行程序

  美國專利商標局(United States Patent and Trademark Office, USPTO)於2017年1月12日宣布其不再依其審查後試行程序(Post-Prosecution Pilot Program, P3 Program)受理新的案件。該程序係用以使發明人在專利申請程序受到駁回以後得提出更多回饋意見,以期減少上訴至專利審判暨上訴委員會(Patent Trial and Appeal Board, PTAB)之數量。   該程序係在2016年7月11日公布施行,在該程序中,申請人在最終駁回做成後兩個月內得請求召開聽證;申請人得對審查員進行20分鐘內之口頭簡報。簡報進行完畢以後,申請人即被排除於會議之外,審查委員之裁決將會以書面之形式通知申請人。   在P3程序創設以前,專利申請被駁回的發明人得採取上訴前先期審查會議試行計畫(Pre-Appeal Brief Conference Pilot Program)或是最終審議後試行程序2.0(After Final Consideration Pilot 2.0, AFCP2.0)的方式提出明顯錯誤的爭執或是申請內容的修改,但這兩種申訴方式並無法讓申請人取得直接向專利審查員進行簡報的機會。   在2016年7月11日公布本項試行程序時,USPTO即宣布本項計畫試行時間直到2017年1月12日,或是USPTO受理1600位合格申請為止,在本計畫按照預定時程結束後,USPTO表示將會依公眾回饋意見以及試行程序的結果來決定未來是否會施行類似於本計畫之措施。

歐洲專利局闡明CRISPR專利優先權認定的裁決理由

  歐洲專利局(European Patent Office,下簡稱EPO)於2020年11月發布了裁定撤銷歐洲專利EP2771468的書面理由。EP2771468是the Broad Institute of Massachusetts Institute of Technology(以下簡稱Broad Institute)持有的一項關於CRISPR(clustered, regularly interspaced, short palindromic repeats)技術的專利。2020年1月,EPO的上訴委員會(Board of Appeal,下簡稱BoA)裁定在該專利的優先權要求被駁回後,專利應予以撤銷。   CRISPR是相對簡單但功能強大的基因編輯工具,使科學家能夠更改DNA序列並修飾基因功能。它具有改變醫學、診斷、治療和預防多種疾病的潛力,已被用於開發診斷試劑盒,可用於檢測傳染病,例如Covid-19。該技術預估在未來五年的價值將超過50億美元。   一般而言,專利申請日是評估專利有效性的日期,但有的專利可能會要求已揭露該發明之較早專利申請的申請日作為優先權日。在本案裡,專利的優先權日期尤為重要,因為還有許多其他機構和研究人員聲稱在Broad Institute之前就已經發現CRISPR技術。   在2018年,EPO的異議庭(Opposition Division)認為EP2771468專利無權享有部分專利的優先權。因為其主張優先權的美國專利臨時案共有四名申請人,但在EPO提交專利時,有一位申請人未包含其中。因此,異議庭認為,該專利不能主張美國專利的優先權,導致EP2771468因為在申請日前有其他公開文獻而喪失新穎性。   Broad Institute提出上訴,但BoA駁回了上訴,並指出需要所有申請人在初始申請和後續申請中都列出才能享有優先權。   由於優先權制度是在申請專利保護時常會運用的布局手段,後續在運用優先權時,應特別注意申請人的一致性,避免因優先權無法主張而影響專利的有效性。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

TOP