合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/21)
引註此篇文章
你可能還會想看
美國倡建無人機系統整合先導計畫

  考量無人機系統與國家空域系統及有人駕駛飛機的有效協作,除能提升產業效能與生產力外,同時也強化國家公領域安全的管理。基此,美國總統川普遂發布總統備忘錄倡議建立無人機系統整合先導計畫,期能透過該計畫促進創新應用,並以公私協力的方式進行無人機系統與國家空域系統之整合。

Google與著名品牌的商標戰爭勝出希望濃厚

  網路搜尋引擎龍頭Google靠其所提供的關鍵字搜尋服務在廣告市場上已獲取一定之利潤,惟此種服務並沒有獲得全球各地品牌持有人的認同,因此而向Google提起訴訟者,亦所在多有;然而,針對關鍵字廣告的訴訟,Google在歐盟法院的判決中很有機會取得初步的勝利。   所謂關鍵字廣告,係指廣告主使用此項服務時,得以自行命名「引發曝光」的關鍵字(Keyword Triggers),該關鍵字可設定為品牌之名稱,亦即當一般民眾使用搜尋功能,輸入特定品牌名稱作為關鍵字時,搜尋結果就會出現當初命名該關鍵字的廣告主網站訊息,只是同樣的關鍵字也有可能為競爭對手甚或商品仿冒者所使用;換言之,民眾輸入特定品牌名稱並點擊「搜尋」之後,搜尋結果將有可能同時出現品牌持有人、競爭對手,或是仿冒者三種不同角色。從而包含Louis Vuitton在內的歐洲知名精品商,相繼以此理由向Google提起訴訟,強調該項服務使廣告主不需經商標權人允許即可使用其商標,Google係已侵害其商標權。   對此,歐盟法院顧問卻認為,廣告主選擇特定關鍵字之後並非直接產生商品販售或是服務提供的行為,亦即使用關鍵字搜尋本身並不會造成商標的侵害或淡化,真正使其權利受損者,乃係廣告主所提供令人混淆的廣告內容。故Google所提供的關鍵字廣告服務,雖未對品牌名稱設下限制,惟「自由選取品牌名稱為關鍵字」一事,並不會侵害品牌持有人之商標權;但需注意者是,經由關鍵字產生的廣告內容中,如果品牌持有人得以舉證該內容已侵害其商標時,Google仍可能負有侵害責任。   歐盟法院顧問之見解雖然並非具有實質的拘束力,但約莫八成的案件顯示,歐盟法院多數將會採納顧問的意見。上述案件將有可能在11月份做出正式判決,令人拭目以待。

精簡專利審查:加拿大專利法修正案即將生效

  因應加拿大-美國-墨西哥協定(Canada-United States-Mexico Agreement, CUSMA)中關於專利期間調整及精簡專利審查程序,加拿大政府對加拿大專利法進行重大修改,新法於2022年10月3日生效,其主要修正重點如下: 1.初步審查報告後之繼續審查要求 如專利申請人欲於3份審查意見報告做成後申請繼續審查(Request for Continues Examination),需支付816加幣之費用(小型企業之費用為408加幣)並可額外獲得最多2份審查意見,如專利仍未核准,申請人需另外再申請繼續審查。 2.超過20項專利請求項之超額費用 專利範圍中多於20項之專利請求項,每多1項專利請求項將被要求額外支付100加幣之超額費用(但小型企業僅需支付40加幣之超額費用),該費用將於以下2個情形產生: (1)當提出審查時,申請案中有超過20項之專利請求項; (2)當支付授予專利的最終費用時,專利請求項在審查過程中超過20項。 3.附條件之專利核准通知 一旦專利申請已接近核准階段,僅剩下次要的手續問題時,加拿大專利局可核發附條件之核准,使申請人修正該問題並支付最終費用以獲取專利。   加拿大政府於2021年7月出版的法規影響聲明(Regulatory Impact Analysis Statement)闡述該法修正理由,並對加拿大專利局無法於合理時間內完成專利審查表示擔憂,於2020年至2021年,加拿大專利審查至授予專利平均時間為31個月,且於本修正案前,對於專利局在授予專利或放棄專利前之審查報告數量未有限制,且無論花費的資源多寡,所有專利之審查費均相同。   該法規影響聲明亦提到加拿大專利申請案包含平均多於其他國家的專利請求項,導致專利審查效率低下,並解釋政府不鼓勵專利申請案包含不必要、過多的專利請求項,確保更快地給予專利,並預計本修正案施行後將減少專利申請量並提高專利品質。   另有論者指出,此修正案可能導致專利申請成本提高,使申請人於加拿大申請專利之意願降低,並認為加拿大專利制度尚待解決的問題在於雙重專利制度(double patenting regime)及專利適格性(subject matter eligibility),本法施行後的實務發展值得持續關注。   「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

美國通過《音樂現代化法》(Music Modernization Act, MMA)

  美國於2018年10月11日正式簽署通過《音樂現代化法》(Orrin G. Hatch-Bob Goodlatte Music Modernization Act, MMA),該法搭起時代鴻溝的橋樑。《音樂現代化法》囊括三個從2017年分別通過的子法,並成為《音樂現代化法》中的三個大標題:   第一部份:音樂授權現代化(Music Licensing Modernization)   音樂作品本身的著作權、重製權是「大權利」(Grand Right),而公開傳輸權則是「小權利」(Small Right)。前者是恢復市場機制、自由議價,愈自由愈好;後者則是愈方便、愈能夠使音樂作品被世人看見愈好。《音樂現代化法》實踐了這個理想。《音樂現代化法》成立職司音樂著作授權的非營利組織「音樂機械灌錄集體授權組織」(The Mechanical Licensing Collective, MLC)。該組織是針對「數位音樂串流業者」量身打造,進行音樂數位使用(Digital Uses)的概括式授權(Blanket License)。再者,根據舊法,授權金是法定的,但《音樂現代化法》予以音樂創作人對其作品的授權金額保有協商權(Authority to Negotiate)。同時透過音樂資料庫的建立和免費線上檢索系統,方便音樂使用人查詢與媒合。   第二部份:經典音樂法(CLASSICS Act)   溯及賦予1923年1月1日至1972年2月14日之間的音樂,就未經授權而進行「數位錄音傳輸」(Digital Audio Transmissions)之行為,使之有從首次公開發行後95年的著作權保護。這裡授權的客體所會得到的權利相近於1972年後錄音著作「非互動式數位串流服務」所得到的保護。   第三部份:音樂製作人分潤(Allocation for Music Producers)   在科技世代,一個偉大的音樂創作,並非作曲人獨力完成的,《音樂現代化法》以分潤制度,讓音樂製作人、混音師及音訊工程師首次獲得法律上的權利。

TOP