合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/20)
引註此篇文章
你可能還會想看
荷蘭公司控《中國好聲音》商標侵權,索賠300萬

  北京法院於2016年3月17日開始審理關於「夢想強音文化傳播有限公司」和「北京正議天下文化傳媒公司」未經授權使用荷蘭Talpa公司商標一案。   Talpa公司主要業務為開發、製作電視節目模式,〈The Voice of〉是該公司開發的一款歌唱比賽真人秀電視節目模式,為該公司知名產品。Talpa已向中國、澳州、美國、歐盟等在內約70個國家,註冊了「The Voice of 」商標,商標圖示為一隻手拿麥克風之圖像。   《中國好聲音》製作單位於2012年向荷蘭Talpa 買下節目模式與商標圖示,用以製作音樂真人秀《中國好聲音》;今年Talpa並未與其續約,故《中國好聲音》製作單位未取得Talpa公司商標專用權。   惟負責《中國好聲音》第五季海選活動之夢想強音文化傳播公司和北京正議天下文化傳媒公司,在好聲音全國海選活動與宣傳中,大量使用與Talpa註冊商標幾乎相同的圖形及文字;Talpa公司認為,此為類似商品上使用與註冊商標相同或近似商標行為,已造成消費者混淆,依中國大陸人民共和國商標法第57條,構成侵害商標專用權。據此,Talpa公司要求上開兩間公司立即停止商標侵權行為,並要求登報道歉與連帶賠償律師費、公證費、翻譯費及各項損失300萬元。 本文同步刊登於TIPS網站(http://www.tips.org.tw)

WIPO公布《2018年世界智慧財產權指標報告》 中國大陸驅使全球申請量再創新高

  世界智慧財產權組織(World Intellectual Property Organization;後稱WIPO)針對2017年智財活動相關數據於12月3日公布《2018年世界智慧財產權指標報告》,內容分為:(1)專利、(2)商標、(3)工業設計、(4)植物品種、(5)地理標誌、及(6)創意經濟(出版)等六大項目。   其中「創意經濟」為首度納入之項目。WIPO與「國際出版人協會(International Publishers Association, IPA)」共同調查28個國家的出版活動,本次僅完成基本統計且初步納入「貿易」、「教育」、「科技與醫療(scientific, technical and medical, STM)」三個出版議題。法國在「貿易」方面的出版營收佔69%、英國50%;「教育」佔葉門總出版營收68.2%、巴西62%;「科技與醫療」佔比利時46.1%、巴西37.9%。   2017年專利全球申請量達317萬件(相較於2016年成長5.8%)、商標申請量達1,239萬件(成長26.8%)、工業設計申請量超過124萬件(與前一年持平)。以中國大陸為首,專利申請量佔全球43.6%、商標申請量佔46.3%、工業設計申請量佔50.6%。   2017年植物品種申請量計有18,490件、成長率為11.7%,此為15年來最大增長,而以中國大陸、英國、歐盟、越南及烏克蘭為主要成長國家。其中中國大陸接獲4,465件植物品種申請、其次歐盟為3,422件,這也是23年來第一次歐盟未列為首位。   地理標誌之問卷在2016年重新調修,2017年首度完整納入54個地區的數據,計有59,500個受保護的地理標誌。其中,德國有14,073個、奧地利8,749個、中國大陸8,507個。若以類別區分,「酒類」佔57.1%,其次為「農產食品」28.2%、「手工藝品」約2.7%。   本次報告之特別議題為「藉由統計數據掌握專利訴訟活動」,另針對美國與英國之統計數據進行探討。美國在1999至2009年間之專利訴訟案件和緩上升,並在2009至2013年間顯著增加;而英國在2010至2012年間也呈現相同趨勢,原因在於此時正值「全球專利戰」時期。進一步分析訴訟數據,可以發現專利訴訟案量往往與專利申請量、專利實施具正相關性,例如2013年後美國專利申請量及專利實施量呈下降趨勢,同期美國地方法院之專利訴訟案量亦隨之減少。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

冰島政府贏得與英國連鎖超市Iceland Foods的商標戰

  歐盟智慧財產局(EUIPO , European Union Intellectual Property Office)裁定英國連鎖超市Iceland Foods(以下簡稱Iceland Foods),不得以「 Iceland」在歐盟申請註冊商標。   Iceland Foods成立於1970年,是英國的知名品牌,擁有超過800家的分店共有2.3萬名員工,主要販售海鮮等冷凍食品。這件商標爭議起源於2014年,Iceland Foods成功以「 Iceland」一詞在歐盟註冊商標,但冰島企業的冷凍魚類等產品,也有銷售到歐盟,冰島政府因而指控此結果,將造成冰島的企業,無法以「Iceland」標示其產品的來源國。此外,冰島政府也指出,「Iceland」已經被廣泛認知為地理名稱,本來就不經該允許其被註冊為商標。如今,歐盟智慧財產局支持冰島政府的主張,使英國連鎖超市的註冊商標「Iceland」完全無效。並進一步表示,歐盟國家的消費者了解冰島是歐洲的一國,也知道冰島不但與歐盟國家地理位置相接近,且與歐盟國家存在歷史與經濟方面的聯結。   冰島的外交部長表示樂見此結果,但並不感到意外,並表示此裁定對冰島的出口商,是一個重要且勝利的里程碑。冰島以純淨與永續聞名,因此產品的原產地標示「Iceland」具有價值。Iceland Foods則聲明表示,對此結果感到遺憾,並打算提起上訴。

愛爾蘭ISP業者被控侵犯著作權

  愛爾蘭最大的ISP業者Ericom因其使用者利用Ericom提供之網路服務傳輸音樂檔案,而遭EMI、Sony BMG、Universal及Warner提起訴訟,控告其涉嫌侵害著作權,要求Ericom應過濾其內容可能涉及侵害著作權之檔案。對此,Ericom向愛爾蘭高等法院表示,Ericom在法律上並無義務監督在其網路上所承載的檔案內容。   愛爾蘭數位權利壓力團體「愛爾蘭數位權利」(Digital Rights Ireland,簡稱DRI)聲稱,上述音樂出版業者對於Ericom的指控及要求於法無據,因為ISP業者不過是資料來源的媒介,並無法律義務對於網路上使用者的行為負責;歐盟也無法律特別要求業者應監督其所提供網路服務傳遞的資訊內容。DRI亦表示,若立法要求業者應監督傳輸之檔案,除將侵犯網路使用者的隱私權外,更意味著要求使用者付費讓業者監督其使用網路之行為,但目前過濾篩選技術仍不夠完善,反而會影響合法使用網路服務之用戶。   雖然如此,ISP業者仍面臨了越來越多的國際壓力,要求應即時阻攔使用者非法分享之檔案。如2008年夏季,法國將提出一套測試系統以協助ISP業者封鎖涉及侵權之資訊;比利時法院於2007年判決要求某個ISP業者應過濾其傳輸之資訊;日本ISP業者之代表組織亦強調,若發現使用者使用軟體違法分享音樂及遊戲檔案,將即時切斷網路服務,以防止使用者透過網路分享檔案侵害著作權。對於違法分享檔案之行為,若英國網路服務業者與音樂工業之意見仍未能達成一致,英國政府將立法要求,ISP業者應對違法分享檔案之使用者發出警告,而使用者仍堅持從事該違法行為,則其所使用之網路服務將會中斷。   目前,對於使用者利用ISP業者所提供之服務從事侵害著作權之行為,該業者是否應為使用者之違法行為負責已成為各國專家廣泛討論之議題,未來有關該議題之立法仍有待持續關注。

TOP