合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/19)
引註此篇文章
你可能還會想看
大倫敦政府提倡倫敦城市資料市集

大倫敦政府(Greater London Authority, GLA)在今(2016)年3月公布「城市資料策略」(City Data Strategy),以發展「城市資料市集」為核心的「數位倫敦」(Data for London) 計畫,希望與合作夥伴共同推展「城市資料市集」,以節省資金、培育創新、推動經濟成長,並迎接可能之挑戰。 「數位倫敦」將城市資料分為開放資料(Open Data)、民間企業資料(Private Data)、商業資料(Commercial Data)、感知資料(Sensory Data),及公眾來源資料(crowded-sourced data)等5個類型。此外,蒐集之資料類型及如何使用該等資料,亦為計畫的執行重點之一。 「數位倫敦」之實施計畫(Implementation Plan)分短、中、長期,以近期發布之短、中期的路徑圖而言,大倫敦政府計劃在2年內分 5個階段,從編制資料目錄,建立資料庫聯盟,利用雲端系統建置一能預測並開發、利用新資料來源之資料庫,並以「引用資料,而不複製資料」之原則,持續與公開來源社群及夥伴合作。 「城市資料市集」作為發展大倫敦基礎設施建設之一環,從資料蒐集、過濾檢測、資料庫平台管理、整合平台及服務,進而建立新商業模式,期將倫敦打造成世界首屈一指的智慧城市。

音樂著作授權費 演出拉鋸戰

  根據著作權法第 82 條規定,著作權仲介團體與利用人間,對使用報酬爭議之調解,由著作權專責機關設置著作權審議及調解委員會辦理。新近社團法人中華音樂著作權仲介協會( MUST )提出網路電視、電影、網路廣播、網路上提供音樂欣賞、入口網站、網路音樂下載等行業業者公開傳輸費率,業者如有串流、下載、同步傳輸行為,應繳納高額之授權費用,遭到 業者抗議,此舉將遏殺數位業者萌芽的機會。   事實上在 94 年時,智慧局的費率審議委員會即曾駁回 MUST 提出的網路電視、電影等公開傳輸費率,但因網路電視、網路影片,所運用的素材不只是音樂,還包括小說、攝影、圖片,如果每一著作人都主張要收費,利用人的負擔將太重,所以智慧局當時並未通過其新費率。   不過,新近 MUST 又重新提出一個新的費率,網路電視、電影( MOD )如以串流方式公開傳輸,授權費用是業者前一年營業收入的 6% ;如果下載到硬碟、光碟片等,不是重製權,只是收下載「過路費」,授權使用費提高到前一年度營收的 10% ;如果是網路電視、電影同步傳輸,則以前一年度營收 2% 收取費用。即使是公益、非營利性的網路電視、電影,也要以全年度節目製播預算的 0.3% 計算音樂著作使用報酬。   由於此一費率與新興網路業者生存關係重大,經濟部智財局於 4 月中旬舉行「 MUST 新增、調高公開傳輸、公開演出使用報酬率意見交流會」,會中最後同意,由同行業的利用人團體一起組成談判小組,再與 MUST 進一步協商,具體討論出雙方能接受的方案。

美國FTC修正廣告使用推薦與見證指南

  美國聯邦交易委員會(Federal Trade Commission,FTC)於2009年10月5日公佈了新修正的「廣告使用推薦與見證指南(Guides Concerning the Use of Endorsements and Testimonials in Advertising)」,這是該指南自1980年制定以來第一次的更新,並於今年12月1日起生效。此次修訂特別針對商品服務使用心得做出規範,規範亦適用於社交媒體(如Facebook、Twitter及各種類型的部落格等具互動性的媒體)中之心得分享,未來在社交媒體對商品或服務所做出的各種評論,都有可能成為FTC管制的對象。     在社交媒體中所傳遞之商品心得訊息,特別是名人(在該領域分享心得出名者)所分享之訊息,對於網路使用者或消費者之影響力甚大,甚至會改變其是否選擇消費該商品或服務之意願,但其真實性卻未必有相當之保障。有鑑於此,FTC於新修正之指南中即對於心得分享之訊息作出相應規範,重點如下: 1.心得分享者若由商品或服務提供者處受有金錢或相當程度的利益給付,即非單純之心得分享,而有與廣告相同之性質。因此若有虛偽不實陳述的狀況,亦視為是不實廣告。 2.心得分享者必須揭露其與商品或服務提供者的利益關係,使其他消費者明瞭。 3.廣告中若有引用研究結果,而該研究機構為該公司所贊助時,廣告中必須揭露兩者的利益關係。 4.指南同時適用於談話性節目以及社交媒體上所為之心得分享。 而違反上述規定者,可能會依美國聯邦交易委員會法第5條(FTC Act Sec.5)之相關規定每次最高得處以1萬1千美元罰鍰。     此規定之公布引起了部落客(部落格使用者)之質疑,因此FTC廣告實務科(The Division of advertising Practices)之副科長Richard Cleland特別對此做出澄清,其指出:「FTC不會立刻處以罰鍰,也並非所有個案均嚴重至須處以罰鍰。較有可能的作法是,先以警告函警告違規的部落客。且FTC無權對違反FTC法案的行為直接處以罰鍰,若事態嚴重,則FTC會將案件移送地方法院,由法院做出各種處斷,最重可至罰鍰。」     此一指南的約束,固然提供了消費者分辨廣告與心得分享的方式,但是關於更細部的操作,例如何時可認為部落客與商品及服務業者有利益關係,仍有待實務的累積。

特別301報告

  特別301報告(The Special 301 Report)是由美國貿易代表署(Office of the United States Trade Representative, USTR)公布之關於世界各國智慧財產權年度報告。1988年,美國國會修法增訂「特別301條款」,要求美國貿易代表署針對智慧產權保護或市場開放程度不足之國家,按嚴重程度於特別301報告中分列為「優先指定國家」(Priority Foreign Country)、「優先觀察名單」(Priority Watch List)和「一般觀察名單」(Watch List),並對「優先指定國家」啟動調查及協商談判。   美國每年對世界各國是否有效保護智慧財產權進行審查,並提出特別301報告。報告羅列範圍廣泛,包含: 世界各國智財權保護以及執法有效性; 網路銷售各種盜版及仿冒商標之商品情形; 世界各國貿易壁壘(market access barriers),例如貿易市場不透明、歧視性、或其他限制貿易的措施等,是否妨礙取得醫療保健(healthcare)或其他受智財權保護的資訊。   2019特別 301 報告(2019 Special 301 Report)於2019年4月公布。其中加拿大因簽署了《美墨加協定》(United States-Mexico-Canada Agreement, USMCA),實質改善加拿大智慧財產權環境,因而加拿大已從優先觀察名單轉為一般觀察名單。此外,中國連續15年被列入優先觀察名單,報告認為中國迫切需要進行基本的結構性改革,加強智財權保護。我國自1998年起被列入一般觀察名單,直至2009年除名,至今均未上榜,亦表美國肯認我國的智財保護發展。

TOP