合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/02/25)
引註此篇文章
你可能還會想看
音樂出版業者控告LimeWire侵害著作權

  國家音樂出版組織(National Music Publishers’ Association,簡稱NMPA)中8家音樂出版業者在2010年6月16日對LimeWire提起著作權侵權訴訟。8家出版業者包含EMI Music Publishing, Sony/ATV Music Publishing, Universal Music Publishing Group(環球), Warner/Chappell Music, Inc.(華納), Bug Music, MPL Music Publishing, Peermusic and The Richmond Organization.等唱片公司,被告LimeWire是知名的檔案共享線上服務網站。原告指出被告大量的侵害原告的音樂著作,因此要求賠償。     NMPA表示本案和上個月13家音樂公司和美國唱片業協會(Recording Industry Association of American,簡稱RIAA)對LimeWire的著作權訴訟是相關聯的案件。美國地方法院法官於上個月就RIAA和LimeWire一案作出判決,法官認定LimeWire公司及負責人侵害著作權,且構成不公平競爭。13家公司要求凍結LimeWire的資產並且要負擔近十億美金賠償,RIAA要求LimeWire立即關掉網站,但法官於6/8說明LimeWire至少可持續營業兩週。     NMPA的負責人及執行長Israelite表示,LimeWire提供的網路平台有助於網路著作權侵害的產生。每首音樂產出的背後都有一群龐大的網路,包含出版者、作曲家、表演者、錄音者,唱片公司,並非無中生有的,LimeWire檔案分享網站利用提供販賣音樂平台,使他人可以接觸音樂,但拒絕支付合理的音樂授權金。     LimeWire釋出善意歡迎NMPA進行協商談判,並表示將有許多與出版業者、作曲家、表演者、唱片公司的會談,就如同LimeWire新的音樂服務機制與商

綠色經濟草案(Green New Deal Resolution)簡介

一、立法背景   由於美國國家海洋暨大氣總署(National Oceanic and Atmospheric Administration,縮寫NOAA)於2018年間發布關於氣候變遷將導致經濟發展受到影響之相關報告,同時間,美國最高法院拒絕駁回2015年由21位民眾及美國Our Children’s Trust(非政府組織)對聯邦政府所提起之訴訟,主張美國政府並未循正當法律程序,即鼓勵對環境保護傷害甚鉅之石化能源開發。因此聯合國人權暨環境特別報告(UN Special Rapporteur on human rights and the environment)呼籲各國盡快針對環境變遷採取相關行動,美國國會議員Ed Markey及Alexandria Ocasio-Cortez遂基於上述情事於2019年2月7偕同提出綠色經濟草案(下稱本草案)。 二、草案簡介   所謂綠色經濟,是因應全球經濟危機、氣候變遷、石油資源枯竭而提出,其內容包括金融及租稅政策的重建以及再生能源的運用,初始概念於2007年由一位記者刊載於時代雜誌與紐約時報,後相關倡議人士遂依此成立非政府組織The Green New Deal Group,並於2008年廣泛發行相關刊物。 三、草案內容   本草案賦予政府五大義務:溫室氣體零排放、創造百萬高薪工作機會、投資基礎設施及工業、永續環境(諸如確保空氣、水質、氣候、食品之安全、韌性社區之推動)、反壓迫等,且內容上更將前開義務再行細分為14項目標計畫,並訂定10年執行期間。   上揭14項目標計畫的內容大致可分為五類,分別為:提升基礎設施以因應各種氣候變遷所造成之災害、將政府所需能源全數轉換為零碳排放、提升電力及能源效率、消除製造業與農業所造成之汙染與溫室氣體的排放,另外亦全面將大眾運輸設施改建為高速及零碳排放系統。   為達成前述14項目標,本草案一共訂定15項須政府配合之細項,方向上包括:給予社區、組織、機關、地方政府及各法人相關協助、提供適切之訓練課程及高等教育、針對新興科技之研究與開發進行投資、提高家庭所得及保障各級勞工組織工會之權利、提供全民高品質之健康照護。

中國大陸修定「網絡交易管理辦法」,課與第三方交易平台多項經營責任

  中國大陸國家工商行政管理總局為加強網路交易消費者保護,在2014年03月15日起實施「網絡交易管理辦法」,就企業經營者責任新設多項規定。特別是針對第三方交易平台業者,辦法要求其建立交易規則、消費資訊保存、不良訊息處理、消費糾紛調解管道等管理制度,以確保平台服務品質。同时要求平台業者建立審查制度,對申請進入平台從事經營活動之賣家,進行身分審查與建檔,透過以網管網,達成有效率的網路身分管理。   另外,為確保網路交易市場秩序、公平競爭,本辦法亦例示多項不公平競爭行為態樣,包括任意調整信用評價、傷害他人商譽等影響交易秩序之欺罔行為,皆受到明文禁止。甚至在商標侵權情況中,平台在接收到侵權通知時,必須積極採取必要措施,否則就因此損害擴大部分,將與侵權行為人共同承擔連帶責任。   考量在兩岸近期簽署之「海峽兩岸服務貿易協議」中,陸方已承諾對台開放「在線數據處理與交易處理業務」之電子商務網站經營,待將來協議完成相關程序生效後,台灣電子商務業者在進入大陸市場經營交易平台時,勢必受到本辦法規範,實應留意相關要求以避免觸法。

美國加州法院認定Broadcom控訴Netflix侵權之US 8365183專利不具適格性

  2022年4月美國加州法院於Broadcom控訴Netflix專利侵權一案中,就Broadcom的第US 8365183號美國專利(下稱183專利)做出無效的判決。   於2020年3月,Broadcom就Netflix對消費者提供的影音服務提起訴訟,認為Netflix影音內容傳輸方式使用到Broadcom的多件專利技術,此次的183專利,主要是用來在多個電腦/伺服器設備中進行處理工作的分配,依Broadcom的主張,該技術應用於影音機上盒這類產品時,可有效的提升影音媒體的效率。這類專利與演算法有關,對於專利本質是否為抽象概念,需要通過美國最高法院就Alice案對於抽象概念的兩階段測試法,先檢驗請求項是否指向抽象概念,再檢驗請求項是否因其中元件(包含電腦/軟體)的配置,改變其性質而成為適格的專利標的。   加州法院法官James Donato認為,就183專利所主張之請求項內容,主要是在於多個伺服器間進行工作分配,此種行為與辦公室裡進行工作分配並沒有不同,且日常生活中也充滿類似情況,如服務生依照顧客需求進行位置安排,就此Broadcom雖提出該專利方法可提高伺服器效率的論點,但法官認為該專利只是列出傳統電腦技術中會執行的步驟順序,未因該專利所揭露的方法促進電腦的功能,而不足以使抽象概念的性質轉化,因此就該專利做出無效的判決。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」

TOP