合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2025/12/09)
引註此篇文章
你可能還會想看
網路中立管轄權屬誰?FCC尋求法院支持

  美國聯邦上訴法院哥倫比亞巡迴分院(US Court of Appeals for the District of Columbia Circuit)於2010年1月12日,針對網路中立議題召開口頭辯論聽證會。該案上訴人為美國目前電視及網路服務市佔率最高的Comcast所提出,系爭案由為聯邦通信委員會(Federal Communication Commission, FCC)於2008年禁止網路服務提供者(Internet Services Provider, ISP)限制其用戶使用BitTorrent。   BitTorrent為一種常見的點對點傳輸程式,多用以線上檔案分享。該公司認為,FCC並沒有足夠的權力要求其不分用戶等級,全部提供毫無限制的服務;而FCC卻從保護消費者及網路應開放自由進入的角度辯述,從而使FCC是否有權力規範網路中立(Internet Neutrality)之議題邁入更激烈的討論。   所謂「網路中立」,意指網路服務提供者不得因傳送或下載資訊種類差異而提供不平等的流量服務。早在2005年,FCC即有一套管制網路服務提供者侵害網路中立的審查標準,但該標準並非為一體適用的法律位階,而FCC是否得依職權制定網路中立的規範,一直以來亦有所爭議,是故此次其與Comcast對簿公堂,FCC最終目的即是在尋求法院之見解,希冀獲得聯邦法院的支持而使其立法行動名正言順。   對此,聯邦最高法院原則上認同FCC以往對於「資訊服務」的見解,亦即,由於傳統電信服務往往與重大基礎建設相關,尤其是網路開放接取的相關規定,FCC應提高其管制密度;而屬低度管制的資訊服務(Lightly Regulated Information Service)則不應與電信服務有相同的對待;是故Comcast據認在網路中立尚未有明確權責規劃前,FCC實無權插手管控Comcast所提供之資訊服務。此外,該公司亦提出,類似BitTorrent的點對點傳輸應用程式往往用於大量檔案的交換,無限制地提供所有用戶使用,不但造成整體網路服務效能下降,由於傳輸的內容往往為影音檔案,亦間接侵害了Comcast本身的電視業務。   對此,雙方目前仍各執一詞,由於案件目前尚在上訴法院審理,FCC此次投石問路的策略是否成功還在未定之天,但可以確定的是,不論法院的見解為何,網路中立的爭議恐將持續發酵,並對後續網路服務提供之發展產生一定影響。

Google提供免費專利給新創公司

  Google於2015年7月24日發布專利創客專案(Patent Starter Program),提供參加專案的新創公司免費授權使用兩項專利。此計畫是奠基於License on Transfer (LOT) Network專利授權聯盟的運作,該聯盟是2014年由Google、Dropbox、SAP、Canon、Asana及NewEgg等六家公司共同成立,目的透過聯盟成員間專利交叉授權協議,以對抗專利流氓(patent troll)的濫訴行為。   專利創客專案計畫開放50家於2014年收入介於50萬至20億美元間的新創公司得免繳會費參與LOT聯盟兩年,並依據新創公司業務範圍,提供3至5項專利清單,新創公司可從中選出兩項予以免費使用。另外,這些新創公司有機會瀏覽GOOGLE非專屬授權資料庫,找尋所需專利並詢問GOOGLE出售意願。需要注意的是,在專案期間內,參與成員對於透過專案獲授權之專利,僅得為防禦使用,違反時Google有權終止並予以處罰。同時參與成員亦必須於專案期間遵守聯盟專利交叉授權協議之規範。   整體來說,由於Google提供給新創公司的免費專利清單項目有限,新創公司未必能得到真正有需求的專利,但考量加入專案後,得受到LOT成員間專利交叉授權協議的保護,對於新創公司而言,仍可一定程度避免受到專利流氓危害,而具有正面意義。

韓國2012年度國家智財施行計畫檢討評估結果出爐

韓國2012年度國家智財施行計畫檢討評估結果出爐 科技法律研究所 2014年03月26日 壹、事件背景   韓國國家智慧財產委員會(以下簡稱智財委員會)於2013年11月13日公布「2012年度國家智財施行計畫之檢討評估結果」。韓國智財委員會係依智慧財產基本法第10條,檢討、評估施行計畫之推動情形。檢討評估對象係針對2012年度國家智財施行計畫(以下簡稱施行計畫)之5大政策面向:創造、保護、運用、基礎環境、新智慧財產,挑選出重點推動共21個課題。另為確保評估之專業性及客觀性,由民間專家組成「政策評估團」,並召開會議就不同的推動課題討論,然後以等級決定優劣。   針對21個課題進行檢討評估之結果顯示,被評為優秀等級之課題有4個,分別為「透過改善研究發展體系,創造高品質智慧財產」、「加強智慧財產侵權物品國境管制措施」、「塑造尊重智慧財產文化」、「建構、運用新植物品種育種之基礎環境」;而需要改善之課題則有3個,即「支援海外當地侵權之因應」、「強化地方中小企業之智財能力」、「發掘及確保海洋生物資源與智財創造之支援」。以下就評估方法及結果扼要說明之。 貳、評估方法及結果概述   韓國考量到智財施行計畫之特殊性,且加上是首次推動、評估國家層級智財政策之成效,所以不僅是評估政策成果,同時也要對政策形成、執行等政策基礎環境之確保等相關要素進行評估,對此,韓國設定3項評估指標:「政策形成」、「政策執行」、「政策成果」,詳細指標內容如下表所示: 區分 評估項目 評估基準 政策形成(30%) 1.計畫確立之適切性(15%) 1-1.事前分析、意見蒐集之充實性(5%) 1-2.成果指標及目標值之適當性(10%) 2.政策基礎環境之確保水準(15%) 2-1.推動體系之充實性(5%) 2-2.資源分配之適當性(10%) 政策執行(35%) 3.推動過程之效率性(25%) 3-1.推動日程之充實性(10%) 3-2.相關機關與政策連結性(10%) 3-3.監督及情況變化之對應性(5%) 4.政策擴散之努力水準(10%) 4-1.政策溝通、宣傳、教育之充實性(10%) 政策成果(35%) 5.政策成果及效果(35%) 5-1.成果目標達成度(20%) 5-2.政策效果(15%) 資料來源:韓國國家智財委員會 表1智財施行計畫之政策評估指標   為確保評估之專業性及客觀性,由韓國智財委員會之民間委員、及下設之創造、保護、運用、基礎環境、新智慧財產等專門委員會之專門委員,以及地方自治團體代表等30位成員組成政策評估團。每位評估委員就各機關提出之實績報告書內容為判斷依據,再依照不同指標之特性,進行定量和定性評估。政策評估團第1次評估完畢後,就會召開調整會議,決定各推動課題之評估等級(分成優秀、普通、需要改善3個等級)為何。   整體而言,韓國的智慧財產創造能力已提高不少,且韓國國內對智財保護水準亦逐漸提升,另外,對於智慧財產創造、保護、運用之正向循環體系所需之配套措施如新智慧財產相關法制,初步已整備完成。韓國之後擬要持續提高智財成果之品質,加強韓國在海外的智財保護,並且增進民間對智財運用政策之有感度,以及推動與新智財相關之各部會間對智財業務範圍調整與政策方面之合作推動。

替代能源有著落了?!

  國際油價持續飆漲,如何找到替代能源,已成為生技發展的一項重要課題,財團法人生物技術開發中心過去兩年密集和美國德拉瓦州的 Fraunhofer 分子生物科技中心( Fraunhofer USA Ins.- Center for MolecularBiotechnology )技術合作,以微生物發展工業酵素,可取代乙二醇( EG )做為塑膠材料,這項合作已吸引台塑及中油的高度興趣。   生技中心自去年起與美國 Fraunhofer 衍生公司 Athenabio 合作,投入二十萬美元發展工業酵素,以微生物來取代化工製程,開發出一三丙二醇。這項化工原料在西方已被視為取代乙二醇,扮演「生化煉油廠」的典型產品,結合對苯二甲酸( TPA )後,可做為保特瓶等塑膠容器。   除了工業酵素外,生技中心也與美國 Fraunhofer 分支機構分子生物科技中心簽署合作協議,計劃未來兩年內,以植物根部來生產流感疫苗,而以植物來生產流感疫苗的技術,其收成期僅需二至三周,每公斤的植物根部可生產的疫苗約○.二至○.五毫升,同時可省下四億美元投資額的生物發酵槽。此項利用植物扮演製藥廠的構想,該中心算是這項領域的技術領先者,以相同的技術所生產之炭疽疫苗,已獲美國食品藥物管理局( FDA )核准進入臨床( IND ),將進行一期臨床試驗。

TOP