合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=65&tp=5 (最後瀏覽日:2024/11/24)
引註此篇文章
你可能還會想看
科技人力需求缺口持續擴大,海外高科技人才延攬刻不容緩

  高科技人才缺口逐年擴大,據經濟部統計,三年總計僅有一九二二位海外人才來台,政府延攬海外人才績效不及新加波、韓國。新加坡為鼓勵企業延攬國際人才,企業招聘的支出可減稅,並提供人才高薪和住房,在新加坡工作的外籍人員還可參加星政府資助的國內外培訓等獎勵措施。韓國在二○○三年更擴大辦理延攬海外科技人才,除延長外籍人士居留時間、優先核准簽證,外籍技術人員薪資所得並可五年免稅,一年延攬之科技人才高達一萬多人。除此,大陸人才濟濟,新加坡與韓國也主動延攬,新加坡對大陸人才更提供「落地永久居民批准信」。   相較於星、韓的積極態度,我國政府對延攬海外人才趨向被動,我國高科技人才需求是由產業提出,政府配合提供誘因,我國以補助外籍人員的來回程機票、保險費,及薪給差額等為主。另礙於兩岸關係,國內並不開放引進大陸人士,大陸碩士以上人才來台每年僅兩位數,主要從事研究活動相關,而非長期工作。   針對目前國內科技人才需求緊迫,立委質疑國內科技人才缺乏,政府禁止大陸人才來台,卻不限制科技人才前往大陸,形成不平衡。經濟部表示,將彙整各界意見,再思索推動政策協助;陸委會則擬在六月底前提出積極管理科技人才前往大陸的辦法。

美國農業部公布施行現代化肉禽屠宰檢驗規定修正條文

  美國農業部(United States Department of Agriculture, USDA)於今年2014年8月就現代化肉禽屠宰檢驗規定(Modernization of Poultry Slaughter Inspection)再新增肉禽屠宰相關行政管制規範,稱為新肉禽檢驗系統(New Poultry Inspection System, NPIS),藉此改進現行的肉禽檢驗系統(poultry inspection system)。該規定係美國於1957年為補充艾森豪總統簽署之肉禽產品檢驗法(Poultry Products Inspection Act of 1957)所制定,為美國國內現行肉禽檢驗系統之法源依據,由隸屬於USDA的食品安全檢驗服務(Food Safety and Inspection Service, FSIS)負責執行該規定所要求之相關肉禽食品安全稽查。但近年來各國陸續發生重大食安問題,加以該規定自1957年後,已制定60年之久,實有許多應檢討修正之處。適逢美國總統發布執行命令13563號(E.O. no.13563)要求各行政機關檢視並改進相關規範,以減輕肉禽產品遭受微生物汙染之風險,並整合政府相關行政資源提升行政檢驗效能及適時移除現行法規造成產業創新的制度性障礙。而該規範之新肉禽檢驗系統(new poultry inspection system, NPIS)目前僅適用於幼小雞隻的肉品和火雞肉之生產,且不會全面汰換掉現行的各項檢驗系統,由廠商進行成本效益分析是否將該新檢驗系統導入生產體系。新規定簡要介紹包括要求於冷凍程序前後需進行含菌量檢驗,且廠商必須發展、建立、維護此一管理作業流程,以確保肉品未受到汙染;此外,亦增訂其他規定,如限制生產線上每分鐘不得屠宰超過140隻肉禽、移除冷藏溫度之相關標準,改採廠商必須藉由實驗和技術支援等,反覆檢驗以實質判定其冷藏管理程序中實際合理之冷藏溫度,FSIS更重新定義規範中關於冷藏之定義,以符合產業現況。新規定目前已公告於聯邦公報(Federal Register),將於六個月後正式生效。

授權合約不公 飛利浦挨罰600萬

  公平交易委員會於上( 4 )個月 20 日對巨擘等三家光碟廠商檢舉荷蘭商菲利浦電子公司專利授權合約不公一案做成決議,飛利浦的 CD-R 專利技術授權合約,要求被授權人提供「製造設備清冊」及「書面銷售報告」,已足以影響交易秩序、顯失公平行為,違反公平交易法第 24 條規定,處新台幣 600 萬元罰鍰。這是公平會對飛利浦的 CD-R 光碟專利授權行為,作成的第二件處分案,第一件為飛利浦、 日本 新力及日商太陽誘電被檢舉,在台的 CD-R 光碟片產品專利授權行為,違反聯合行為的規定,飛利浦被處新台幣 800 萬元罰鍰,該案目前仍在行政訴訟中。   公平會認為,飛利浦與新力公司共同制定 CD-R 光碟片技術規格書,國內光碟廠商如生產符合「橘皮書」規格的 CD-R ,必須取得飛利浦專利授權,在 CD-R 專利授權的締約過程中,飛利浦具有相對優勢地位。飛利浦並在授權合約要求被授權人,提供「製造設備清冊」及「書面銷售報告」,內容涉及被授權人的產能利用率、產量、客戶名單及個別客戶交易量等重要資訊;但這些資料與權利金總數額的計算,並無密切相關。飛利浦除為此專利的專利權人,也授權其他製造廠商產製 CD-R 光碟片,並以 Philips 品牌從事光碟片販賣,與被授權人在市場是處於競爭地位。因此,飛利浦利用此優勢地位,取得被授權人公司經營成本的重要資訊,雙方在市場會產生不公平競爭。   飛利浦則表示,授權合約要求被授權人提供「製造設備清冊」及「書面銷售報告」,是為確認被授權人授權產品報告的正確性,這是國際授權實務上的慣例。飛利浦在合約已保證相關內容,不為合約目的外的使用,並無違法行為;該公司將循正常程序提出訴願。

美國專利商標局再審結果,將影響Motorola 與Aruba Networks間的專利侵權訴訟結果

  美商Motorola 公司(下稱MOT) 旗下Symbol Technologies, Inc.及Wireless Valley Communications, Inc.公司於2007年8月27日在美國德拉瓦州(Delaware)地方法院對美商Aruba Networks公司(下稱ARUN)提起專利侵權訴訟,指出ARUN侵害他們的無線區域網路連結技術(WLAN)等四項專利,並向法院申請永久禁制令及金錢上的損害賠償。     2008年9月,ARUN向法院申請反訴並向美國專利商標局(USPTO)對上開四項專利申請再審,指出MOT所據以主張的專利權申請日晚於ARUN之現有技術(Prior Arts)實施日。     今(2009)年2月,美國專利商標局已陸續對於ARUN所提的再審核發初審報告。其中,US Patent No.6625454中12/14說明項被認定為無效;US Patent Nos.6973622, 7173922之再審初審報告指出全部說明項都被認定為無效;目前還有1件ARUN申請的專利再審案在審查中,而根據MOT於法院上的陳述,美國專利商標局所受理的再審專利案件中,也多將原專利權認定為無效或變更。 ARUN所提的再審結果雖然尚未確定,但多數分析師認為再審結果多有利於ARUN。待再審結果確認後將會影響MOT v ARUN的訴訟結果,對於損害賠償判定也會有重大影響 。

TOP