合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/12)
引註此篇文章
你可能還會想看
簡介人工智慧的智慧財產權保護趨勢

近期人工智慧(Artificial Intelligence, AI)的智慧財產權保護受到各界廣泛注意,而OpenAI於2023年3月所提出有關最新GPT- 4語言模型的技術報告更將此議題推向前所未有之高峰。過去OpenAI願意公布細節,係由於其標榜的是開源精神,但近期的報告卻決定不公布細節(如訓練計算集、訓練方法等),因為其認為開源將使GPT- 4語言模型面臨數據洩露的安全隱患,且尚有保持一定競爭優勢之必要。 若AI產業選擇不採取開源,通常會透過以下三種方式來保護AI創新,包括申請專利、以營業秘密保護,或同時結合兩者。相對於專利,以營業秘密保護AI創新可以使企業保有其技術優勢,因不用公開技術內容,較符合AI產業對於保護AI創新的期待。然而,企業以營業秘密保護AI創新有其限制,包含: 1.競爭者可能輕易透過還原工程了解該產品的營業秘密內容,並搶先申請專利,反過來起訴企業侵害其專利,而面臨訴訟風險; 2.面對競爭者提起的專利侵權訴訟,企業將因為沒有專利而無法提起反訴,或透過交互授權(cross-licensing)來避免訴訟; 3.縱使企業得主張「先使用權(prior user right)」,但其僅適用在競爭者於專利申請前已存在的技術,且未來若改進受先使用權保護之技術,將不再受到先使用權之保護,而有侵犯競爭者專利之虞,因此不利於企業提升其競爭力。 綜上所述,儘管AI產業面有從開源轉向保密的傾向,但若要完全仰賴營業秘密來保護AI創新仍有其侷限,專利依舊是當前各企業對AI領域的保護策略中的關鍵。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

美國加州通過美國第一部規範藥品專利侵權和解協議中遲延給付條款之州法,推定其具有反競爭性

  美國加州議會於2019年9月12日通過《加州法案AB 824,商業:保持人們對負擔得起的藥物之近用(California AB 824 - Business: preserving access to affordable drugs)》(下稱AB 824法案),其主要規範藥品專利侵權和解協議中之「遲延給付(pay for delay)」條款,推定其具有反競爭性,為美國第一部規範製藥公司之間簽訂遲延給付條款之州法。   於AB 824法案中,其規範對象為學名藥與生物相似性藥物之藥證申請人,統稱為「非參照藥物申請者(Nonreference drug filer)」。其規定若用來解決專利侵權之協議為「非參照藥物申請者」從主張專利被侵害的公司處接受任何有價值之物,且同意於一段期間內限制或放棄學名藥或生物相似性藥品的研究、開發、製造、上市、銷售,則該協議推定具有反競爭效果。惟例外若能證明「非參照藥物申請者」所獲得之價值僅對其他商品或服務是公平合理的補償、協議直接產生了競爭優勢,協議的競爭優勢大於協議的反競爭效果,則反競爭性之推定可舉上述事由為證而推翻。每次違規行為可處以高達2000萬美元或「非參照藥物申請者」收到的價值三倍的罰款,以數額高者為準。   AB 824法案減輕政府舉證責任的負擔,將主張和解協議不具反競爭效果之舉證責任轉移至和解協議當事人身上,且因此種推定,當事人必須向政府揭露更多和解協議之資訊,而增加協議之透明度。

新加坡個人資料保護委員會針對企業蒐集、使用、揭露永久居留證(NRIC)號碼提出新的諮詢指引

  考量各行各業的從業習慣及民眾對企業蒐集、使用、揭露永久居留證(National Registration Identification Card, NRIC)號碼之看法,新加坡個人資料保護委員會(Personal Data Protection Commission, PDPC)於2017年11月提議修改個人資料保護法的諮詢指引(Advisory Guidelines on the Personal Data Protection Act ),明確界定企業蒐集、使用、揭露NRIC及其號碼之範圍。   依據舊的諮詢指引,新加坡個人資料保護法允許企業在基於合理特定目的並依法獲得當事人有效同意之情況下,蒐集、使用或揭露NRIC號碼。因此,不少企業活動習慣蒐集利用民眾的NRIC號碼,包括零售商店所舉辦的抽獎活動。然而,在PDPC提出新的諮詢指引後,企業可蒐集利用NRIC號碼的情況受到大幅限縮。   由於NRIC號碼與個人資訊息息相關且具不可取代性,無差別地蒐集利用將增加資料被用以從事非法活動之風險,故新的諮詢指引闡明,原則上企業不應蒐集、使用或揭露個人NRIC號碼或複印NRIC,除非有下列兩種例外情況之一:(一)法律要求;(二)為確實證明當事人身分所必要。第一種例外情況,雖因法律要求無須取得當事人同意,但企業仍應踐行告知義務,使當事人知悉NRIC號碼被蒐集、使用或揭露之目的,並確保企業內已採行適當安全措施,防止NRIC號碼被意外洩漏。第二種例外情況則仍須就NRIC號碼的蒐集、使用或揭露取得當事人同意,除非符合個人資料保護法規定下毋庸取得當事人同意之例外(如急救等緊急狀況)。   此外,PDPC針對得蒐集、使用或揭露NRIC號碼或複印NRIC的情況,以情境案例方式於諮詢指引中說明供企業參考,另給予12個月的審視期間,使企業得修正組織內部政策並尋找可行替代方案。

韓國2013年智財施行計畫檢討評估作法介紹

韓國2013年智財施行計畫檢討評估作法介紹 科技法律研究所 法律研究員 陳聖薇 2014年12月23日 壹、事件摘要   依據韓國智慧財產基本法第10條,韓國針對國家智慧財產施行計畫之執行成果,應定期進行整體檢討評估,以作為往後計畫之參考指標。為此,韓國於2014年8月11日公布「2013年度國家智財施行計畫之檢討評估結果」[1](以下簡稱2013檢討評估結果)。本文以下將簡要說明之。   如同「2012年度國家智財施行計畫之檢討評估結果」(以下簡稱:2012檢討評估結果),2013檢討評估結果針對2013年度國家智財施行計畫(以下簡稱2013年施行計畫)之5大政策面向:創造、保護、運用、基礎環境、新智慧財產,以及地方自治團體等六個面向挑選出重點推動之35課題,由民間專家組成「政策評估團」,以確保評估之專業性及客觀性。而具體評估方式與指標以下分別說明之。 貳、評估方式與指標 一、評估方式   韓國考量到智財施行計畫之特殊性,再者,評估國家層級智財政策之成效,不僅需要評估政策成果,同時也要對政策形成、執行等政策基礎環境之確保等相關要素進行評估,以作為下一年度計畫政策之參考。   為確保評估之專業性及客觀性,由韓國智財委員會之民間委員、及下設之創造、保護、運用、基礎環境、新智慧財產等專門委員會之專門委員,以及地方自治團體代表等30位成員組成政策評估團。每位評估委員就各機關提出之實績報告書內容為判斷依據,再依照不同指標之特性,進行定量和定性評估。政策評估團第1次評估完畢後,就會召開調整會議,決定各推動課題之評估等級(分成優秀、普通、需要改善3個等級)為何。最後,本智財施行計畫之最終評估結果會告知相關機關,供其制定、執行政策之參考,並且運用於智慧財產財政分配方向及下年度施行計畫之制定上。 二、評估指標   在評估指標設計上,韓國一大特色在於其不以行政機關別為政策評估,而是以創造、保護、運用、基礎環境、新智慧財產等五大政策領域以及加上地方自治團體面向作為評估框架[2]。進一步之細部評估指標則運用國務總理室之政府業務評估(特定評估[3])基本架構,針對「政策形成–執行–成果」整個過程,分階段進行評估。此外,2013檢討評估結果是以2012檢討評估結果為基礎,將既有之指標統合、刪減後,再依據地方政策特殊性,增加地方自治團體之評估指標。指標變更事項有:依據各地方特殊性需要有針對地方量身訂作之「地方自治團體政策差別性」指標;針對識別性較弱之「推動日程之適當性」與「監督與情況變化之對應性」之指標整合。配分變更事項有:因應政策是否實際有感於民的比重日亦加重,「政策效果」之指標也加重配分;就新的指標針對中央與地方分別進行評估。詳細指標內容如下表所示 : 表1:2013年智財施行計畫之中央(地方)機關政策評估指標 區分 評估項目 評估基準 政策形成(30%/35%) 1.計畫確立之適切性(15%) 1-1.事前分析、意見蒐集之充實性(5%) 1-2.成果指標及目標值之適當性(10%) 2.政策基礎環境之確保水準(15%/20%) 2-1.推動體系之充實性(5%/10%) 2-2.資源分配之適當性(10%) 政策執行(30%) 3.推動過程之效率性(20%) 3-1. 與有關機關、政策之連結性(10%) 3-2.監督與情況變化之對應性(10%) 4.政策擴散之努力水準(10%) 4-1.政策溝通、宣傳、教育之充實性(10%) 政策成果(40%/35%) 5.政策成果及效果(40%/35%) 5-1.成果目標達成度(20%/15%) 5-2.政策效果(20%) 資料來源:韓國國家智財委員會,http://www.ipkorea.go.kr/index.do。 參、代結論   在前述評估機制運作下,2013檢討評估結果共列出8個優秀課題與4個待改善之課題。後續針對待改進課題,該主管機關在接受評估委員之改善意見後,會提出補充之改善計畫,表示其要如何解決政策推動之障礙因素,而國家智財委員會則會隨時檢視其執行狀況,並且適時給予政策支援。至於優秀課題部分,韓國將會提供細節資訊與相關機關共享,讓機關之間互相學習,樹立一個學習標準(benchmarking)。   從施行計畫、檢討評估到提供量身訂做之改善建議,顯示韓國對於建構智慧財產強國的企圖。而2012、2013檢討評估結果之經驗,也將持續提供為2014年檢討評估之參考,使智慧財產施行計畫之檢討評估能更具效率。 [1]韓國國家智慧財產委員會,2014年8月11日公布之第11回國家智財委員會決議〈13년 시행계획 점검평가결과〉。 [2]依據政策領域評估的課題計有 :創造(2)、保護(4)、活用(5)、基礎(3)、新智慧財產(4)以及地方自治課題(17)。 [3]韓國政府業務評估基本法第2條第4款,所謂特定評估,指國務總理以中央行政機關為對象,為統合管理國政,對必要之政策進行評估。

TOP