合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=16&tp=5 (最後瀏覽日:2025/05/22)
引註此篇文章
你可能還會想看
運用AI工具協助管理智慧財產組合(IP Portfolio)之方式

美國實務界律師2023年6月9日撰文指出,人工智慧(artificial intelligence,簡稱AI)將對智慧財產法律和策略帶來改變,大部分企業熟悉的改變是目前仍有爭議的法律問題—由AI工具產生的發明創造是否為專利或著作權適格的保護標的。但除此之外,AI工具對於創建和管理智慧財產組合(IP Portfolio)的方式也已發生改變,並介紹以下五種利用AI工具協助管理智慧財產組合之方式。 1.簡化先前技術之檢索 無論是評估新產品的可專利性、評估競爭對手之智慧財產權之相關風險、抑或是回應侵權索賠,企業均須了解特定領域之先前技術,因應此需求,全球已有大量公司提供先前技術檢索服務,惟AI工具的出現使得企業可自行進行先前技術檢索。例如知名的文件審查平台Relativity創造了Relativity Patents,使用者輸入專利號碼等特定關鍵字即可進行先前技術檢索;美國專利商標局亦為了審查官開發一種AI工具,提升其確認先前技術之準確性及效率。 2.協助專利申請文件撰寫 對於專利申請人而言,可使用AI工具協助草擬專利申請範圍,有些企業甚至會運用AI工具自動化撰寫專利申請文件,惟使用AI工具撰寫專利申請文件時,應留意提供AI工具的資料是否會保密,抑或有向第三人提供之風險。此外,AI工具撰寫之內容建議仍須雙重確認內容正確性及適當性,如引用來源及內容是否正確。 3.改善商標維權能力 企業可使用AI工具協助監控潛在的侵權及仿冒產品,有鑒於現今網站及社群媒體仍有大量未經商標授權的賣家存在,AI工具可作為審查貼文及識別商標侵權案件之工具,相較於傳統的人工審查可更有效率。 4.協助商標檢索作業 於美國、澳洲、歐盟、中國,甚至世界智慧財產組織導入AI工具協助審查官進行商標審查,包括以關鍵字及影像標記之搜尋功能,此一工具不僅可簡化商標申請和註冊審查程序與時間,亦有部分國家提供使用者自行檢索之功能,使企業可進行更快速、有效率之商標檢索,使其於品牌保護策略上節省不必要之時間及金錢。 5.支持策略性專利組合管理 AI工具亦可協助專利組合管理,包括最廣的專利範圍、評估是否需繼續維護專利、或是評估擬收購專利之價值,以AI工具協助評估以上事項,雖無法完全取代人工進行策略評估,惟可顯著減少勞動力支出。 AI工具改變了智慧財產組合創建及管理之方式,雖然AI工具不能完全承擔管理智慧財產權組合之職責,但AI工具在專利/商標檢索、專利申請文件撰寫、專利權評估、商標維權等方面已可大量減少人力及管理成本,有助於企業智慧財產組合管理,惟企業及使用者須留意使用AI工具的資料管理問題,以避免機密資訊遭到外洩。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

英國資訊委員辦公室(ICO)發布企業自行檢視是否符合歐盟一般資料保護規則之12步驟

  英國作為歐洲金融重鎮,不論各行業均有蒐集、處理、利用歐盟會員國公民個人資料之可能,歐盟一般資料保護規則(General Data Protection Regulation,簡稱GDPR)作為歐盟資料保護之重要規則,英國企業初步應如何自我檢視組織內是否符合歐盟資料保護標準,英國資訊委員辦公室(Information Commissioner's Office, ICO)即扮演重要推手與協助角色。   英國ICO於2017年4月發布企業自行檢視是否符合GDPR之12步驟(Preparing for the General Data Protection Regulation(GDPR)-12 steps to take now),可供了解GDPR的輪廓與思考未來應如何因應: 認知(Awareness):認知GDPR帶來的改變,與未來將發生的問題與風險。 盤點資料種類(Information you hold):盤點目前持有個人資料,了解資料來源與傳輸流向,保留處理資料的紀錄。 檢視外部隱私政策(Communicating privacy information):重新檢視當前公告外部隱私政策,並及時對GDPR的施行擬定因應計畫。 當事人權利(Individuals'rights):檢視資料處理流程,確保已涵蓋GDPR賦予當事人如:告知權、接近權、更正權、刪除權、製給複本權、停止處理權、不受自動決策影響等相關權利。 處理客戶取得資料請求(Subject access requests):GDPR規定不能因為客戶提出取得資料請求而向其收費;限期於1個月內回覆客戶的請求;可對明顯無理或過度的請求加以拒絕或收費;如拒絕客戶請求則限期於1個月內須向其說明理由與救濟途徑等。 處理個人資料須立於合法理由(Lawful basis for processing personal data):可利用文書記錄與更新隱私聲明說明處理個人資料之合法理由。 當事人同意(Consent):重新檢視初時如何查找、紀錄與管理取得個人資料的同意,思考流程是否需要做出任何改變,如無法符合GDPR規定之標準,則須重新取得當事人同意。 未成年人(Children)保護:思考是否需要制定年齡驗證措施;對於未成年人保護,考慮資料處理活動是否需取得其父母或監護人的同意。 資料外洩(Data breaches):有關資料外洩的偵測、報告與調查,確保已制定適當處理流程。 資料保護設計與影響評估(Data Protection by Design and Data Protection Impact Assessments):GDPR使資料保護設計與影響評估明文化。 資料保護專責人員(Data Protection Officers):須指定資料保護專責人員,並思考該專責人員於組織中的角色與定位。 跨境傳輸(International):如執行業務需跨越數個歐盟會員國境域,企業則須衡量資料監管機關為何。

標準制定組織成員之專利揭露義務

  標準制定組織為了提高產業競爭,防止標準制定組織之會員們,在獲得涵蓋產業標準的專利權後,以壟斷性手段壓迫其他競爭對手,故通常會以智慧財產權政策要求參加的會員揭露其被標準制定組織選擇寫入標準的專利。其重要內容通常包括:   1. 必要專利揭露 許多標準制定組織皆有規定,標準必要專利權人應依以誠實信用及適當方式進行揭露之義務,例如IEEE及ETSI 。即對於討論中的技術標準,必須對標準制定組織及其參與者公開揭露所持有的必要專利。揭露的基本目的主要有三項 :   (1) 使標準開發相關工作小組會員可以掌握納入標準之多項候選技術的基本資訊(例如專利技術價值、成本及可行性等等),並做出適當選擇。   (2) 藉此得知須提出授權聲明或承諾的必要專利權人。   (3) 藉此讓必要專利的潛在實施者得知應向那些必要專利權人獲取必要專利相關資訊。   2. 事前揭露授權條款(ex-ante disclosure of licensing terms)   事前揭露授權條款係一種受保護之技術在被採納為標準必要專利前,將授權條件的揭露的機制,目前IEEE及ETSI採行自願性揭露方式。與必要智財權的揭露及授權聲明不同,其主要的目的在於讓標準制定委員會將技術採納為標準前,可以根據所揭露的授權條件來決定有那些技術在符合權利人授權條件下,有哪些技術可以納入標準,又有哪些不同替代技術,並據以作成決定 。

歐盟國家推動智慧防救災下之資料開放、運用與傳遞法制政策研析

TOP