合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?no=64&tp=1&d=8532 (最後瀏覽日:2024/07/27)
引註此篇文章
你可能還會想看
歐盟執委會提出欲修正歐盟「地理標示」制度之提案,新增對於工藝品和工業產品之保護

  歐盟執委會(European Commission, EC)於2022年4月13日提出欲修正歐盟「地理標示」(Geographical Indication, GI)制度之提案(Proposal for a REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on geographical indication protection for craft and industrial products and amending Regulations (EU) 2017/1001 and (EU) 2019/1753 of the European Parliament and of the Council and Council Decision (EU) 2019/1754,下稱本提案),擬在歐盟GI制度原僅保護農產品、食品及葡萄酒、蒸餾酒產品外,新增對於工藝品和工業產品之保護。   所謂工藝品和工業產品如義大利的穆拉諾玻璃(Murano glass)、愛爾蘭的多尼戈爾花呢(Donegal tweed)和波蘭陶(Boleslawiec pottery)等,皆係源於特定地區,產品品質和相關特色皆係依於原產地技藝之原創性及傳統作法。儘管此等產品在歐洲或全世界享有不錯聲譽,其製作者一直以來卻未能享有歐盟層級GI的保護,以更可將其原產地名與聲譽、品質相連結。   本提案將使消費者更易於辨識該等產品之品質,以可在更得知產品資訊的狀況下,作出消費選擇;亦可宣傳各原產地的技術工藝,使當地技藝被保存,並創造工作機會,達到經濟成長。   本提案主要包含: (1)將工藝品和工業產品納入歐盟GI保護: 將為工藝品和工業產品建立一個橫跨全歐盟的GI保護,而非僅目前部分區域或國家所有者,以更保障製作者之智慧財產權。本提案亦將促進打擊仿冒品的行為,包含在網路上所銷售者。 (2)為工藝品和工業產品的GI制度建立經濟的註冊程序: 將建立「兩階段申請程序」,製作者先向其所屬歐盟會員國當局提出申請,再由該當局轉交符合第一階段資格者之資料至歐盟智慧財產局(European Union Intellectual Property Office, EUIPO),以進行評核。 本提案將可使製作者提出「其產品有符合原產地製作特點」的聲明,以使整體註冊程序較簡易且節省成本。 (3)與國際上其它GI保護制度相容: 本提案將使成功取得歐盟GI註冊之工藝品和工業產品製作者可在「關於保護原產地名及GI的日內瓦協定」(Geneva Act on Appellations of Origin and Geographical Indications under the World Intellectual Property Organisation (WIPO))之簽署國實施和保護其產品的權益;蓋此協定亦有包括工藝品和工業產品。而由於歐盟於2019年簽署該協定,故在歐盟境內亦將保護他簽署國工藝品和工業產品之GI。 (4)保存原產地技藝,並造就歐洲鄉村和其他地區的發展: 藉由提供製作者(尤其是中小企業)誘因,以投資於新的原創產品及創造其他利基市場(niche markets)。本提案並將使歐洲若干地區(尤其是鄉村及較低度開發區域)將失傳的技藝得以被保存,因此將可重振其知名度以吸引遊客或創造其他工作機會,達到經濟復甦。

美國重新闡述無障礙通訊設備裝置

  為了落實美國2010年公布之21世紀通訊與視訊無障礙法(Twenty-First Century Communications and Video Accessibility Act of 2010,CVAA),讓身障者得以使用新興通訊技術,FCC於今(2013)年4月29日公布第二次報告與命令(Second Report and Order)。本次規範重點在修訂2011年對1934年通訊法(Communications Act of 1934)第716、718條之規範,使通訊服務與設備製造之業者,負擔更多的無障礙義務。   針對第716條,規範消費者終端設備,包括手機、筆記型電腦或平板電腦等,在安裝或具備瀏覽器後,將被視為具有提供先進通訊服務(Advanced Communications Services,ACS)之能力,而須提供身障人士無障礙使用非互連VOIP(non-interconnected VoIP)、電子通訊與視訊會議服務。第二次報告與命令相較於2011年,FCC將消費者終端設備皆納為先進通訊服務,而須承擔無障礙義務,本次規則限縮設備製造商之無障礙使用義務。至於第718條則是要求手機製造商與電信服務商提供之手機,如具有網路瀏覽器,則須能使視障者無障礙使用。例如以語音將網址輸入於地址攔(Address Bar)、或是準確使用工具鍵(例如是回復鍵),增加提供瀏覽器業者(e.g .微軟Google)之義務。   FCC要求2013年10月8日以後生產、提供的設備與服務,皆須符合第716、718條規範,使身障者更得方便使用通訊設備。不過, ACS在下述條件可不受無障礙使用限制: 1.手機無法進行相容。 2.設備為客製化、且未有公開販售。   美國於2010年時超過40%以上的成年人,使用網際網路收發郵件、或獲取即時消息,但是,身障者卻難以享有資通訊的便利性。是故,這次FCC對第716、718條重新闡述,是否能降低美國身障者之數位落差,更能受益於科技的進步,將是未來持續觀察的重點。

美國眾議院提出「深度偽造究責法案」

  隨著人工智慧(AI)視覺處理技術愈發進步,圖片及影像的篡改也更加普遍,甚至使人難以分辨其真偽,例如一款應用程式(App)-DeepNude便是運用此技術,將人穿著衣服的照片改作為裸體圖像;此種AI技術因對於社會及被偽造之當事人權益影響重大,進而引起美國立法者的極度重視。   日前維吉尼亞州為了遏止如DeepNude此類的應用程式,便於該州之《復仇式色情法》(Revenge porn law),擴大復仇式色情的涵蓋範圍,使其包括利用機器學習技術偽造他人照片或影像等深度偽造(Deepfake)行為。   但該深度偽造技術之應用,實際上並不僅侷限於情色領域,故美國紐約州眾議員伊薇特.克拉克(Yvette Clarke)於本年度(2019年)6月即提出了《深度偽造究責法案》(Defending Each and Every Person from False Appearances by Keeping Exploitation Subject to Accountability Act of 2019., DEEP FAKES Accountability Act.)草案,本草案令人關注之處除配合現今科技發展特性為規定外,另針對實務上曾衍生的爭議問題,特別將外國勢力或其代理人(foreign power or an agent thereof)介入美國國內政治行為,如意圖影響美國國內公共政策辯論(domestic public policy debate)、選舉或其他不得合法從事的行為等納入規範。   依該草案之內容,其所規範者包含視聽紀錄、視覺紀錄及錄音紀錄;意即任何人使用任何技術或設備製作假冒他人名義(false personation)的紀錄,並於網路或其他知識傳播管道發布者,應有浮水印、口頭陳述或是於文本中有簡要說明等揭露,以使他人得清楚知悉該紀錄並非真實,如行為人有違反該揭露規定並利用深度偽造1.意圖羞辱或騷擾(包含性內容);2.意圖造成暴力、身體傷害、煽動暴亂、外交衝突或干預選舉;3.詐欺犯罪等,將可處5年以下有期徒刑,或科或併科罰金。另若行為人修改或刪除他人揭露之資訊而有上述意圖或犯罪行為者,亦可處以同等罰責。

微軟向美國專利商標局(USPTO)提出可用以追蹤物體的擴增實境(AR)專利申請

  依據12月USPTO公開資訊,微軟(Microsoft)於2016年9月2號提出擴增實境(Augmented Reality,以下簡稱AR)系統之美國發明專利申請(申請號:20160373570)。目前AR系統不僅可投射虛擬訊息,還可偵測物理空間之物體位置,不過因為現實生活中,不管是有生命或無生命物體,都不太可能處於完全靜態不動的狀況;而微軟此技術之開發,除了不限於固定空間外,對移動中的物體更具有自動追蹤效果。   微軟專利指出該系統能辨識無生命物體,並可將該物體被選擇為追蹤對象的技術,這個AR系統可持續監測物體的狀態,不僅在同一空間中不同時間點,甚至是物體離開監控空間又被帶回的情況都可追蹤。從微軟專利可以看到這項技術運用在日常生活的價值,如:我們常常花很多時間在想汽車鑰匙和錢包放在哪裡,但透過這個系統的追蹤,可以節省我們找尋的時間;有時我們會忘記家裡的牛奶還剩多少,而花時間去逛超商,倘若我們運用此追蹤技術,能夠隨時知道牛奶剩餘的狀態,就可以避免這種情況的發生。   上開技術不僅包含AR技術,還有虛擬實境(Virtual Reality,簡稱VR)技術,這些技術能透過虛擬與真實世界合併,將真實世界、人類、空間和物體結合,並可進一步的智慧化追蹤,若這項專利被核准且可真實運用到現實生活,必能減少我們的生活中不必要的麻煩。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」

TOP