合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/15)
引註此篇文章
你可能還會想看
英國不贊同歐盟新視聽媒體服務指令

  英國傳播、電信、科技及媒體相關領域業者及團體於 2006 年 4 月聯合發表一份意見書,反對歐盟提出的新視聽媒體服務指令( Audiovisual Media Services Directive )草案。同時英國政府也正關注這項草案並與其他會員國進行討論。   自 2005 年 9 月起,歐盟開始針對電視無國界指令( Television without Frontiers Directive )的修正進行討論。歐盟考慮將該指令修改為視聽媒體服務指令,擴大其規範範圍,使其包括各種與電視相似( TV-like )的服務,並將所有視聽媒體服務區分成線性( linear )及非線性( no-linear )服務,分別給予不同程度的管制。   不過英國有許多業者及團體對於這項新指令的制訂深表不贊同,其認為: (1) 就非線性服務(例如隨選視訊)而言,目前既有法規以及業者自律規範已足以保障消費者; (2) 線性及非線性的分類方式可能不適宜作為法律定義的基礎; (3) 新指令將可能阻礙新進業者參與市場的意願,甚至導致投資者轉向其他國家發展。所以希望透過連署,要求歐盟重新檢視這項新指令。

阿里巴巴的網站上販賣山寨版蘋果手表

  蘋果的Apple Watch於2014年9月剛發表,中國大型電子商務網站淘寶網上就出現了仿蘋果智慧型手表Apple Watch,其外形和應用界面都與蘋果版的Apple Watch極為相似。   其中有一款售價只要蘋果的十分之一價錢:239元人民幣,賣方把這款表取名AW。AW和Apple Watch的外觀和操作介面一模一樣,但用的是Google 的Android系統。一些商家在淘寶網上特別強調他們出售的產品不使用蘋果公司的技術。   今(2015)年1月,中國國家工商總局公開批評阿里巴巴網絡交易平台存在假貨問題,淘寶網被指把關不嚴,對商品信息審查不力,銷售行為管理混亂,信用評價存有缺陷以及內部工作人員管控不嚴。當被問及是否已經採取了反對任何賣家的行動,阿里巴巴在聲明中表示,「阿里巴巴集團致力於打擊仿冒,我們與政府,品牌和同業公會緊密的合作來解決這個問題」。   曾經替蘋果工作的一名香港智財權律師說,蘋果若要阻止這些山寨版的手表在市面上出售,可請求著作權或專利侵權賠償,但要花費很多錢及時間。而且在中國並無不正當競爭的法律概念,因此不可能獲得臨時禁制令限制它(暫時狀態假處分),只能通過法律長期爭訟。   另一種選擇蘋果可以請阿里巴巴撤下產品,但對於每個侵害他產品權利的廠商,蘋果都需要個別填寫表格才能請阿里巴巴撤下產品。

良好的隱私權實踐工作有助於強化企業競爭力

  當含有大量個人敏感性特質個資之郵件不小心發送到陌生人的電子信箱時,將可能對當事人帶來無法預估的損害。加拿大隱私委員Daniel Therrien在國際隱私日時(1/28)提醒各企業,不要忽略隱私控管工作對企業競爭力帶來之影響。然這樣的理念不僅僅只適用在大型的企業,加拿大有98%的企業員工少於100人,對於這些成千上萬的小規模企業而言更是重要。   Daniel Therrien說:「我能理解資源有限的小規模企業每天面臨高壓的業務需求,但就相關反饋資料顯示,加拿大當地居民較傾向與具有良好隱私實踐工作之企業進行交易。」因此,良好的隱私實踐工作不僅是有助於消費者,更可協助企業符合加拿大個人資料保護與電子文件法(Personal Information Protection and Electronic Documents Act)之規定。   為協助小規模企業採取積極措施,以保障消費者資料及隱私不被外洩,提高競爭力,加拿大提供相關關鍵步驟供企業參考:(1)不逾越產品或服務目的之資料蒐集;(2)提供顧客清晰易懂之隱私權政策,以便顧客了解資料為何被蒐集,及如何處理、利用;(3)了解蒐集哪些資料、資料儲存期間及方式、有權限接觸之人及刪除方式; (4)對員工進行隱私保護教育訓練;(5)除非必要,否則請避免蒐集如健康狀況、財務資訊等具敏感性之資料;(6)企業應設置窗口或指定專人,針對顧客權利主張或提出與隱私有關之疑問時進行回應。

美國最高法院判決單離DNA片段不具專利標的適格性

  2013年6月13日美國最高法院(the Supreme Court of the United States)就備受矚目之Association for Molecular Pathology v. Myriad Genetics, Inc.一案做出判決,認定如乳癌易感基因BRCA1、BRCA2等經單離(isolated)的人類DNA片段不具美國專利法第101條(35 U.S.C. §101)所規定之專利標的適格性。   美國最高法院指出,雖然專利權人發現了BRCA1與BRCA2基因的位置與序列,但是其並未創造或改變BRCA1與BRCA2基因上的任何遺傳資訊,亦並未創造或改變該DNA片段的基因結構,所以即使其是發現了一個重要而有用的基因,但僅是將其從周遭其他基因材料中分離出來,並非為一項發明行為。亦即是說,突破性、創新或卓越的發現並不必然符合美國專利法第101條之要件要求。   不過,美國最高法院認為,cDNA片段可以具備專利標的適格性,因為其為從mRNA所創造出來、僅具備外顯子(exons-only)的分子,而非自然發生之自然產物。然而美國最高法院對於cDNA是否符合其他可專利要件之要求並不表示意見。   美國最高法院亦強調,本案判決並未涉及任何方法發明,亦未就將有關BRCA1與BRCA2基因之知識予以應用的發明做出判斷,且未判斷自然發生之核苷酸順序經改變的DNA片段是否具備專利標的適格性的問題。

TOP