合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=67&tp=1 (最後瀏覽日:2024/07/17)
引註此篇文章
你可能還會想看
日本對未來2020年至2030年間網路基礎設施之預測

  日本總務省未來網路基礎設施研究會(将来のネットワークインフラに関する研究会)4月份針對日本人工智慧(Artificial Intelligence 簡稱AI)、物聯網(Internet of Things 簡稱IoT)、資訊及通訊技術(Information and Communication Technologies 簡稱ICT)等技術相對應之網路基礎設施做作出預測。   在2020年以後第五代通信技術(5G)、物聯網系統、高畫質通訊等技術相繼成熟及普及化,相關業者勢必發展出多樣化、高度專業化使用者需求之網路結構,而手機聯網系統從單純的資訊傳遞網路,逐漸變成社會系統之神經網絡(社会システムの神経網)。   物聯網服務目前係由專用終端設備,並根據特定的應用目的建構,但在未來的網絡基礎設施,可能出現如橫向合作應用的通用平台,到2030年左右物聯網服務中M2M(Machine to Machine,機器和機器之間的通訊)的佔有率估計將達到10%。   人工智慧網路技術不僅僅是虛擬化層網路(仮想化レイヤのネットワーク)之維護和操作,更是物理層面的網路(物理レイヤのネットワーク)資源的管理,AI仍然只擔任協助之工具。其中,物理網絡(物理ネットワーク)和邏輯網絡(論理ネットワーク)應分別處理,邏輯網絡將型成多層次化,將變得難以檢測故障和調查原因,但在安全和可靠的網絡基礎設施下,經營者使用AI技術仍然是沒有問題的。   由於雲端技術、通訊技術之提昇,非電信營運者進入網路經營之商業型態逐漸產生,型成網路使用者、資料提供者之多樣性及複雜性。網路流量方面,在2030年左右將超出100Tbps核心網絡所需的傳輸容量,達到以往的光纖的容量限制,將透過無線電接入技術進一步發展,補足不足的光學寬頻。然而,人們對於網路更快的通信速度、安全性及可靠性的功能需求是沒有改變的。

生命科學領域的企業應透過營業秘密保護其部分創新

近期由於營業秘密議題受到重視,引起廣泛討論,美國實務界律師於彭博社法律專欄(Bloomberg Law Practical Guidance)指出生命科學領域的企業不應僅尋求專利的保護,而應考慮透過營業秘密來保護其部分創新,比如:製造技術、分析工具及方法、配方等,並指出保護營業秘密所應採取的具體措施。 在Mayo Collaborative Servs. v. Prometheus Labs一案中,美國最高法院認為診斷方法並非真正的應用,因此不符合可取得專利的資格;在Ass'n for Molecular Pathology v. Myriad Genetics一案中,美國最高法院認為將天然基因分離的技術不符合可取得專利的資格。由上述判決可以發現,生命科學領域的公司能取得專利的範圍被限縮了,因此該領域的企業應考慮透過營業秘密來保護其創新。 營業秘密相對於專利的優勢在於,專利有保護期限,但營業秘密若未公開揭露則能持續受到保護。另外,根據美國專利法(Patent Act),專利保護之客體限於有用且新穎的發明,但營業秘密保護之客體不僅限於此。不過,以營業秘密保護創新同樣存在風險,比如可能面臨前員工、現任員工將其洩露或是由於合作案導致其被竊取的情況等。 為避免上述情況之發生,企業應採取下列措施,包括: 1. 要求員工簽署保密協議,並於協議中具體說明營業秘密之範圍、保密期限,同時確保員工離職時歸還與營業秘密有關的資訊及設備; 2. 將涉及營業秘密的文件標示為機密; 3. 將機密文件及檔案儲存於上鎖的櫃子或受密碼保護的電腦中; 4. 根據員工的職責,僅允許必要的員工存取營業秘密資訊; 5. 對員工進行教育訓練,使其了解哪些資訊被視為營業秘密而不應洩露; 6. 透過監視設備監控保存營業秘密的位置; 7. 與合作單位簽署合作協議時,確保協議中有明確規定哪些資訊被視為營業秘密、分享營業秘密的方式、保密期限、授權的範圍等。 綜上所述,由於可取得專利的範圍被限縮,生命科學領域的企業應考慮透過營業秘密來保護其部分創新。在以營業秘密保護其創新時,應確保有採取與員工簽署保密協議、識別機密、權限控管、教育訓練、與合作單位簽署合作協議等措施。關於前述營業秘密管理措施之重要內容,企業可以參考資策會科法所創意智財中心發布的「營業秘密保護管理規範」,並進一步了解該如何管理,以降低自身營業秘密外洩之風險,並提升其競爭優勢。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

歐盟法院判決在歐盟境內網路下載出售之電腦軟體適用權利耗盡原則說明

  歐盟法院(Court of Justice of the European Union)於2012年7月3日對於UsedSoft GmbH v. Oracle International Corp.案作出判決,判定電腦程式法律保護指令(Directive 2009/24/EC of the European Parliament and the Council of 23 April 2009 on the legal protection of computer programs)第1條第2款規定,指令適用於任何形式的電腦程式,第4條第2款進一步說明,指令對於電腦程式的保護不區分實體載具(例如CD或DVD)或網路下載,均有權利耗用原則(exhaustion right)或稱第一次銷售原則(first sale doctrine)的適用。授權人的權利在第一次出售軟體並換以價金時即耗盡,權利轉移至被授權人。因此,在歐盟境內網路下載購買無限期專屬授權的數位軟體之被授權人,可將所有的軟體再出售,而在歐盟境內不受授權條款中「權利不可移轉」等文字的限制。不過,被授權人再出售軟體時必須不可再使用該軟體,歐盟法院允許軟體提供商利用類似產品金鑰(product keys)的保護技術管理其權利。

美國加州網路身分冒用法2011年01月正式生效

  2010年12月,加州參議院通過網路身分冒用法(Criminal “E-personation”,Senate Bill 1411),針對在網路上惡意冒用他人名義的行為態樣處罰,法案提案人加州參議員Joe Simitian表示:「現有的身分冒用法規係1872年所訂,無法規範現代科技所衍生的身分冒用態樣。」所以法院一般認為網路上的冒用屬於身分剽竊的態樣,但此類型通常不涉及金錢的損失,法庭上證明困難,受害者求償不易,因而制定此一法案。   本法針對故意、未經同意在網路或其他電子途徑冒用身分,傷害、恐嚇、威脅、詐欺他人的行為,判定為輕罪(standard misdemeanor),最高可處以1000元美金或一年以下有期徒刑。因此,在社群網站中冒用他人名義,發表不雅言論的行為往後可能會受到處罰。   但「傷害、恐嚇、威脅、詐欺」的行為態樣的認定,可能會造成法院實際執法上的困難,而且可能侵害人民憲法第一增修條文的權利。以The Yes Man組織為例,該組織假冒美國商會(American Chamber of Commerce)在網路上發表支持眾議院通過氣候變遷法案,其主要目的在於遊說美國商會改變其立場,本法尚未通過前,美國商會向加州法院提出訴訟,美國商會曾就訴訟過程表達不滿,認為現行法對於身分被冒用者無所助益,然新法正式施行後,本案如何在不侵犯憲法第一增修條文的情況下,嚇阻真正帶有惡意的身分冒用者,值得進一步觀察。

TOP