合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/01/30)
引註此篇文章
你可能還會想看
美韓兩國反托拉斯法主管機關共同簽署反托拉斯備忘錄

  為了促進美國、韓國兩國之間的反托拉斯法主管機關合作。今年9月8日,美國司法部(Department of Justice,DOJ)、美國聯邦貿易委員會(Federal Trade Commission,FTC)與韓國公平貿易委員會(Korea Fair Trade Commission,KFTC)於華盛頓特區簽訂一反托拉斯備忘錄(memorandum of understanding,MOU);該備忘錄係由美國司法部反托拉斯署助理檢察總長Bill Baer與聯邦貿易委員會女主席Edith Ramirez及韓國公平交易委員會Jeong Jae-chan共同簽署。本備忘錄於簽署後立即生效。   反托拉斯署助理檢察總長Bill Baer表示:「具有坦誠和建設性對話之執法合作對於美國、韓國及全世界各地之競爭市場維持皆極其重要。本備忘錄標示了一直以來美國與韓國公平貿易委員會之間的合作關係;並展現出我們在未來日子中,欲持續加強該合作關係的企圖心。」該備忘錄的重點包含: 反托拉斯合作重要性的相互承認,包括在進行共同執法時,互相協調的重要性。 闡明了美國反托拉斯執法機關與韓國公平貿易委員會之間溝通的重要性。 承諾保護另一方所提供訊息之機密性;並承諾在法規不允許的情況下,禁止分享資訊。   自韓國1981年通過其反托拉斯法後,美國反托拉斯主管機關和韓國公平貿易委員會之合作關係越來越緊密;其中包括政策意見的交換,並視情況進行合作開展調查。本次所簽訂之備忘錄旨在進一步推動這些合作關係。

醫療記錄能否受到著作權保護

  澳洲法院近來持續在著作權相關案件中強調個人精神智慧投入的重要性,在Primary Health Care Limited v Commissioner of Taxation一案中([2010] FCA 419)再度強調了這樣的趨勢。在本案中,原告Primary Health Care為一信託受益人,透過信託取得醫療與牙醫業務,原告主張相關的醫療記錄文件如:處方籤、健康記錄、轉診信(referral letters)以及諮詢意見都有著作權,而於計算稅基時,應從信託的淨收益中加以扣除。   本案法官則指出,醫療記錄必須要達到語文著作的創作性實質要求,才能主張著作權的存在。針對本案的相關醫療記錄法官分別分析如下: 一、 諮詢記錄 所有的諮詢紀錄中,法官認定只有一份諮詢記錄受到著作權的保護,該份記錄從頭到尾只有一個作者,並以連續記述的方式呈現出個人精神智慧的投入;而本案中其他的諮詢記錄則有多個作者,僅僅標記姓名、醫療狀態、藥物治療以及生理、病理資料,難以呈現出個人精神智慧的表現,僅為病人的診斷與治療資訊,因此法官認定這些記錄無法受到著作權的保護。 二、 處方籤與健康記錄 作為本案證據的處方籤,只有姓名、藥物治療、劑量以及制式醫囑等資訊,而健康記錄則只有一連串的病史與醫療程序。因此,法官認定本案中所有的處方籤與健康記錄都不足以作為著作權的保護的客體。 三、 轉診信 法官認定在本案中的轉診信都有一些個人精神智慧的投入,儘管轉診信都是依循固定的格式,但基於轉診信的目的考量,固定的格式與內容都是合理的,因此本案中的轉診信都可以受到著作權的保護。   在Primary Health Care一案中,法官認定相關的醫療記錄文件並不必然一律受到著作權的保護,必須個別的加以認定。在醫療記錄中,只有當所有作者是能夠被辨識、特別是在只有單一作者的醫療紀錄中,能達到著作權法中語文著作對於個人精神智慧投入的要求時,才會受到著作權的保護。

歐盟執委會將發展數位分身地球系統(Destination Earth system),應對氣候變遷危機和保護自然生態

  歐盟執委會(European Commission)於2022年3月30日提出了一項「目標地球倡議(the Destination Earth initiative)」,希望建立「目標地球系統」(Destination Earth system,以下簡稱DestinE系統),作為實踐歐洲「綠色協議」(European Green Deal)、「數位化戰略」(EU’s Digital Strategy)此兩項計畫的一部分。   DestinE系統係旨在全球範圍內開發一個高度精確的地球數位模型,透過整合、存取具價值性的資料與人工智慧進行資料分析等技術,以監測、建模和預測環境變化、自然災害和人類社會經濟之影響,以及後續可能的因應和緩解策略。未來希望將高品質的資訊、數位服務、模型預測提供予公部門運用,接著逐步開放給科學界、私部門、公眾等用戶,將有助於應對氣候變遷、實現綠色數位轉型,並支持塑造歐洲的數位未來。   為實現此一項目,歐盟執委會預計在2024年中前由數位歐洲計畫(Digital Europe Programme)投入1.5億歐元,並與科學、工業領域單位合作,包含歐洲航太總署(European Space Agency, ESA)、中期天氣預報中心(European Centre for Medium-Range Weather Forecasts , ECMWF)、氣象衛星開發組織(European Organisation for the Exploitation of Meteorological Satellites , EUMETSAT)等,透過建立核心平台逐步發展為DestinE系統,稱之為數位分身(Digital Twins)。   是以,DestinE系統將允許用戶存取地圖資訊(thematic information)、服務、模型、場景、模擬、預測、視覺化,其系統主要組成分為以下三者:   從而,DestinE系統用戶將能夠存取大量地球系統和社會經濟資料並與之互動,該系統可有助於: 核心服務平台(Core Service Platform)--該平台將基於開放、靈活和安全的雲端運算系統,提供決策工具、應用程式和服務,兼具大規模資料分析與地球系統監測、模擬和預測能力的數位建模和開放模擬平台。同時,也將為DestinE用戶提供專屬資源、整合數據、開發各自的應用程式。該平台服務的採購、相關維運將由歐洲航太總署負責。 DestinE資料湖泊( DestinE Data Lake)--資料湖泊將提供核心服務平台、數位分身所需的獨立專用資料存取空間,並提供多元的資料來源和有效管理與DestinE系統用戶共享的資料,同時提高、擴大資料處理和服務。其將由歐洲氣象衛星開發組織負責營運。 數位分身(Digital Twins)-- DestinE 數位分身將依據不同的地球科學領域主題進行即時觀測、分類,例如極端自然災害事件、因應氣候變遷、海洋或生物多樣性,最終目標是整合這些數位複製內容(digital replicas),形成、建立全面性的地球數位分身綜合系統。因此,DestinE 數位分身將為用戶提供量身打造的高品質資料,用於用戶特定的場景模擬開發、決策。而該DestinE 數位分身將由歐洲中期天氣預報中心進行開發。   從而,DestinE系統用戶將能夠存取大量地球系統和社會經濟資料並與之互動,該系統可有助於: 根據豐富的觀測資料集,對地球系統進行準確、和動態的模擬,例如:關注與社會相關的領域、氣候變化的區域影響、自然災害、海洋生態系統或城市空間。 提高、加強預測能力並發揮最大化影響,例如:保護生物多樣性、管理水資源、可再生能源和糧食資源,以及減輕災害風險。 支持歐盟相關政策的制定和實施,例如:監測和模擬地球發展(陸地、海洋、大氣、生物圈)與人為干預,藉以評估現有環境政策和立法措施的影響,作為制定未來政策的依據。或預測環境災難、衍生的的社會經濟危機,以挽救生命並避免大規模經濟衰退。抑或透過開發和測試場景,實現永續發展。

著作權侵權暫停了妙娃種子園藝盆的銷售

  3D列印設計分享網站Shapeways在週五收到從任天堂神奇寶貝國際公司一個停止侵權的函(cease and desist),是有關於藝術家Claudia Ng的類似神奇寶貝妙娃種子的陶瓷園藝盆設計,他將園藝盆在Shapeways網站上販售,但Shapeways在收到警告信函後移除了網站上的產品列表。   根據Claudia Ng所述,任天堂神奇寶貝國際公司是要求所有有關此模型相關的收益。原本產品列表上並未直接將神奇寶貝遊戲名稱用於此盆栽設計名稱,Claudia Ng標註牠是植物怪獸(succulent monster),但產品列表中數次提及了神奇寶貝公司。最新版的設計將近2.5英吋(6.5公分)高,售價為49美元,目前有多種顏色提供銷售。   Claudia Ng表示:我想這是落於衍生和轉化著作的範疇,我並非一個律師,但我猜測這至少是最廣義的相關法規解釋裡。發生這件事我並不意外,只不過我原本預期該公司會追蹤的是那些有更多侵權設計的人。雖然我承認我個人喜愛的神奇寶貝啟發了我的靈感,但不是神奇寶貝的粉絲也都會喜歡這設計的原因就在於神奇寶貝本身的動物本質(generic-ness)。大多數都公認牠像一隻肥貓。而且我也被要求去設計其他的動物或生物。   Claudia Ng可能會被安排和任天堂神奇寶貝國際公司接觸,雖然他無法確定從這場可能的會議中會發生甚麼事。   3D列印設計分享上有可能設計的產品會侵害他人權利,設計者在靈感啟發上到設計成品時皆須有避免侵權的考量,以免不只無法獲利也有侵權的風險。

TOP