合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/03/07)
引註此篇文章
你可能還會想看
中國大陸加入國際工業設計保護的海牙體系

  世界智慧財產權組織(World Intellectual Property Organization,簡稱WIPO)宣布中國大陸於2022年2月5日提交了加入《海牙協定》1999 年日內瓦文本的文件,加入國際工業設計註冊的海牙體系(Hague System),該協定將於2022年5月5日在中國大陸生效。隨著中國大陸的加入,海牙體系涵蓋的國家總數將達到 94 個,其中包含根據世界銀行排名十大經濟市場中的九個。   工業設計形成物品的裝飾,其可由三維特徵(例如物品的形狀)或二維特徵(例如圖案、線條或顏色)組成,圖形用戶界面或虛擬世界物品則成為最近流行的設計形式。海牙體系為工業設計提供國際保護的解決方案,申請人不需要在各個國家或地區分別提交多次申請,只要透過海牙體系提交一份國際申請,就可在90多個國家/地區註冊多達100項設計。   據統計,2020 年中國大陸居民共提交了795,504件設計,約佔全球總數的 55%。中國大陸加入海牙體系將使其居民可更容易地在海外取得工業設計保護並推廣市場,外國設計師也將能夠更容易地進入中國大陸市場。   我國企業或設計師如有工業設計保護需求,亦可評估運用海牙體系提交國際工業設計申請,在多個國家取得設計註冊。

照相手機成為助長青少年犯罪之工具?

  青少年間的打架尋仇事件會因為照相手機的誕生而變本加厲嗎?   發源於英國流行於青少年之間的一種犯罪活動「 happy slapping 」 ( 藉由公開掌摑不認識之被害人,並由加害人之一以手機全程拍攝,並將照片以手機傳送或上網流傳之犯罪行為 ) ,目前已逐漸蔓延於整個歐洲,且犯行甚至包括重傷害或是性侵案件,引起各國當局高度重視。在法國甚至發生一起學生攻擊教師並以手機拍照的案件,使得警方對於此種原本被單純視為是青少年間挑釁尋仇行為,已重新定義為「預謀暴力犯罪」;法國教育部長更公開表示希望能夠禁止學生在教室內使用手機。   至於歐洲其他國家也針對此種暴力犯罪行為採取進一步行動。德國巴伐利亞省及愛爾蘭許多學校已明令禁止學生在教室內使用手機;今年四月初,丹麥法院則針對兩名青少年學生傷害路人之行為做出有罪判決;而在荷蘭也傳出類似案例。在英國甚至有受辱的學生,因無法承受外界異樣眼光而上吊自殺的個案。   照相手機因為其強大傳輸、上網及存證功能,成為激發青少年逞血氣之勇並滿足個人英雄慾望之工具,這樣的發展途徑恐怕是照相手機原創者始料所未及。台灣目前似乎尚未受到此股歪風影響,但是,如何灌輸青少年正確享受科技進步的便利,似乎是相關當局應該關注的議題。

歐洲區塊鏈數位基礎設施聯盟預計於2024年正式開始運作,將進一步擴大推動區塊鏈的公共應用服務

歐洲區塊鏈夥伴關係(European Blockchain Partnership, EBP)的成員於2023年6月正式向歐盟執委會(European Commission, EC)申請成立區塊鏈的「歐洲數位基礎設施聯盟」(European Digital Infrastructure Consortium, EDIC),若審核通過,未來歐盟將有一個正式的機構負責推動區塊鏈的發展與應用。 歐盟執委會於2023年1月發布了「2030年數位十年政策計畫」(Digital Decade Policy Programme 2030, DDPP),為促進歐盟數位轉型的大規模部署及能力建構,達到DDPP所設定的具體目標,執委會提出跨(多)國專案(Multi-Country Projects, MCPs)的概念,期待整合歐盟、各成員國、私部門的資源,以實現單一成員國無法獨立部署的數位化基礎設施。 執委會參考2009年開始陸續成立的「歐洲研究基礎設施聯盟」(European Research Infrastructure Consortium, ERIC),提出了「歐洲數位基礎設施聯盟」(EDIC)的規劃。EDIC並非由歐盟的資助計畫支持,而是由成員國申請(至少要包含3個成員國)成立以執行MCPs,EDIC具有法人格,並有獨立的財務來源;此外,EDIC成立後開放私部門參加。 2023年3月執委會發布的「數位歐洲2023~2024年工作計畫」(Digital Europe Work Programme 2023-2024)中,即將「區塊鏈」列為MCPs的重要發展項目之一。2023年6月15日於瑞典舉辦的歐盟數位大會(Digital Assembly 2023)上,執委會表示EBP及歐洲區塊鏈服務基礎設施(European Blockchain Services Infrastructure, EBSI)的相關成員國已遞交EDIC的申請。 斯洛維尼亞共和國(Republic of Slovenia)的區塊鏈小組負責人Nena Dokuzov是成立聯盟的主要推動者之一,其受訪時表示,EBSI從2018年以來,主要是由執委會以專案方式支持,未來聯盟成立以後,將能集結更充足的資源,強化歐洲區塊鏈的治理和穩定性,進一步地擴大推動歐洲區塊鏈的公共應用服務。我國「司法聯盟鏈」於2022年成立,為我國第一個跨部會、大規模的區塊鏈應用案例,並制定了跨組織協作標準規範(簡稱b-JADE),未來可持續觀測歐盟區塊鏈聯盟的發展,作為我國的參照。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

德國完成800MHz頻譜重分配

  德國電信監理機關Bundesnetzagentur (BNetzA)於2010年5月宣告完成包括800MHz、1.8GHz、2GHz和2.6GHz等多頻帶中共計41塊頻段的頻譜拍賣,成為歐洲第一個完成數位紅利頻譜重分配的國家。   本次拍賣主要由四個行動營運商(E-Plus、T-Mobile、Vodafone、O2)參與投標,歷經224回合競標,挹注政府約43.8億歐元收入,遠低於之前預估的80億歐元,也遠低於10年前的3G頻譜500億歐元。   只有三家業者(T-Mobile、Vodafone、O2)取得數位紅利800MHz頻譜使用權;未得標的E-Plus公司則早已表達意願,將租用其中一個得標者的新網路頻寬,以使用數位紅利。   本次拍賣並沒有產生新的市場參進者,此狀況讓那些希望開放新頻譜即可刺激新的市場競爭的人頗為失望。惟BNetzA以為,目前市場上已經有約100家的MVNO業者和為數眾多的次品牌服務經營者在競爭,監管機關看不出應執行拍賣條款中「應有利新的市場參進者」的理由。   市場主導者T-Mobile已經宣稱,將率先於今年開始利用800MHz測試發展LTE服務。但由於在800MHz段部署LTE網路將與歐洲其他國家(主要指TeliaSonera公司在瑞典和挪威)早先同意於2.6GHz佈建的網路技術有異,而在密集的城市環境中,在800MHz與2.6GHz頻段同時部署LTE被視為是相當理想的網路佈建策略,歐盟現階段正在想辦法調和兩個頻段的和諧使用策略中。

TOP