合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/05/03)
引註此篇文章
你可能還會想看
馬來西亞通過修正《個人資料保護法》

馬來西亞個人資料保護委員會(Personal Data Protection commissioner,下稱個資保護委員會)於2023年度收受與個人資料(下稱個資)濫用、外洩相關申訴案件數量達779件,成長數量令人憂心。為確保對於個資保護規範能與國際標準發展同步,並加強個資遭洩漏時即時採取應變措施等相關政策,以解決前述憂心狀況,數位部(Ministry of Digital)於2024年7月10日提出《個人資料保護法》(Personal Data Protection Act 2010, PDPA)修正案,並於同年7月16日經下議院(Dewan Rakyat,馬來語直譯)表決通過。 本次PDPA修正重點包含: 1.設立個資保護官(data protection officer, DPO)制度:強制要求蒐集、處理、利用個資之資料控管者(data controller),及受資料控管者委託而實質處理個資之資料處理者(data processor),均需指派個資保護官。 2.擴張對於敏感性個資(sensitive personal data)定義:與個人身體、生理或行為特徵相關之技術處理所生個資(即生物辨識資料),皆屬之。 3.制訂個資外洩通報制度:強制要求發生個資外洩時須通報個資保護委員會,以及可能受到任何重大損害之個資當事人,惟對於「重大損害」尚未有明確定義。 4.導入資料可攜性:在遵守技術可行性(technical feasibility)與資料格式相容性(data format compatibility)之情境下,允許資料控管者之間在當事人要求下進行資料傳輸。 5.資料處理者的合規遵循義務:舊法僅要求資料控管者須遵守PDPA所規定的安全原則(security principle);新法則擴及要求資料處理者亦有安全原則之合規遵循義務。 6.提高罰則:舊法對於違反個資保護原則者,最高僅得處300,000馬幣和/或2年監禁;新法提高罰則最高得處1,000,000馬幣和/或最高3年監禁。 7.跨境傳輸規範修正:原則允許資料控管者將個資傳輸至馬來西亞以外,惟應採取適當措施確認及確保資料接收方保護個資之水準與馬來西亞個資法程度相當;並將跨境白名單制度調整為黑名單制度,不得傳輸至政府公布黑名單所列地區。 馬來西亞數位部本次修正PDPA,彰顯該國政府對個資保護之重視,惟關於任命個資保護官資格要求、個資外洩通報重大程度標準等細部規範,則仍須待修正案通過後,經個資保護委員會發布相關指引再行釐清。

大學研發成果商業化評估方法初探

美國聯邦通訊委員會開放頻段供固定式之低功率無線通訊設備使用

  歐洲商會在10月26日舉行記者會,公布「2006-2007 年建議書」。該份建議書肯定我政府改善投資環境的努力,但該商會仍然呼籲政府要加速兩岸貿易正常化、強化內部溝通與外部協調,才能提供最完善的國際投資環境。   根據統計,歐盟在台投資大幅躍升,今年更超越美國在台投資總額,居外資在台投資第一位,顯示歐商對於台灣投資環境的重視與信心;政府也有決心繼續鬆綁法規,強化區域整合,以提供完善投資環境。對於歐洲商會建議之重點議題,經建會已對於各項議題作出初步回應,並表示行政院相關機關會積極檢討並持續溝通。   經建會胡勝正主委強調,歐洲商會所關切的議題有些牽涉全面政治環境考量,例如擴大開放大陸商品來台或放寬大陸投資40 %上限等,將請主管機關朝放寬方向為整體性之研議規劃;其至於他屬現行政策可行但未解決問題,經建會將持續協調相關部會,朝開放的方向規劃推動。

韓國「2021年經濟政策」

  韓國財政經濟部(Ministry of Economy and Finance)於2020年12月17日發布「2021年經濟政策」(2021 Economic Policies)。2021年經濟政策中包含兩大重點,分別為因應新型冠狀病毒影響下的不確定性,盡快恢復經濟成長動能,以及推動產業創新與結構轉型,以培植未來的經濟成長動力。政策文件中指出,儘管2020年經濟成長率因疫情影響而表現低迷,但仍期許2021年經濟能夠盡快好轉,改善投資、出口與國內就業。   針對如何盡快恢復經濟成長動能議題,政策文件指出首先應處理因疫情帶來的不確定性,除了維持擴張性財政政策,以增加政府支出刺激總體需求外,在經濟成長與疫情防治間應取得平衡並加強風險管理;其次為透過租稅減免促進消費、擴大投資額度與提供出口融資,以及提供資金以扶植中小企業、提供優惠貸款協助大型企業度過疫情難關、鬆綁法規以發展地方經濟等一連串措施,來達到恢復經濟成長動能的目標。   而在推動產業創新與結構轉型上,將持續投資於5G應用與6G技術的發展上,推動數位經濟與數位政府系統建構,具體措施包含減免投資5G應用貸款稅率2%、籌集投資數位新政基金、完善智慧醫療應用等。此外在扶植新創政策上,則包含建立新興科技實驗場域(K-test bed),以政府採購扶植新興科技、提供商機以及協助銜接海外市場,修正創投法規開放附認股權憑證之低利貸款以引進矽谷創投資金,以及排除可轉換可贖回之債務認定以降低政府研發補助申請門檻等,以有效扶植創新能量成為未來的經濟成長動力。

TOP