合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/28)
引註此篇文章
你可能還會想看
半導體面板設備 進口將免關稅

  工業局預計明年和財政部研商修改海關進口稅則,給予廠商進口國內無產製的半導體、面板設備的關鍵零組件時,免課關稅的優惠,以提升國內兩兆產業自給率,在2008年分別提升至25%和50%的水準。包括奇美、彩晶、華映等面板廠都對提高設備自給率很有興趣。工業局指出,全球面板業市場,已成為我國和韓國互相較勁的局面,韓國目前設備自給率已達40%,並計畫在2008年達到80%水準,但我國面板設備自給率目前只有12%,不但主控權掌握在外國設備廠手裡,利潤也被賺走。如果國內面板廠可以提高設備自給率,可以節省成本30%至50%,獲利將可以大幅提高。   工業局表示,由於我國半導體與平面顯示器兩兆產業在晶圓代工帶動下及筆記型電腦與LCD顯示器的大量需求下持續成長,除產值大幅成長外,在設備需求上,台灣將分別占有15%及40%以上的全球市場,國內每年設備投資總額也將高達2,000億元以上,但是卻有九成以上仰賴進口。除了以租稅減免,提高國內面板及設備業者投入設備研發、生產的誘因外,工業局明年起每年也將投入近億元的經費,以科專計畫、主導性新產品研發補助等,協助國內設備業者提升研發及生產能力。   由於我國已成為全球半導體及面板的重要生產廠商,每年進口設備金額十分龐大,工業局也將運用此優勢,吸引國外大廠來台設立研發中心或與國內設備業者合作,投資生產製程設備。為鼓勵兩兆產業中心廠使用國產設備,對使用國產設備達一定比例之廠商,工業局也將研議相關的獎勵措施。

化學奈米 將改善人類生活

  為勾勒人類未來生活型態,英國將在新堡( New Castle )投入約新台幣 150 億元建立一科學城,預定五年內整合化學、奈米、微機電及醫療技術整合。這座科學城是一座整合科學及產業技術的場所,由業界及政府共同支持,科學城內將成立三大研究機構,分別進行幹細胞研究、老年人健康、分子工程,及環境能源的改善。   英國皇家工程院院士雷蒙奧立佛( Raymond Oliver F.R.Eng )是這座科學城的主要規劃人,他指出,人類生活在下一個 20 年將出現四項結構性的現象:一是人口老化,二是個人化產品的普及,三是智慧型生活空間的出現,四是再生能源出現。面對這四大現象的普及,化工業者可以找到兩個發展方向,一是利用化學來提高醫療生活品質;二是利用化學來創造更自然的智慧型生活空間。   以醫療生活品質而言,化學可以進一步和幹細胞研究結合,並透過奈米技術發展出奈米級醫療電子產品,包括影像攝影取代藥物的人體臨床實驗,或是透過紅外線體外照射,讓硫化鎘等化學藥物能在體內直接殺死癌細胞 ; 在奈米材料方面,雷蒙指出,已有廠商研究出適合老人駕駛的汽車,這類汽車從空調、氣味,到生理資訊的偵測,都能配合老人較易疲勞的體質去設計。

德國於今年四月提出網路執行法修正案以提升平台使用者友善程度

  德國政府於今(2020)年4月提出「網路執行法」(Network Enforcement Act, NetzDG)之修法草案,將要求社群平台業者提供對使用者更為友善的申訴流程,並建立及維護「反通報程序」機制,讓使用者有機會針對其被平台刪除之貼文或評論提出反對意見,並得重新發佈於社群平台上。   德國於2018年1月起正式施行「網路執行法」,針對在德國境內擁有200萬以上使用者之社群平台業者,課予其限時處理平台上不實及不當言論之義務,並須提交其處理平台上相關言論之報告,若平台業者未能有效執行相關規定者將處以罰鍰。該法施行兩年後引發諸多批評與爭議,雖然並未如社會大眾所憂慮的對於網路言論自由造成重大侵害,亦無證據顯示社群平台業者比施行前刪除了更多的使用者評論;然該法僅要求平台業者刪除不實或不當言論,對於被誤刪之言論,卻未有相關事前預防或事後救濟之措施。為試圖改善原法規執行上之困境和兩難,德國政府遂於今年4月提出修法草案。   此次修法主要重點如下: 強化平台使用者權利 倘使用者於平台發佈之評論遭平台刪除者,使用者未來得要求平台重新檢視此決定,平台須依個案處理並向使用者釋明其決定理由,據此,平台業者須引入反通報程序之機制(counter-notification procedure)。 提升申訴管道之使用者友善性 申訴程序須更為使用者友善,即必須讓平台使用者更容易進入與使用。 簡化法院核發命令程序 未來將同步修訂聯邦電視媒體法案(Telemediengestez),以利法院核發命令,要求平台業者公布數據或揭露犯罪者身分。 加強每半年公布之透明報告資訊 平台業者未來在半年報上須特別提供有關反通報程序之申請與結果,並揭露說明用於查找、刪除平台上不實或不當內容的自動化程序;亦須在報告裡聲明是否授權獨立研究機構以科學目的之匿名訪問權限,了解與研析平台上之不實或不當言論是否有特別針對特定群體。   此修正草案係為德國政府打擊網路上右翼極端主義和仇恨犯罪的政策措施一部份,後續除了須修訂NetzDG以外,亦包含刑法、刑事訴訟法、電信法及聯邦刑事警察局法等四部法規之修訂,相關規範修訂是否有助於刑事起訴進而有效打擊平台上的不當言論,尚有待後續觀察。

德國「智慧聯網倡議」

  德國聯邦經濟及能源部於2016年9月1日公布數位議程框架新的經費公告,以支持智慧聯網示範的實施與推廣。德國聯邦政府於2015年9月公布的智慧聯網(Initiative Intelligente Vernetzung)戰略,該戰略實施的4個面向如下:   (1)應用領域的支持:聚焦教育、能源、衛生、交通和管理五大應用領域的數位化和智慧化運用及發展,並排除相關實施障礙; (2)促進合作:促進資通訊技術與五大應用領域間的跨領域溝通與合作; (3)改善框架條件:加強投資環境並消除相關障礙;保護隱私權及加強網路安全;制訂相關標準化作業;提升商品或服務市場競爭力; (4)加強各界參與:促進各界參與及討論,共創及共享經濟利益。德國聯邦政府基於該戰略計劃,提出智慧聯網倡議,及提供開放式創新平台,促進不同領域的合作及整合運用,將有助於產業價值及競爭力的提升,並提高國際間合作的機會。   我國為發展智慧聯網相關產業,曾推出包括「智慧辨識服務推動計畫」、「智慧聯網商區整合示範推動計畫」等相關應用服務整合及解決方案計畫,今年更陸續推出「亞洲‧矽谷推動方案」、「數位國家‧創新經濟發展方案」,藉以提高數位生活服務使用普及率,並以創新驅動產業升級轉型。

TOP