合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=0&tp=1 (最後瀏覽日:2025/04/05)
引註此篇文章
你可能還會想看
FCC發布命令以保護電話中繼服務基金

  科技為民眾帶來溝通的便利性,卻因不夠人性化,常使身心障礙人士無法享受無遠弗屆的服務。因此,為了使身障者易於與他人溝通,FCC推動電信轉接服務( (Interstate Telecommunications Relay Service),讓通訊科技更易於使用。藉由電話中繼服務基金(Interstate Telecommunications Relay Service Fund)的支持,提供文字電話轉接(Text Telephone) 、語音轉語音(Speech-to-Speech)、電話字幕服務(Captioned Telephone Service)、視訊轉接服務(VideoRelay Service)與網路轉接字幕電話服務( Internet Protocol Captioned Telephone Service,下述簡稱IPCTS),協助聽障、語言障礙民眾得以享有電信服務。   但是,近幾個月來,FCC發現電信商要求IPCTS的補助與日俱增,從2012年6月起,每個月成長約11%,且導致10月時面臨請求總支出超過預算4百萬美元之危機。為了解決電話中繼服務基金(Interstate Telecommunications Relay Service Fund)面臨嚴重資金不足的威脅,FCC在2013年01月25日公佈FCC 13-13法規制定建議通知(Notice of Proposed Rulemaking),希望藉由下述規定,短暫性解決民眾過度、不當取得服務之問題: 1.禁止推薦獎勵計畫:禁止業者給予獎勵、回報的方式,鼓勵民眾使用網路轉接字幕電話服務。 2.供應商提供IPCTS服務,需符合三要件,方可取得補助: ‧ 每位使用者均需登記方能取得服務。 ‧ 供應商需取得用戶自我認證,才能完成註冊程序。 ‧ 使用者並非使用從政府計畫中取得IPCTS設備,而其設備卻低於75美元時,供應商需從使用者取得公正第三方證明。 3.供應商提供設備與軟體,必須於每通電話完成後,可以自動關閉。亦即消費者每次使用時,均需經過開啟的步驟,以保護隱私。   在FCC適度處理IPCTS不當使用後,可以預見電話中繼服務基金更能發揮所需,此舉不僅使科技更貼近於大眾、減少溝通障礙外,更可落實普世價值,使美國社會福利更加完善。

英國推動「公共緊急警報:行動通訊預警試驗」實證服務

  為試驗導入智慧防救災各項新興技術與機制,英國國民緊急事務秘書處 (Civil Contingencies Secretariat, CCS) 於2013年秋天分別對北約克郡 (North Yorkshire)、格拉斯哥 (Glasgow) 和薩福克郡 (Suffolk) 三地區進行共三次的「公共緊急警報:行動通訊預警試驗」(Public emergency alerts: mobile alerting trial)。由於英國已有92%民眾具有行動電話,並以隨時得接收訊息為出發點,進行有別於傳統預警系統之公共緊急預警系統試驗。此試驗由國民緊急事務秘書處與O2、Vodafone和EE三間行動網路業者 (mobile network operators) 和地方政府應變單位合作,雖係以行動電話為試驗主軸,但試驗重點則以政府或地方政府應變單位「不知道」民眾個人電話,亦不要求民眾簽署才能取得此次試驗訊息為主。   此三次試驗手段有二,包括「小型區域廣播服務」 (cell Broadcast service, CBS),係以單點對多點發送緊急簡訊,以及「以地區為基礎的簡訊」 (location-based SMS messaging),以群組方式發送簡訊至指定地區用戶,二種發佈緊急訊息的方法為試驗。   北約克郡 (North Yorkshire)主要與EE進行發送緊急水災警報系統,對於廣播訊息發送的時間或調整時間長短以供傳送「泡沫警報」(表訊息多寡)到地域寬廣或數個地區而言,是有效的手段。格拉斯哥 (Glasgow)地區為蘇格蘭最大城市,與O2業者進行最大型的試驗,發送數千緊急訊息給民眾。而薩福克郡(Suffolk)則是由於該區不僅於市中心具兩個火車站,遊客也眾多,因此試驗場域以住商混合住宅區及處於該區的人民為主。除小型區域廣播服務和以地區為基礎的簡訊外,薩福克郡也與社交網路Twitter合作,共傳送三種訊息試驗。   透過上述試驗,公共緊急警報:行動通訊預警試驗計畫報告也提出針對隱私與對於電信服務業者於災害發生當下之通訊服務義務未來應制訂相關規範,以及應統一發送訊息之通訊警報協定標準等建議。

英國通訊傳播管理局發表「開放通訊:使人們能夠透過創新服務共享資料」,提供通訊業者建立開放通訊(Open Communications)之原則建議

  英國通訊傳播管理局(The Office of Communications, Ofcom)於2020年8月發布「開放通訊:使人們能夠透過創新服務共享資料」(Open Communications: Enabling people to share data with innovative services),針對開放通訊的設計原理提出七點建議: 應盡可能讓符合條件的第三方能夠近用(access)資料,同時確保用戶受到保護。 應提供客戶一些目前無法取得的資料,例如有關網路服務品質的體驗報告,以提供使用者做為未來交易時之參考。 資料的提供商和第三方必須確保資料儲存和傳輸的安全性。 第三方將如何使用有關客戶的資料及是否含有潛在風險等,皆應清楚透明地告知使用者,並且讓共享資料之使用者仍保有控制權限。 開放通訊服務之設計應符合包容性設計(inclusive design),提高使用者使用意願。 開放通訊仍應維持市場競爭。 提供資料所需的成本應與資料開放的潛在收益成比例。原則上,參與開放通訊的通訊提供者越多,對個人和小型企業的整體價值就越高。惟,若是強制要求用戶數少或是無法承擔該技術的小型提供商加入,可能導致成本與收益不成比例。   除此之外,對於應開放何種資料則須循序漸進。除了增加對第三方客戶資料近用權限之外,首先,應針對開放對資料提供者風險低,但對潛在用戶有較高利益的資料,例如:不包含個人訊息的資料,從而降低匿名化過程中所產生之風險;第二,開放低風險的地理空間資料(geospatial data),目的在於改善該地區的整體地理空間資料基礎架構。最後才是開放有關各種通訊產品中的其他資料,以促進消費者的選擇和保護。   綜上所述,考慮到開放通訊之可行性,需進一步與其他資料可攜性計劃的主要代表進行會談(如銀行業者),尋求各行業主要服務提供商的支持。再者,考慮是否訂定相關法律以及如何進行監管。第三,應標準化客戶資料,以及確保資料移動之安全性及用戶控制權限,最後則是降低資料開放之成本,以達成開放通訊所帶來之效益。

日本空中工業革命新進展:無人機變身空中郵差

  日本政府曾於2017年6月9日閣議公布之《未來投資戰略2017》(未来投資戦略2017),以及5月19日「小型無人飛行載具相關部會連絡會議」(小型無人機に関する関係府省庁連絡会議)公布之《空中工業革命時程表》(空の産業革命に向けたロートマッフ)中,提出「2018年運用於山間地區運送貨物、2020年可正式在都市內安全運送貨物」之目標。故國土交通省與經濟產業省於同年10月4日共同設立「無人飛行載具於目視範圍外及第三者上空等飛行檢討會」(無人航空機の目視外及び第三者上空等での飛行に関する検討会),並於2018年9月18日公布《無人飛行載具運送貨物自主指引》(無人航空機による荷物配送を行う際の自主ガイドライン,以下稱「本指引」)。本指引目的係制定安全運輸貨物所應遵守事項、提高社會對無人機運送貨物之信賴,以求提升運輸效率、節省人力成本。適用對象為非屬航空法第132條規定須申請許可之空域,但於目視範圍外飛行並運送貨物之無人機。   本指引公布後,國土交通省與環境省於相關提案中選出5個人口非密集區,以進行之無人機運輸貨物(ドローン物流)實驗。首先,在2018年10月22日長野縣白馬村,無人機自海拔1500公尺處運送最重達8公斤的食品至海拔1850公尺處的山莊,單程耗時6分鐘,共往返3次,皆無發生明顯失誤。日本郵政之提案則在同年11月7日,從福島縣小高郵局成功運抵位於南方約9公里處的浪江郵局,耗時16分鐘。本次實驗係首次成功於目視範圍外運輸物品,實驗途中均未設置監看人員,僅以電腦掌握兩地衛星定位資訊,並監看無人機上搭載相機傳回的畫面。日本郵政計畫未來1年內,每個月將有6天以無人機運送2公斤內的傳單等物品。國土交通省與環境省計畫於年底前完成另外3個地區的實驗,並統整結果驗證是否能解決山間等人口非密集區,因貨物乘載率低而運輸效率低落,以及降低排碳量等課題。

TOP