合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/15)
引註此篇文章
你可能還會想看
智慧城市-美國最新政策發展

  美國政府在2015年9月14日發布,將投入超過1.6億美元(約台幣50億元)於新的「智慧城市計畫」(Smart Cities Initiative)。透過中央政府的研究,以及全美國超過二十個城市的合作,來共同著手城市主要面臨的問題,包含:減緩交通阻塞、對抗犯罪問題、促進經濟成長、對於氣候變遷影響的管理、改善城市服務的遞送問題等。此戰略主要有四個策略方案:(一)創造「智慧聯網」應用的試驗平台,並發展新的多部門合作模式;(二)致力於城市科技相關的活動,並打造城市之間的合作;(三)善用現有的中央政府資源;(四)追求國際間合作。   而在十月份,美國白宮公佈由國家經濟委員會(National Economic Council)與國家科學與技術政策辦公室(Office of Science and Technology Policy)共同完成的「美國創新戰略」(A Strategy for American Innovation)中,明確地指出美國國家的突破重點領域為:解決國家及全球性的挑戰(Tackling Grand Challenges)、精密醫療、健康照護、先進的運輸工具、智慧城市、乾淨能源與能源效率、教育科技等面向。此戰略報告係延續美國白宮於2011年,由相同組織單位所完成的「美國創新戰略-確保經濟發展與繁榮」(A Strategy for American Innovation – Securing Our Economic Growth and Prosperity),其中列舉出國家的目標政策為:能源改革、生物科技、太空探索、醫療健康與教育科技。相較下,十月份甫公佈的美國「創新戰略」則更明確的將「智慧城市」之發展設為重點政策。   美國政府將投入協助芝加哥(Chicago)「科技計畫」(Tech Plan)中的子計畫-「城市感測器專案」(Array of Things, AoT),發展當地下一代智慧聯網的基礎設施,包括運用內建Wi-Fi的感測器裝置路燈,使其能夠有照明的基本功能外,還能蒐集諸如人潮流量、天氣、濕度、空氣品質、亮度、聲音大小等數據。   在此戰略推動之下,美國主要之智慧城市發展的實例,如匹茲堡(Pittsburgh)的前導計畫(pilot project),係藉由交通網絡之間的交通號誌整合,得以優化地區性的交通吞吐量,讓平均降低將近百分之二十五的交通時間。另外,在肯塔基州(Kentucky)的最大城市-路易斯維爾(Louisville),利用具有感測功能之哮喘吸入器所蒐集的資料,統整出哮喘發生的「熱點」,以及空氣品質等級等其他環境因素,作為該州政府政策制定參考依據。

美國FCC發布新廣電事業所有權限制規則的法規制定建議通知

  美國FCC在2011年12月22日發布了新廣電事業所有權限制規則的法規制定建議通知(Notice of proposed rulemaking, NPRM),進一步降低包括高功率無線電視台、廣播電台等地區性媒體集中、全國無線電視網所有權集中、以及地區性報社與無線電視台的跨媒體集中之管制密度。   廣電事業所有權限制規則自2000年之後歷經多次修正與涉訟,FCC於2003年的修正,於遭到2004年遭到聯邦第三巡迴法院的部份廢棄;2007年與2008年的修正,亦同樣遭到同法院的部份廢棄。而FCC在經2010年的四年一度檢視、並委託外界研究之後,再於此次進行修正、並諮詢各界。   FCC認為,寬頻網路確實使消費者轉向網路或行動平台接收新內容與影音節目,也連帶使媒體市場結構大幅變化。但新媒體目前尚未如傳統媒體般無所不在,主因是美國寬頻上網仍未普及,寬頻普及率僅70%;並有1400萬人無法接取寬頻基礎設施。而線上影音串流或下載節目皆要求最小寬頻頻寬,阻礙了新媒體的普及,因此廣電事業所有權限制規則對於維護競爭、在地化、多樣性、與保障少數族群、身心障礙者和女性的政策目標上,仍有存在必要。   此次NPRM重點如下: 1、維持地區無線電視所有權限制規則(Local Television Ownership Rule); 2、維持地區報社/地區無線電視跨媒體所有權限制規則(Newspaper/Broadcast Cross-Ownership Rule); 3、因既有地區無線電視、地區廣播所有權限制規則已足夠維護政策目標,廢除地區廣播電台/地區無線電視台跨媒體所有權限制規則(Radio/Television Cross-Ownership Rule); 4、維持複數全國無線電視網所有權限制規則(Dual Network Rule); 新訂少數族群與女性所有權保障規範。

Sir Tim Berners-Lee呼籲,開放政府資料(Open Government Data)的持續發展需要政府兌現其承諾

  開放政府資料(Open Government Data)從2009年美國發起開放政府倡議開始,在全球颳起一陣的旋風,主張公民享有政府資料的權利。這開放資料的浪潮,在2013年由G8工業國簽署開放政府資料憲章(Open Data Charter),約定將以開放為預設(open by default)推動開放政府資料,承諾致力於開放公部門資料、以不收取費用,並採用可再利用格式提供。隨後,G20工業經濟體於2014年跟進,以推動開放政府資料做為反貪腐的利器;聯合國也同時認知,現時亟需資料革命(Data Revolution)以做為實現全球發展的目標。   然而,依據網際網路基金會(World Wide Web Foundation)繼2013年所發布的Open Data Barometer(第一版),於2015年1月再度發布Open Data Barometer(第二版),以開放政府資料的整備、落實、與影響程度三大要素,來檢視與評估86個國家於2014年間對於開政府資料推動的狀況,結果發現仍有90%的資料還是閉鎖在政府機關。   從在資料內容方面來看,僅8%的國家採用開放格式與開放授權釋出核心資料,例如政府預算支出、公共服務執行資料集等,大部分國家仍未真正釋出多數核心資料集,不然就是雖已釋出但卻很難使用;更不用提用得以打擊貪腐和促進公平競爭的資料,如公司註冊、政府契約、土地所有權資料等。在法制與政策規範面,僅17%的國家具有公民對於資料主張權利(the right to information)的相關法制,大多數國家尚未以法律或政策做為課與機關主動積極(proactive)釋出資料的義務(mandated)、實現公民對於資料主張權利的依據,而且多數國家在開放政府資料的規範與程序上,對於個資隱私的保護仍然不足,或仍處於非常不確定的狀態。   為確保資料革命達成通透度和政府的性能,Open Data Barometer研究報告提出下列關鍵步驟,提供各國政府參採: ‧由政府高層承諾將主動積極釋出公部門資料,尤其是得促進問責(accountability)的關鍵資料 ‧持續投入支援與提供培訓,使多數公民社會與企業理解與有效率地使用資料 ‧因應各國需求開發開放資料的工具和方法,例如於在識字率較低的國家,採用視覺化方式呈現資料 ‧支持地方層級開放資料的倡議,以補強國家層級開放政府資料的方案 ‧進行法規調適,以確保公民對於資料主張權利,並於開放資料倡議中加強對於個資隱私保護的基礎   網路發明者與網路基金會創始人Sir Tim Berners-Lee依Open Data Barometer的調查結果,批評政府仍持續迴避開放可用於增強問責與信任的資料,並強調開放資料的強大力量,在於資訊的權利還給公民。 備註: Open Data Barometer群組排名如下: 已開發國家 新興市場國家 開發中國家 1)英國 21)巴西 36)印尼 2)美國 22)墨西哥 39)印度 3)瑞典 33)匈牙利 46)迦納 4)紐西蘭 33)秘魯 46)盧安達 4)法國 36)阿根廷 49)肯亞

透過澳洲eBay交易須納10%商品及服務稅

  澳洲政府規定進行交易必須繳納 10% 的商品及服務稅 (Goods and Services Tax) ,透過澳洲 eBay 所進行的交易亦然。然而澳洲 eBay 業者並未修改其服務條款,強制賣方明列成功得標價須課徵 10% 稅款之資訊,因此許多得標者抱怨他們未被告知必須多付 10% 的稅,亦有些賣家抱怨其他賣家因未將價格加上 10% 的稅款,所以造成商品價格較便宜的假象。為杜絕前述問題,澳洲 eBay 已修改其服務條款,因此,自 6 月 13 日起澳洲 eBay 賣家須將 10% 的商品及服務稅納入交易金額或立即購買價 (Buy It Now price) 中。

TOP