合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/04/13)
引註此篇文章
你可能還會想看
中國最大搜尋引擎簽署知識產權網路侵權協議

  創意產業之發展在中國,具有相當之重要性。在出版物、音樂、電影、電視和遊戲軟件開發等創意相關產業,已占中國GDP 5%以上。2016年4月中國最大的搜尋引擎公司「百度」與國際出版商版權保護聯盟(IPCC)簽署版權保護合作備忘錄。IPCC為多間國際出版公司參與的非營利性組織,由於侵權盜版行為再中國日益嚴重,IPCC積極的向中國國內的網路平台公司洽談合作意願。   中國百度為了減少網路侵權作品的擴散,透過技術在作品原創性、正版與維權上,開發防盜版系統及線上投訴管道。百度公司與IPCC透過定期的資訊交流,除了在版權保護上合作,雙方也將繼續針對搜尋內容之正版化合作,此舉提升百度搜尋引擎在內容上的豐富性,同時也意味著中國在知識產權上更向前了一步。   IPCC除了與百度簽署版權保護協議外,也針對網路上具有侵權之網站應列表與仿冒品之跨境執法問題上提出意見交流。另外在政策面上,針對涉及中國正在進行的著作權修法議題,包括著作權集中授權、藝術家之轉售權、著作權的例外與限制及音樂視聽著作權進行討論。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

紐西蘭隱私專員辦公室「揭露涉及隱私案件之機關名稱」政策生效

  紐西蘭隱私專員辦公室日前針對「是否及如何揭露涉及隱私案件之機關(公務機關或非公務機關)名稱」發布政策;該政策自2014年12月1日起生效。   根據紐西蘭1993年隱私法的規定,隱私專員可決定公開有助於貫徹隱私法立法意旨的資訊等;只要符合此規定,原則上隱私專員也可揭露涉及所調查隱私案件之機關名稱。據此,紐西蘭隱私專員辦公室即於日前針對是否及如何揭露上述機關名稱制定並公布政策。   須說明的是,即使機關確有違法情事,其名稱亦不必然會被揭露,如果有法律上原因或有理由認定不適揭露時,則隱私專員將不會簽署授權揭露之文件。   根據該政策,如機關違反隱私法之行為將導致難以回復之損害、其行為將導致嚴重之後果、該機關被認定為故意違反法律、揭露機關名稱有利於公益,或存在不揭露機關名稱將導致同領域、產業之其他機關受到不合理之牽連或不利益等情形時,則違反機關之名稱較可能被揭露。反之,如果僅屬單一事件、機關之行為較不至於致不利影響,或存在揭露機關名稱反不利於公益等情形時,則機關名稱則較可能不會被揭露。

FCC提出推動10年國家寬頻計畫

  2009年2月美國總統歐巴馬簽署美國振興經濟方案,釋出72億美元擴展寬頻網路連結應用,以網路開放為前提,要求聯邦通訊委員會提出國家寬頻計劃。美國聯邦通訊委員會(FCC )在2010年3月12日公布將推動一項歷時十年的遠大計畫,希望透過建立高速網際網路,重塑美國媒體與科技優先順序的概念。該計畫預定2010年3月16日送交國會。   這項計畫反映美國正視寬頻網路正逐漸成為取代電話與廣播電視業的普通媒介,工作重點在於強化網際網路存取方便性。該項計畫的重點包括補助網際網路提供者佈建偏遠地區的網路服務、拍賣頻譜以供無線寬頻設備使用,以及發展新型態的有線電視與上網功能之全面式機上盒。   此一計畫牽涉數百億美元的聯邦經費,但FCC認為,應可透過拍賣頻譜自給自足。此外,該計畫中的部分建議,尚須國會採取行動與業者支持才能落實,至於使用者恐怕要在數年後才能看到效果。   目前美國在使用寬頻與高速上網等方面落後包括亞洲國家在內的許多國家,約超過30%的美國人無法上網,原因是負擔不起或是沒有意願使用。而FCC的計畫希望能將美國打造成一個完全網路連結的環境,透過還有待矽谷研發的無線裝置讓民眾能快速上網取得健保資訊、進行網路學習,以及進行警民連線。   不過,FCC必須審慎處理既有業者上網費率與品質的問題,此外,不少電視業者以供公眾利益為由反對,並抗拒交回頻譜,以及認為這樣計畫將會導致訊號覆蓋及干擾的問題。

美國商務部、財政部以及司法部發布遵循美國出口管制與制裁規範聯合指引

美國商務部(Department of Commerce)、財政部(Department of Treasury)以及司法部(Department of Justice)於2024年3月6日發布出口管制與制裁法令遵循指引,以避免邪惡政權(malign regimes)與其他不法人士試圖濫用商業與金融管道,取得有危害美國國家安全與外交政策利益、全球和平與繁榮風險的貨品、技術以及服務,特別提供「非美國公司」(non-U.S. companies),降低相關風險的遵循指引。 該指引分享3則違反制裁法規的案例,重點如下: (1)某家總部位於澳洲的國際貨運代理和物流公司,運送貨品至北韓、伊朗以及敘利亞(皆為被制裁之目的地),且透過美國金融系統發起或收受交易款項,導致美國金融機構與被制裁之對象交易,並向受制裁的司法管轄區輸出金融服務。該公司最終繳納6,131,855美元罰款。 (2)某阿聯酋公司與杜拜以及伊朗公司共謀,透過在出口文件中將一家杜拜公司錯誤地列為最終使用人,然後從一家美國公司出口「儲槽清洗裝置」(storage tank cleaning units)到伊朗,構成違反出口管制規定行為。後與主管機關達成行政和解,繳納415,695美元罰款。 (3)某家總部位於瑞典的國際金融機構的子公司,因其客戶從被制裁的司法管轄區的IP位址,使用子公司的網路銀行平台,透過美國代理銀行向位於被制裁司法管轄區的交易對象付款,因此繳納3,430,900美元罰款。

TOP