合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/02/16)
引註此篇文章
你可能還會想看
日本著作權法修正促進人工智慧開發

  2018年5月18日,於第196次參議院會議中通過「著作權法」修正案,並於5月25日公布,預計於2019年1月1日施行。本次修正是為因應數位網路技術的發展,對需要著作權人同意的行為範圍進行檢視。其中第47條之7修正、及新增之第30條之4與第47條之5與人工智慧發展有重大相關。   日本著作權法於2009年的修正中,增加第47條之7規定,原本可能構成著作權侵害之資料分析、機器學習行為(未經原作者同意複製、改作),只要在必要限度內,不分是否有營利,皆無須權利人同意。然而本條在使用上因為未涵蓋成果物的讓與行為,也就是如果公開販售學習完成的資料集或是人工智慧模型,甚至於同一平台共享資料集都可以構成侵害。有鑑於此,才在本次修法中修正相關條文。   本次修正中,增加第30條之4規範於必要限度內可利用他人著作物的行為,其中在同條第二款中認可第47條之5第1項第2款之行為,也就是「利用電子計算機的情報解析及提供其結果」,亦可被認為不違反著作權法,因而補上原本第47條之7的漏洞。   惟須注意的是,所謂的必要限度還是有嚴格的比例限制,不能無限制使用。由於目前本次修正還尚未生效,未來對人工智慧發展的應用會產生什麼樣的實際影響,值得繼續觀察。

美國FCC新機上盒管制措施正式生效

  美國聯邦通訊委員會(Federal Communications Commission)於1998年要求有線電視業者將條件式接取(conditional access, CA)元件與機上盒的基本瀏覽設備分離;並於2003年採用CableCARD做為共通標準,希望藉由此「機卡分離」措施,達成有線電視服務層與設備層的結構分離,為設備層導入競爭與投資,以促進機上盒之功能創新與降低價格。   惟本措施2007年實施以來,因CableCARD安裝程序複雜、有線業者與機上盒製造商態度消極,致實行成效不彰。絕大多數的民眾仍未自購市售機上盒;且租用有線業者所提供機上盒者,大多未安裝CableCARD。   FCC故於2010年底發佈新命令,希望弭平有線訂戶租用與自購機上盒之落差;本命令於2011年8月生效,FCC表示將「嚴格執行」以下八項政策。有線業者應: (1)提供零售機上盒相容性之精確資訊; (2)提供非租用機上盒之訂戶同等的頻道套餐折扣; (3)無論租用或自購機上盒,CableCARD之價格必須一致,且明確揭露費用; (4)不得因租用或自購機上盒而行費率之差別待遇; (5)允許訂戶自行安裝CableCARD; (6)專業安裝人員必須到府完整安裝CableCARD; (7)提供具多重串流(multi-stream)效能之CableCARD; (8)確保得以收視所有的線性(linear)頻道。

英國Ofcom針對明年度BT Openreach線路批發價格提出諮詢文件

  英國通訊管理局Ofcom近日(2008/12/5)對於英國電信(British Telecommunications, BT)的網路部門Openreach,針對全迴路(fully unbundled line)、分享式迴路(Shared unbundled line)、住宅批發線路出租(Residential wholesale line rental)、商用批發線路出租(Business wholesale line rental)等等接取服務的批發價格提出諮詢文件。   Openreach是Ofcom基於管制需求要求BT所單獨成立的一個網路部門,主要業務為批發電信服務給通信供應商。自2006年成立後至今,原細分化出租之電路線路從123,000 條提升到超過五百萬條,透過批發接取服務的競爭,直接刺激零售電信服務市場的競爭,使消費者有更多的服務選擇以及更物有所值。   除了諮詢批發價格之外,Ofcom在該文件中提及對Openreach的批發服務設立價格上限。之前的批發價格並不包含因每年的通貨膨脹率所進行的調整或修改,在本次文件中則認為通貨膨脹確實會影響Openreach的成本,現在則應如實的反映這樣的調動。Ofcom認為,新的價格將可帶來持續性的寬頻及語音市場競爭,且可以確保Openreach有適當的誘因繼續投資新的建設。   Ofcom在諮詢文件中對於2009年10月後的年度批發價格:全迴路:85.00英鎊 ~ 91.00英鎊(目前是81.69英鎊);分享式迴路:15.60英鎊 ~ 16.20 (目前是15.60英鎊);商用批發線路出租:106.00 ~ 110.00英鎊(110英鎊);住宅批發線路出租:100.68英鎊 ~ 104.40英鎊(目前是100.68英鎊);而其他相關費用調整,依據其成本適時增加。   在諮詢各界意見後,Ofcom預計在2009年4月確定新的批發價格。

歐盟執委會發布「再生能源:歐洲能源市場的重要角色」產業推動報告

  歐盟執委會於2009年4月23日發布再生能源指令(DIRECTIVE 2009/28/EC),目標在2020年達成20%的再生能源利用;並於2011年1月31日發布「再生能源:邁向2020目標」(Renewable Energy: Progressing towards the 2020 target)通訊報告,檢視歐洲再生能源產業概況及所面對的挑戰,透過與「歐洲及國家再生能源領域之財務檢視」(Review of European and national financing of renewable energy in accordance with Article 23(7) of Directive 2009/28/EC)、「運輸領域使用生質燃料及其他再生燃料的發展及技術評估」(Recent progress in developing renewable energy sources and technical evaluation of the use of biofuels and other renewable fuels in transport in accordance with Article 3 of Directive 2001/77/EC and Article 4(2) of Directive 2003/30/EC)及「生質燃料及生質燃油永續計畫報告」(Report on the operation of the mass balance verification method for the biofuels and bioliquids sustainability scheme in accordance with Article 18(2) of Directive 2009/28/EC)等三份報告的結合,瞭解再生能源領域發展所須的支出、確保其品質、運用最有效率及最具經濟效益的手段,架構歐洲再生能源利用之2020年目標。   為達此一目標,各會員國自行採取相關措施加以推動,每年投入的資金呈倍數的成長;然在2020年之後,卻未見相關政策規劃。為持續發展再生能源,執委會於2012年6月6日發布「再生能源:歐洲能源市場的重要角色」(Renewable Energy: a major player in the European energy market)通訊報告,呼籲各會員國在相關計畫的建立與改革採取更協調一致的措施,提升會員國間再生能源的交易,並探討2020年之後再生能源的發展框架。此一通訊報告包含兩部分:第一、為達2020年的再生能源發展目標,指出四個須加速推動的領域;第二、開始思考2020年後之規劃框架。   針對應加速推動以達成2020年發展目標的四大領域,包括(1)能源市場、(2)支援計畫(support schemes)、(3)合作機制、(4)地中海區能源合作計畫。歐盟執委會堅持達成境內能源市場的整合,並認為有必要提供投資獎勵,以順利進行。對於相關支援計畫,應鼓勵降低成本並避免過度補貼;由於支援計畫多由各國政府主導,而各國可能有缺乏透明度、突然終止、甚至補助差異,造成市場運作模式的阻礙,因此執委會呼籲透過跨國的合作來解決。此外,執委會鼓勵增加合作機制,使會員國間能透過再生能源的交易、降低成本,以達成再生能源利用目標。針對地中海區的能源合作計畫,執委會建議改善其管理框架,並著重於整合馬格里布地區(Maghreb)的市場,將有助於大規模投資,進口再生能源電力。   針對2020年後之發展,則應兼顧創新與降低成本,促進對再生能源的投資。依據歐洲「2050能源路徑圖」(Energy Roadmap 2050)之規劃,開始探討邁向2030的發展策略,主要仍以溫室氣體排放、再生能源及能源效率為政策目標。執委會強調,儘速確定2030年的發展規劃至關重要,此規劃並應使再生能源業者在能源市場上提升其競爭力。

TOP