合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/07/02)
引註此篇文章
你可能還會想看
為降低奈米材料風險以保障健康安全,美國環保署(EPA)擬公佈一系列相關新規範

  為了致力於確保及避免因特定奈米材料的曝露而不經意對環境、健康與安全(Environmental, Health and Safety,簡稱EHS)帶來潛在危害,美國環保署(Environmental Protection Agency,簡稱EPA)預計將於今(2011)年1月針對奈米材料的管理規範公佈三項新規定,此舉將使得EPA更能對於目前既有與未來新興奈米材料上有更充分的管理空間,同時這三項新規定也將接受來自公眾與各界人士的意見評論。   這三項新規定分別與顯著新用途規則(Significant New Use Rule)、試驗規則(Testing Rule)和資料收集規則(Data Collection Rule)有關。首先,就顯著新用途規則而言,多年來相關倡議團體(advocacy group)請求EPA將既有的奈米材料視為是「毒性物質管理法」(Toxic Substances Control Act,簡稱TSCA)下的顯著新用途,依此EPA將可管理奈米銀、奈米級二氧化鈦、奈米級氧化鋅等材料,亦可因此對要求廠商限制產量、採取勞工安全措施、進行毒性測試,並要求廠商不得故意將奈米材料釋出或排放至環境中。雖然現在尚無法確知詳細法令規定,但已知EPA有意透過TSCA第5條處理上述種種問題,其可能作法為奈米材料將不再受既有化學物質並非顯著新用途的限制,而任何以既有化學物質製成的新型奈米材料將被視為是顯著新用途。   其次,則是試驗規則,目前EPA對於特定奈米材料要求進行90日呼吸毒性試驗,而新規定將在TSCA第4條之下,要求對奈米粘土、奈米氧化鋁、奈米管等也進行相同的試驗。此係由於目前在經濟合作開發組織(Organization of Economic Cooperation and Development,簡稱OECD)主導的毒性試驗計畫之下,仍未有其他國家願意主導奈米黏土、奈米氧化鋁的試驗,以及通常90日呼吸毒性測試所費不貲,故未來美國預計率先投入,各界亦期盼EPA所提出的新規定將准予廠商以合作提出申請,以利於降低成本並落實相關試驗。   此外,資料收集規則將要求廠商必須正式遞交相關奈米材料的EHS資料,以供EPA進行評估審查,故新規定將在TSCA第8條之下,將原先EPA「奈米材料管理計畫」(Nanoscale Materials Stewardship Program,簡稱NMSP)的自願性參與改為強制性的資料收集,然而由於TSCA中規定對於僅使用少量奈米材料或作為研究目的者,可申請免除資料收集,故廠商仍可依此排除此一義務。   綜合以上,使用相關奈米材料的廠商應密切觀察未來三項新規定的發展動向,以確定日後如何遵守EPA的相關法令規定,落實風險管控,保障自身權益。

中國大陸發明專利申請量已躍居世界第四位

  中國知識產權局局長田力普在「2006 年中國保護知識產權高層論壇」上表示,2005 年中國發明專利申請量居世界第四位,成為世界第十大申請國,在發展中國家排名第二。   不過,雖然中國大陸知識產權制度實施二十年來成績顯著,但是中國大陸自行研發的能力仍有待提昇。因為,2005 年中國大陸發明專利申請十七萬餘件中有近五成來自外國,而來自獨資、合資等三資企業只佔了大約六分之一。若從申請發明專利的技術程度觀察,外國人發明專利申請案集中在高科技的技術領域,而中國國內發明多集中在一般技術領域。   對照 2005 年大陸的中央企業研發投入額佔當年銷售收入的比重平均為 1.5% ,相較先進國家大型企業一般不低於銷售收入 5% 的研發費用,差距甚遠。事實上,大陸央企擁有的所有專利總數已達30520項,但這數字還不及日本佳能企業的一半。因此,大陸國資委主任李榮融表示,在中央企業負責人業績考核體系中,國資委將會加大科技投入和創新能力建設的考核力度。

自動駕駛車輛之分級與責任

  所謂自動駕駛(autopilot),原來是指一個用來控制載具軌道而無需人工一直干預的系統,亦即無須人類持續干預,但人類仍須於關鍵時刻介入進行決定或作為,此時機器僅作為輔助。   而自動駕駛汽車或稱全自動駕駛,則只完全無須人類干預,由機器自動感應偵測,自動做成決策控制車輛行駛。故由人類的介入程度區別究竟是駕駛輔助或自動駕駛。美國國家公路交通安全管理局(NHTSA)於2016年已提出正式的分類系統,除手動駕駛(0級)外,區分弱駕駛輔助(1級)、部分自動駕駛(2級)、有條件全自動(3級)、高度/完全自動化(4級)不同程度的自動駕駛。其他國家如德國,在聯邦政府的「自動駕駛圓桌會議」也對自動駕駛有類似的四等級區分。   德國聯邦政府也在於2017年1月25日提出規範自動駕駛之法律草案,亦即道路交通法修正法(Änderung des Straßenverkehrsgesetzes),核心在於賦予電腦與人類駕駛者法律上同等地位。亦即,駕駛人的定義未來擴張延伸到「使用不同程度自動駕駛系統者」。根據草案將來在車輛行駛中,人類可以在特定時間與特定狀況下接管整個行駛。而最重要的修正:人類始終應該負使用電腦的最終責任。   故在行駛中駕駛人將會被輔助機器替代,更要求自駕系統應該具備“隨時可以由駕駛人接手操控或停俥”的功能。 分類中,駕駛人的角色只有到全自動駕駛實現時才退場,屆時才會發生無駕駛人只有乘客的狀況。   修法也重視自駕技術失敗並導致事故所生責任分擔的問題。對於責任的調查將採用如同飛航安全中之「黑盒子」的方式,該裝置會記錄行駛中的所有基本資料。這將有助於發生事故後澄清,查明究竟是技術上原因、製造商或駕駛員的過失,以確保駕駛人無法將責任全部推給自動化系統的故障。

美國參議院於2022年4月提出《演算法問責法案》對演算法治理再次進行立法嘗試

  《演算法問責法案》(Algorithmic Accountability Act)於2022年4月由美國參議院提出,此法案係以2019年版本為基礎,對演算法(algorithm)之專業性與細節性事項建立更完善之規範。法案以提升自動化決策系統(automated decision systems, ADS)之透明度與公平性為目的,授權聯邦貿易委員會(Federal Trade Commission, FTC)制定法規,並要求其管轄範圍內之公司,須就對消費者生活產生重大影響之自動化決策系統進行影響評估,公司亦須將評估結果做成摘要報告。   《演算法問責法案》之規範主體包括:(1)公司連續三年平均營業額達5000萬美元,或股權價值超過2.5億美元者,並處理或控制之個人資料超過100萬人次;以及(2)公司過去三年內,財務規模至少為前者之十分之一,且部署演算法開發以供前者實施或使用者。ADS影響評估應檢視之內容包括:   1.對決策過程進行描述,比較分析其利益、需求與預期用途;   2.識別並描述與利害關係人之協商及其建議;   3.對隱私風險和加強措施,進行持續性測試與評估;   4.記錄方法、指標、合適資料集以及成功執行之條件;   5.對執行測試和部署條件,進行持續性測試與評估(含不同群體);   6.對代理商提供風險和實踐方式之支援與培訓;   7.評估限制使用自動化決策系統之必要性,並納入產品或其使用條款;   8.維護用於開發、測試、維護自動化決策系統之資料集和其他資訊之紀錄;   9.自透明度的角度評估消費者之權利;   10.以結構化方式識別可能的不利影響,並評估緩解策略;   11.描述開發、測試和部署過程之紀錄;   12.確定得以改進自動化決策系統之能力、工具、標準、資料集,或其他必要或有益的資源;   13.無法遵守上述任一項要求者,應附理由說明之;   14.執行並記錄其他FTC 認為合適的研究和評估。   當公司違反《演算法問責法案》及其相關法規有不正當或欺騙性行為或做法時,將被視為違反《聯邦貿易委員會法》(Federal Trade Commission Act)規定之不公平或欺騙性行為,FTC應依《聯邦貿易委員會法》之規定予以處罰。此法案就使用ADS之企業應進行之影響評估訂有基礎框架,或可作為我國演算法治理與人工智慧應用相關法制或政策措施之參酌對象,值得持續追蹤。

TOP