合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/03/31)
引註此篇文章
你可能還會想看
歐盟執委會通過關於《人工智慧責任指令》之立法提案

  歐盟執委會(European Commission)於2022年9月28日通過《人工智慧責任指令》(AI Liability Directive)之立法提案,以補充2021年4月通過之《人工智慧法》草案(Artificial Intelligence Act)。鑑於人工智慧產品之不透明性、複雜性且具自主行為等多項特徵,受損害者往往難以舉證並獲得因人工智慧所造成之損害賠償,《人工智慧責任指令》立法提案即為促使因人工智慧而受有損害者,得以更容易獲得賠償,並減輕受損害者請求損害賠償之舉證責任。   《人工智慧責任指令》透過引入兩個主要方式:(一)可推翻之推定(rebuttable presumptions):人工智慧責任指令透過「因果關係推定(presumption of causality)」來減輕受損害者之舉證責任(burden of proof)。受損害者(不論是個人、企業或組織)若能證明人工智慧系統因過失或不遵守法規要求之義務,致其受有損害(包括基本權利在內之生命、健康、財產或隱私等),並且該損害與人工智慧系統之表現具有因果關係,法院即可推定該過失或不遵守義務之行為造成受損害者之損害。相對的,人工智慧之供應商或開發商等也可提供相關證據證明其過失不可能造成損害,或該損害係由其他原因所致,以推翻該損害之推定。(二)證據揭露機制(disclosure of evidence mechanism):若受害者之損害涉及高風險人工智慧時,得要求自該供應商或開發商等處獲取證據之權利。受害者透過證據揭露機制能夠較容易地尋求法律賠償,並得以找出究責的對象。   歐盟執委會認為以安全為導向的《人工智慧法》,為人工智慧訂定橫向規則,旨在降低風險和防止損害,但仍需要《人工智慧責任指令》之責任規定,以確保損害風險出現時,相關賠償得以被實現。但歐盟執委會仍選擇了較小的干預手段,《人工智慧責任指令》針對過失之責任制度進行改革,並未採取舉證責任倒置(a reversal of the burden of proof)之作法,而是透過「可推翻之推定」,一方面減輕受損害者之舉證責任,使受損害者得對影響人工智慧系統並產生過失或侵害行為之人提出損害賠償;另一方面賦予人工智慧之供應商或開發商等有機會推翻前揭造成損害之推定,以避免人工智慧系統之供應商或開發商面臨更高的責任風險,可能阻礙人工智慧產品和服務創新。

英國BSI發布自駕車發展與評估控制系統指引

  英國標準協會(British Standards Institution, BSI)於2020年4月30日發布「PAS 1880:2020:自駕車控制系統開發及評估指引(PAS 1880:2020: Guidelines for developing and assessing control systems for automated vehicles)」,該文件提供一系列的準則,提供自駕車研發者於發展控制系統時可安全有效的進行布建;本文件所涵蓋之自駕車類型主要為於(研發者)所設計及規劃之特定運行範圍內(operational design domain,以下簡稱ODD)下不需人工介入即可運送旅客與貨物者。   指引中就自駕車之控制系統設計進行分類,並提出研發者應針對不同目的與重點進行說明以及相關應遵循事項,其中應包含以下項目: 任務:自駕車之任務應被定義。 ODD:自駕車之ODD應被定義並且應可涵蓋其所有執行任務之面向。 感知運作:於任務中感知運作系統執行時,自駕車應可判斷其是否遵循ODD之範圍,並可提供相關資料予決策系統。 決策:當決策系統執行時,自駕車應可實施所有為達成任務所決策規劃之活動。 控制運作:當控制運作系統執行時,自駕車應可於正常情況下控制其動作以完成任務,並可於無法執行正確行動時採取合適之措施。 監控運作:當監控運作系統執行時,於整個任務過程中,自駕車應可監控其自身之運作。 人身安全、系統安全與有效(Safe, secure and effective):自駕車應可於所有時刻皆保持運作之人身安全、系統安全性與有效性。

美國司法部主導東南亞各國成立“智慧財產犯罪執法網絡”以有效打擊智慧財產犯罪

  美國司法部(DOJ)宣布召開一區域形會議,目的在建立國際性的智慧財產權犯罪執法網絡(IPCEN),尋找建立一雙邊合作協議,以打擊日益重大的智慧財產犯罪。該會議參與人除美國司法部、國務院、及美國專利商標局官員外,主要為亞洲各國智權執法人員,包含高階警察、海關官員、及檢察官,約七十餘人;上述亞洲各國包含中國、澳洲、汶萊、柬埔寨、印尼、日本、寮國、菲律賓、新加坡、南韓、泰國、及越南等十餘國家。   智權犯罪執法網絡(IPCEN)主要功能有二:一為成立論談空間,使各國執法人員能傳遞有關打擊”智權犯罪及仿冒品”的調查及起訴的成功策略案例;二為加強各國間溝通管道,以有效協調及處理跨國性的智慧財產侵權起訴案件。   對於在亞洲日益嚴重的?版及商標仿冒犯罪,此次會議中討論如何有效加強執法力時,各國代表多承認有效的智慧財產權起訴取決於被害人及執法單位的合作。   各國代表並說明智慧財產犯罪的嚴重性及建立國際性的智權犯罪執法網絡的重要:「保護美國及世界各國的智慧財產權為各國司法單位首要的任務之一,而在智權犯罪最嚴重的區域,建立智慧財產犯罪執法網絡(IPCEN)更是重要的執行步驟,以有效保護世界各國的智慧財產權」。「仿冒品不僅損害世界經濟體系,更嚴重威脅到各國人民的健康及安全,惟有建立一國際性的網絡協定,才能打擊嚴重的智慧財產犯罪」。「仿冒品,?版品及游走各邊境及海關政策漏洞已造成權利人近百億元損失,而IPCEN能使各國執法單位相互結盟,將可保障合法權利人權利,避免侵權者藉由跨國犯罪免責及獲取不當利益」。   美國司法部已派駐一經驗豐富的聯邦檢察官於美國駐泰國大使館,專責推動此網絡建立的執行,以保護智慧財產權人之權益。

政府將Linux認證納入採購需求

  一直以來負責政府部門資訊軟體採購的中信局,均要求廠商出示所謂 " 原廠証明 ",但是自由軟體並無法取得 " 原廠証明 ",以致難以打入公部門。今年中信局第一季發佈的政府採購需求中,首度在個人電腦部份列出具備 Linux 相容測試以及中文化認證的產品。未來要做政府生意的非 Windows-based 桌面電腦軟硬體廠商,都必須取得 Linux 相容測試認證。這是政府為了擴大 Linux 軟硬體使用而推動 Linux 相容測試,第一次明文要求, Linux-based PC 必須要具備 Linux 相容性認證。Linux 相容認證列入 IT 產品採購規格中,將因政府需求的驅動而有助於刺激國內廠商參與測試、取得認證的意願,使推動 Linux 的力量更為聚焦。   眾多 Linux 版本 OS、應用彼此相容、以及中文化不足,是國內企業使用與佈署特別是 Linux 桌面軟體造成障礙。三年前工業局推動成立 Linux 相容測試中心,希望能降低 Linux 版本相容性問題,並在今年開始推動中文化認證。   過去 Linux 相容測試免費提供廠商產品測試服務,並沒有於政府需求銜接,導致在促進 Linux 產品取得認證過於發散,此次中信局僅在個人電腦部份列出需求,也有助於收斂投測產品種類。 Linux 相容測試中心,也將在本月頒發第一批「 Linux 軟硬體相容性基本驗證規範」及「基本中文化實用性驗證」的產品。   Linux 相容測試中心交由台北市電腦公會(TCA)負責的 Linux 促進會執行

TOP