合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2025/12/18)
引註此篇文章
你可能還會想看
東協-澳洲高峰會後發表雪梨宣言:倡議網路安全、智慧城市以及數位貿易

  首屆東南亞國協澳洲高峰會(ASEAN-Australia Summit)於2018年3月18日落幕,各國領袖達成共識並聯合發表雪梨宣言(Sydney Declaration),宣言內容談到未來東協與澳洲間之戰略夥伴關係、推動區域經濟之整合以及在複雜的區域議題上(包含網路、海事、移民)提升合作關係。   首先,在倡議網路安全(Cybersecurity)議題上。網路安全的威脅乃是全球性的,且在現今許多技術的應用上都會加劇這個問題的嚴重性。而社群媒體以及加密通訊軟體的使用對於所有人而言都將會是一個挑戰,故為深化網路安全之合作,各國將承諾共同致力促進一個開放、安全、穩定、便利、友善的ICT環境。於現行的國際法制基礎下促進網路空間的國際穩定、培養合作能力、確實建立信任措施以及自願而不具拘束力之行為規範。此外,澳洲與東協簽訂共同打擊國際恐怖主義備忘錄(Memorandum of Understanding (MoU) on Cooperation to Counter International Terrorism),以打擊恐怖及暴力極端主義,其中合作內容即包含有網路情報交流、提供能力建構方案以幫助偵查及打擊恐怖活動等。   次之,在東協-澳洲智慧城市倡議(ASEAN-Australia Smart Cities initiative)議題上。澳洲總理Malcolm Turnbull宣布將在五年內投資3000萬澳幣於強化澳洲與東協發展智慧、永續之城市設計的合作計畫,並且將更進一步促進區域經濟整合與繁榮。澳洲將向東協提供教育、培訓、技術援助及創新支援並投資發展永續性都市化之研究。在綠色基礎設施、水資源管理、再生能源、創新科技技術、數據分析以及交通運輸上,澳洲願意共享經驗與知識。此外,澳洲與東協亦將合作開發一系列高效能的基礎設施項目,以吸引私人及公共投資並改善區域連通性,更進一步實踐智慧城市之目標。   第三,在倡議數位貿易(Digital trade)議題上。澳洲政府宣布將與東協十國共同推動數位貿易並支持該地區經濟的包容性成長。數位科技在全球迅速普及,並為政府、消費者、企業提供了機遇,特別是針對微型、中小企業,它帶來了新興數位交易機會、就業機會、投資機會以及提高生活水準,然而數位化的好處並不代表公平分享。而統一數位貿易之國際標準將有助於消除企業進入區域市場之阻礙以及創造新的就業機會及發展,此一舉措將幫助東協落實其在資料經濟政策上主要優先之處理事項。

開放原始碼組織有意減少授權版本

  開放原始碼協會(Open Source Initiative,簡稱OSI)的新任總裁Russ Nelson在3月2日提出了一項新的提案,希望解決一項重大的問題:開放原始碼授權的擴增問題。亦即,只要符合該組織的10點開放原始碼定義,OSI可提供正式開放原始碼授權(licenses,或稱「許可」)身份。   在寄給開放原始碼社群的一份聲明裡,Nelson表示,新的條款規定:授權不可與既有的授權重覆;必需以清楚、簡單,而容易了解的方式撰寫;以及把個人、專案或組織的名稱通通移至隨附的附件中,以便讓授權書可重複使用。    Nelson在接受專訪時表示,新條款要由OSI董事會通過才可生效。董事會成員已經過過該提案,但還未安排好投票的議程。OSI並不打算取消已經通過的授權認證,Nelson表示。他認為,推出「OSI Gold」升級認證應該可達到同樣的效果。他進一步表示,新的條款是否能夠有效減少授權數量,還要看執行是否有力。

歐盟執委會提出《歐盟數位十年網路安全戰略》

  歐盟執委會於2020年12月16日針對未來十年歐盟數位發展,提出《歐盟數位十年網路安全戰略》(The EU's Cybersecurity Strategy for the Digital Decade),以支持塑造歐盟的數位未來(Shaping Europe's Digital Future)、歐洲復甦計畫(Recovery Plan for Europe)和歐洲安全聯盟(EU Security Union Strategy)。該戰略說明應如何加強歐盟共同抵禦面對網路攻擊的應變能力,並確保民眾及企業都能在可信賴的數位服務中受益。   由於COVID-19大流行,加速工作模式的變化,2020年歐盟約有40%的民眾遠距辦公,而同年網路犯罪對全球經濟造成的影響估計達到5.5億歐元。因此,為維護全球開放網路的穩定運作,在保護網路安全的同時,亦應保護歐盟的共同價值觀與人民的基本權利,在監管、投資與政策上提出三點建議: 韌性、技術主權和領導(Resilience, Technological Sovereignty and Leadership):根據網路與資訊系統安全指令(Directive on Security of Network and Information Systems, NIS Directive)修訂更嚴格的監管措施,改善網路和資訊系統的安全。並建立由AI推動的資安監控中心(AI-enabled Security Operation Centres),及時避免網路攻擊。 建立防禦、嚇阻和應變能力(Building Operational Capacity to Prevent, Deter and Respond):逐步建立歐盟聯合網路安全部門,加強歐盟各成員國之間的合作,以提高面對跨境網路攻擊時的應變能力。 透過加強合作促進全球開放網路空間(Advancing a Global and Open Cyberspace):希望與聯合國等國際組織合作,透過外部力量共同建立全球網路安全政策,以維護全球網路空間的穩定及安全。

英國上議院正逐條審議資料保護和數位資訊法案,期展現脫歐新格局

英國科學、創新和技術部(Department for Science, Innovation & Technology)提出之《資料保護和數位資訊法案》(The Data Protection and Digital Information Bill,以下稱DPDI法案)於2023年11月經下議院三讀後移交上議院,並於2024年3月20日起逐條審議。DPDI法案旨在調整由英國《一般資料保護規則》(UK General Data Protection Regulation, 下稱UK GDPR)、《資料保護法》(Data Protection Act, DPA 2018)與《隱私與電子通訊規則》(Privacy and Electronic Communications (EC Directive) Regulations 2003)建構之資料保護框架,形塑有別於歐盟典範的資料保護制度。 下議院三讀通過之DPDI法案包含:個人資料保護、數位核驗服務、消費者與商業等各類數據使用以及監管制度等,期能增加資料使用彈性、衡平保護與運用之衝突。該法案將釐清與重新定義資料保護之一般性通則,以下就部分變革與爭議簡要說明: 一、資料使用限制放寬:藉擴大正當利益(legitimate interest)意涵與科學研究範圍,擴大個人資料使用的正當性基礎,如國安、犯罪預防、公共衛生及商業與非商業性科學研究。 二、組織資料治理層級轉變:取消資料保護長設置,改為指派高階管理層之一人專任或多人兼任高階負責人。 三、監管機構變換:將現行資訊專員辦公室(Information Commissioner’s Office, ICO)獨立機構監管模式,轉換為政府任命之委員會。 四、資料傳輸規範可能不足:英國脫歐後,其與歐盟間的資料傳輸經認可而獲維繫。若DPDI法案通過並調整且簡化資料傳輸規範,英國可能需證明新程序及規範持續具有保護適足性。 就DPDI法案內容觀之,該法案主要建構於UK GDPR及相關規範之刪修,象徵英國政府對脫歐前資料保護制度之檢討,並期藉改革減輕企業合規成本。然,部分團體認為資料使用放寬與保護制度之變革,可能導致演算法歧視以及英國與歐盟間資料流動困難。雖DPDI法案尚在上議院委員會討論階段,可能因各方磋商而修改條文內容,但仍可見英國政府積極重新伸張國家主權之作為。

TOP