合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw//article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/05/14)
引註此篇文章
你可能還會想看
美國著作權局發布2022–2026策略計畫

  美國著作權局於2022年1月20日提出2022–2026五年策略計畫,以培養創造力及豐富文化為主軸,並闡明四個總體目標:著作權服務普及、提升效率、公正專業及增進資料使用。相關內容值得持續關注後續發展,說明如下: 一、著作權服務普及   隨著數位網路技術興起,著作權局已展開如製作溝通素材、回答公眾問題、提供各式主題教育計畫等活動。後續將更專注於讓所有人盡可能了解其服務,如著作權賠償委員會(Copyright Claims Board, CCB)等,創造一個屬於大眾的著作權系統,並豐富公眾可使用創意內容的數量與多樣性。 二、提升效率   著作權局進行包括建立企業著作權系統(Enterprise Copyright System, ECS)使其服務數位化、透過改進公共資訊聯絡中心、倉庫管理和財務系統以提升效率等工程。除持續更新ECS等系統外,未來將以用戶為中心來滿足著作權界的需求。 三、公正專業   著作權局長期以來擔任國會的著作權法律顧問,處理相關立法、政策與實踐問題,並與其他行政機關、法院合作處理各式著作權疑義。除了持續透過立法推動、規則制定及研究來衡平著作權法及政策之外,著作權局將繼續在國際舞台上參與政策討論及提供教育,發揮積極作用,成為全球著作權界的資源。 四、增進資料使用   在提供服務的過程中,著作權局蒐集了各類有價值的著作權相關資訊。此外,其亦網羅與內部運營績效、網路指標有關的其他資料。著作權局將加強資料的開發和使用,並以此作為決策的論證基礎、改進組織績效衡量標準,並使內、外部受眾更容易取得該等資料。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

新加坡金融管理局(MAS)發布「人工智慧風險管理工具包」

新加坡金融管理局(MAS)於 2023 年中旬啟動「MindForge 計畫」,旨在協助金融機構強化其人工智慧(AI)風險管理能力。該計畫於2026年3月20日完成第二階段,並發布由MAS聯合24家領先銀行、保險公司與資本市場公司等產業夥伴共同開發的「人工智慧風險管理工具包」。該工具包內含「AI風險管理營運手冊」(下稱「營運手冊」)與「AI風險管理實施案例」(下稱「實施案例」),提供實務資源以管理涵蓋「傳統AI」、「生成式AI」及「新興代理型AI」技術的相關風險,確保產業能安全且負責任的導入AI。「營運手冊」依據MAS的監理期望,將AI 風險管理框架分為四大核心:一、範圍與監管:建立AI治理框架並釐清AI監督的角色與責任。二、AI風險管理:透過組織的系統、政策與程序,識別AI應用情境,進行風險重大性評估,並建立AI盤點清單。三、AI生命週期管理:實施AI應用完整生命週期的控制措施。四、促成因素:發展組織能力、基礎設施與資源,以確保能持續支持負責任的AI應用。「實施案例」則收錄如星展銀行(DBS)及瑞士寶盛(Julius Baer)等機構的AI風險管理實務。未來,MAS 將於「BuildFin.ai」倡議下成立專責小組,持續開發建構管理新興技術風險的框架。 相較於新加坡著重建立全方位治理架構,資訊工業策進會科技法律研究所創意智財中心(下稱「資策會科法所創智中心」)於同年 2 月發布之「金融業人工智慧(AI)風險管理實務指引」,則更強調將風險控管「整合」至既有流程中,透過與業務流程的結合實踐韌性管理。該指引奠基於「人工智慧基本法」,並進一步連結「台灣智慧財產管理規範(TIPS)」驗證角度,協助機構精準掌握應用情境並具體化風險。透過將管控機制立基於資安、資訊及智財三大支柱,降低法遵成本與業務衝擊,並藉由分階段與分級管理,引導金融機構從核心防護逐步深化管控機制。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

英國Ofcom完成第一階段數位通訊審查

  英國Ofcom在2015年7月16日公布數位通訊審查第一階段之報告,指出英國未來可能面臨的挑戰問題,希望使消費者以及企業在未來的十年甚至以後能享有高品質的數位通訊服務。Ofcome先前在2015年3月提出預計進行數位通訊政策審查,檢視競爭、投資、研發以及所有數位通訊服務的使用情形,包括寬頻、行動電話、以及捆綁式服務等。 Ofcom針對四個主要領域部分提出建議: 1.市場的投資與研發,有助於服務普及。 Ofcom預估10Mbit/s為必要的寬頻速度,可以提供每天熱門的線上服務使用,例如影視音隨選服務。然而,目前英國僅有8%家戶可以取得此等速度服務。因此,Ofcom檢視法規如何使未來超高速寬頻的商業應用發展更完備。同時,Ofcom預估將來4G行動寬頻將達98%,但未來消費者與企業的期望也將隨之增高,因此仍有待於再加強網路投資。 2.競爭,藉此能提供有品質的服務和良好的價格。 在此次的檢討中,Ofcom將檢視以下議題: (1) 保留目前運作模式:電信網絡部門Openreach有別於BT,在功能上不同,利用一般性市場審查來說明任何與競爭相關之問題。 (2) 將目前的運作模式延伸: 透過對於BT的新規範,例如利用較強的誘因來控制批發價格,藉此改善服務品質,或甚至當BT出現問題時,以處罰方式進行。 (3) 將Openreach從BT中劃分,藉此可以對末端使用者有良好的競爭利益。 (4) 去管制並且促進網路競爭。 3.賦予消費者以及業者有選擇的權利,尤其是可以自由選擇或轉換這些服務提供業者。 對於Ofcom而言,所要考量的重點在於消費者在選擇服務時,是否以擁有充分的資訊可以參考。同時要思考消費者在轉換服務業者時,其是否具有障礙。 4.持續追蹤法規議題,為使市場能構良好運作,應該去管制。 例如OTT網路通訊服務,對於行動業者而言將需要較少的管制,或是是否將現有的規範直接延伸規定。   未來,在此項檢討之後,ofcom將再進行第二階段的檢視,預計於2015年10月8日進行回應討論,以促使整體英國具有良好的通訊服務環境。

美國州隱私法要求企業揭露資訊 企業應如何平衡隱私法與營業秘密的衝突

美國目前沒有聯邦的隱私法,由各州訂定州隱私法、產業隱私法,要求企業應揭露資訊以提升資訊透明度,然而隱私法要求企業揭露的資訊多涵蓋了企業的營業秘密。美國華盛頓州州長於2023年4月27日簽署《我的健康資料法(My Health My Data Act)》的州隱私法,其將消費者的健康資料廣義定義為「與消費者有關或具合理關聯的個人資料,可用於識別消費者過去、現在或未來的物理或心理健康狀況」,例如醫療相關資料、患者接受醫療服務的精確地理位置、透過非健康資料可推斷得出的資料。「非健康資料可推斷得出的資料」,如零售業者蒐集消費者近期採購的訂單內容(非健康資訊),並透過AI機器學習分析得出消費者可能懷孕的比例及預產期,藉此對該消費者投放零售業者的嬰幼產品的個人化廣告。 於《我的健康資料法》廣義定義「健康資料」下,導致消費者可要求企業提供的資料可能涵蓋了「企業長期累積之消費者使用資料、經演算法分析運用之消費者使用資料、共享消費者資料的第三方企業名單」等企業認為屬於其營業秘密的資料。 為平衡隱私法的資訊透明度及企業想保護其營業秘密,建議企業可先採取:  1.使公司的智財部門與資料保護部門合作,確保公司人員對公司營業秘密標的及範圍的認知一致,並盤點企業所有的營業秘密以製作、持續更新營業秘密清單。 2.企業在揭露受營業秘密保護的資料給消費者前,先與消費者簽訂保密契約,並參考前述營業秘密清單約定契約之保密範圍。 如企業欲採取更完備的營業秘密管理措施,建議參考資策會科法所創意智財中心發布的《營業秘密保護管理規範》。 本文同步刊登於TIPS網站(https://www.tips.org.tw)。

TOP