美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/03/13)
引註此篇文章
你可能還會想看
美國發布2012「更佳建築倡議」計畫進度報告

  美國於2011年2月份啟動「更佳建築倡議」(Better Building Initiative)計劃,期在2020年達成降低工業和商業之能源密集度百分之二十的目標。展望2013年,美國能源部於2012年底發布該倡議之進度報告(Progress Report)。報告開宗明義指出若干有礙建築能源效率之投資障礙,擬如下: (1) 尚缺少能源效率投資成本節省之實證數據 (2) 尚缺少潛在市場和技術解決方案之相關資訊 (3) 能源效率作為商業最佳實踐尚未普遍被接受。基此,能源部致力於發展以下策略: (1) 創新產業研發 (2)促進能源效率投資 (3) 培育清潔能源之技術人員 (4) 強化聯邦公部門示範作用。   在創新產業研發面向,能源部成立「更佳建築聯盟」(Better Buildings Alliance),此乃結合零售、食品、商業房地產、醫療照護、高等教育產業,預計於2013年將擴大到州和地方層級;聯盟成員將承諾設定節能目標,擇定高效率之建築科技進行採購。其次,在促進能源效率投資上,報告指出,因市場尚缺乏相關數據資訊(data information),難就能源效率之市場價值(value)進行驗證;將建立起相關機制,作為未來融資和建築物改善的基礎。最後,在強化公部門示範作用上,透過聯邦能源管理計畫(Federal Energy Management Program, FEMP)和節能績效契約(Energy Savings Performance Contract, ESPC),持續強化能源技術服務公司(Energy Service Companies, ESCO)進行聯邦建築物節能效益之提升和擔保。   綜上,可得知建築能源效率數據資訊之欠缺乃目前美國能源部在推展「更佳建築倡議」面臨的最大問題。查美國國會於2012年12月初通過「美國製造業能源技術修正法案」(American Energy Manufacturing Technical Corrections Act),就前述聯邦能源管理計畫(FEMP)和資料蒐集標準(Data Collection)進行規範,相關法制政策趨勢殊值注意。

歐美擴大永續報告書的揭露範圍,企業可透過歷程管理增進資料透明度

根據美國瑞生國際律師事務所(Latham & Watkins)於2024年1月發布的ESG年度報告指出,隨漂綠議題延燒,ESG報告不受信任為一課題,因此國際逐步擴大ESG監管,多國透過立法強制企業應揭露永續報告書或供應鏈資訊,比如:歐盟於2023年1月生效之《企業永續報告指令》(Corporate Sustainability Reporting Directive, CSRD),要求企業揭露的永續資訊需增加供應鏈資訊的透明度;美國證券交易委員會(SEC)於2024年3月6日通過規則,要求上市公司及公開發行公司揭露碳排放報告等氣候風險相關資訊。 為因應ESG帶來的挑戰,報告建議企業應採取流程化管理方式,了解產品進出口涉及的其他國家對ESG揭露資訊的要求,加以規劃並建置資料控管規範、進行人員教育訓練以及確認ESG相關資料的所有權歸屬。 由於碳排放量的計算沒有一致標準,且難以確保供應鏈上下游所提供的碳排資訊真實、未經竄改等問題,外界不容易信任企業永續發展書提倡的供應鏈減碳策略。國內企業可參考資策會科法所創意智財中心發布的《重要數位資料治理暨管理制度規範(EDGS)》,透過流程化管理,從制度規劃及留存供應鏈二氧化碳排放量或二氧化碳減量等產品相關資料歷程來增進ESG資料透明度。 本文同步刊登於TIPS網(https://www.tips.org.tw)

政府採購雲端服務新興模式暨資安一體考量之研析

用數字解讀國內企業的智財管理能量

TOP