美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/07/04)
引註此篇文章
你可能還會想看
芬蘭電子化政府服務法制發展簡介

何謂德國KOINNO創新採購中心?

  德國KOINNO創新採購中心是由德國經濟暨能源辦事處(Bundesministerium für Wirtschaft und Energie)轄下的倉儲管理、採購與物流經濟協會(Bundesverband Materialwirtschaft,Einkauf und Logistik e.V, BME)所執掌,該協會主要任務為關於政府採購與各領域的物流管理的研發成果技術移轉、促進職業與終生教育的補助與經驗交流,目的在於創造未來趨勢、經濟發展與鼓勵創新。而KOINNO創新採購中心的成立宗旨即是持續提供政府採購的創新來源,並引導具有創新元素的政府採購實踐為成功經驗與最佳練習。    其中政府採購方面,BME在2004年建立該平臺,其功能為提供使研發成果能最佳實踐的對話交流、創造未來發展趨勢與創新、將研發成果技轉給採購機關與提升政府採購的價值。德國慕尼黑國防大學的公共採購法學與管理研究中心(Forschungszenturm für Recht und Management öffentlicher Beschaffung der Universität der Bundeswehr München,FoRMöB)是KOINNO的合作夥伴,同時也是德國唯一以企業經營與法學觀點分析公共採購問題的跨領域研究中心。

Horizon Europe

  Horizon Europe為歐盟2021-2027年之科技研發架構計畫。科技研發架構計畫(Framework Programmes for Research and Technological Development,依不同期別縮寫為FP1-FP8)為全球最大型的多年期科研架構計畫,今期之Horizon 2020已進入尾聲,2021年起所實施的歐盟科研架構計畫──FP9正式命名為「Horizon Europe」。   為打造歐盟成為創新市場先鋒,延續Horizon 2020計畫成效,Horizon Europe重視投資研發與發展創新,包含強化歐盟的科學與技術基礎、促進歐洲創新能力,以及永續歐洲社會經濟的模式與價值。   Horizon Europe發展方向分為三大主軸,分別為: 卓越科學(Excellent Science):透過歐洲研究理事會(European Research Council, ERC)、新居禮夫人人才培育計畫(Marie Skłodowska-Curie Actions, MSCA)和研究基礎設施(Research Infrastructures)加強歐盟科學領導力。 全球挑戰與產業競爭力(Global Challenges and European Industrial Competitiveness):此主軸再分別發展6個子題,以應對歐盟和全球政策並加速產業轉型。該6個子題分別為(1)健康;(2)文化與創造力;(3)社會安全;(4)數位與太空產業;(5)氣候、能源與交通;(6)糧食、生物經濟(Bioeconomy)、自然資源、農業與永續環境。 創新歐洲(Innovative Europe):促進、培育和部署市場創新,維護友善創新環境之歐洲生態系統(European ecosystems)。   此外,Horizon Europe擬把實驗階段中具備高潛力和前瞻性的技術帶入市場,轉以任務導向協助新創產業設立,推動跨事業多方整合。

OECD氣候行動監測與科學技術之挑戰

  經濟合作與發展組織(Organisation for Economic Co-operation and Development,簡稱OECD)於2022年11月7日發布《2022年氣候行動監測 幫助各國邁向淨零碳排》(The Climate Action Monitor 2022 Helping Countries Advance Towards Net Zero),係由國際氣候行動計畫(International Programme for Action on Climate,簡稱IPAC)團隊撰擬,提供全球氣候行動的重要見解。   IPAC提出之分析方法係本於OECD與聯合國環境規劃署(United Nations Environment Programme,簡稱UNEP)的「壓力–狀態–回應」(Pressure-State-Response,簡稱PSR)環境指標模型。與政策回應相關的潛在限制與障礙,可區分為四個關鍵領域:1、治理:有效率的執行脫碳政策或需有新的治理框架;2、關鍵材料:脫碳政策需使用的關鍵材料如銅、鋰等;3、技能、技術與創新:回應氣候變遷政策需個人和機構有新的能力和技術;4、財政:以政策回應需有充足的資金。   推動淨零在科學技術上面臨的挑戰為關鍵材料的應用。相較於化石燃料,綠能技術需更多的材料;特別是應用於電力系統的銅和鋁,或應用於電池的鋰、鈷和石墨。稀土對於風力發電機、電動與混合動力汽車、行動電話、電腦硬體、平面顯示器和電視機為重要材料。惟此些關鍵材料的取得集中於極少數的國家,以致於供應鏈易受單邊衝擊的影響,而使價格飆升,阻礙轉型。原材料占綠色技術大部分的成本,而緊張的材料市場可能會阻止對綠色技術的使用。氣候計畫與公告需考量關鍵技術的風險,實踐可信且穩定的淨零碳排,需於全球開發新的資源、新型的加工製程,與加速投資。並藉由新技術,與發展特定材料的回收鏈,以減緩對取得材料的依賴。   OECD提出「福祉透視」(the Well-Being Lens)的流程,以協助各國確認與考量淨零轉型的優先政策。此過程的步驟為:1、預設若為運作良好的系統所能達成的成果;2、理解現行系統無法達成的原因,以及如何重組和設計系統;3、確認行動與政策對於改善系統運作具有潛力。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

TOP