美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/03/04)
引註此篇文章
你可能還會想看
英國公布「智慧聯網挑戰與機會」政策報告及制訂「智慧聯網科際研究路徑圖」

  對於智慧聯網(IoT)推動政策,英國主要係以科技策略委員會(Technology & Strategy Board)下設智慧聯網特別關注研究小組(IoT Special Interest Group, IoT SIG)為平台,討論智慧聯網(IoT)相關資訊及規劃推動政策。英國智慧聯網特別關注研究小組2013年5月公布「智慧聯網的挑戰與機會」(IoT Challenges and Opportunities - Final Report)報告,對於智慧聯網(IoT)服務的創新發展提出建議,包括應推動:(1)建立操作互通性(interoperability)的框架(2)以人為本的設計(People-centred design)(3)創造強健的智慧聯網(IoT)平台(4)頻譜使用模式的無線電技術等相關政策。   再者,英國智慧聯網特別關注研究小組在2月15日也發表「智慧聯網科際研究路徑圖」(A Roadmap for Interdisciplinary Research on the Internet of Things) 最後報告,內容包含四個子報告,分別對科技、文化創意及設計、經濟及商業、社會科學討論智慧聯網(IoT)未來研究的方向。在「社會、法律及道德子報告」(A Roadmap for Interdisciplinary Research on the Internet of Things: Social Science)中提及應注意的研究問題,包括:隱私及資料保護、自主選擇性(choice)、控制(control)、智慧型個人隨身裝置的社會議題、安全(security) 、所有權及智慧財產權、公眾安全及保護、資料保留(data retention)、行動的停止、過時資料的處理、以及巨量資料、納入公眾意見、服務品質等等。   並且,英國「社會、法律及道德子報告」中透過情境分析的方式,試圖將所提及之相關社會、法制及道德議題盧列出來,希望能在此基礎下進行更系統性的研究探討,以更廣泛含攝模式,嘗試從社會、法律及道德各層面,探究智慧聯網(IoT)相關重要議題。

淺談我國能源關鍵基礎設施資通訊安全法制建構之重要性--以歐盟及德國智慧電表布建發展為例

加拿大反垃圾郵件法的施行可能衝擊電子商務產業

  加拿大政府於2010年12月通過反垃圾郵件法,並將於2011年底前生效,加國訂定此法律目的在於藉由遏止垃圾郵件、身分盜用、網路釣魚、間諜軟體、病毒、殭屍網路及誤導性的商業表示等行為,建立新的規範機制與罰則,解決此類線上威脅,從而促進電子商務發展。   目前引發兩派看法,自電子商務角度以觀,企業經營者倚賴電子郵件與消費者互動,而新法要求企業經營者在發商業行銷郵件前須先獲得同意,且必須有明確的取消訂閱機制供收信人選擇。雖在交易過程中獲得的電子郵件地址,將被視為已默示同意發送信息,但只能於最後一次購買日期後兩年內發信,如此企業必須另外建立符合法令規定的郵件清單並加以管理,對企業經營者而言著實是一種負擔。且因為新法定有罰則,若違反法令,加拿大廣播及電訊管理委員會(Canadian Radio-television and Telecommunications Commission, CRTC)有權對個人處以最高100萬元的行政罰款,對公司最高罰款可達1,000萬元,如此使因業務需要而發送大量電子郵件的公司,包括電信公司、銀行等感到惶惶不安。同時另一方面有論者質疑此法律的執行成效,因大部分的垃圾郵件非自加拿大當地所發出,要如何達到減少並遏止前述線上威脅,效果存疑。   另一派見解則認為,在此法案通過前,加拿大是八大工業國中,唯一没有具體的垃圾郵件管理辦法的國家。雖然此法影響電子商務產業,然而知名企業也可能會濫發商業郵件,且縱使發送郵件公司並非在加拿大本地發送垃圾郵件,其未必在加拿大無分支機構,垃圾郵件確實對加拿大人民造成損害,因此制定並施行反垃圾郵件法是必要的。

國際產業創新合作策略實例 – 歐盟之歐洲科技與創新機構(EIT)

TOP