美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/21)
引註此篇文章
你可能還會想看
Apple獲得針對可攜式電子裝置之防竊系統的專利

  Apple Inc.成功取得一個防竊安全系統的專利權,該系統能簡單地藉由偵測外界環境而防止筆記型電腦、電話以及其他可攜式電子裝置遭竊。   於原始申請案中,申請人提到了許多竊案皆提供了某些非偶然的移動線索,例如快速且持續的移動。因此,藉由分析該裝置於一段期間內的移動,該防竊系統應可辨別出竊盜或合法使用者。因此,當使用者暫時離開時,他們能放心地將可攜式電子裝置留下,而不需要加裝纜線鎖或其它物理性安全裝置。   根據該專利,此防竊系統包含加速規(accelerometer)以及相對應的軟體。加速規可在某些位置或震動情況下自動傳送一訊號至該裝置核心的硬體,致使其觸發聲音或影像警報。此外,該裝置也能完全被鎖住,並且需要一組密碼使其回復到正常使用狀態。   雖然Apple很小心地避免在說明前述機制時指明特定的應用硬體,但藉由該專利說明書的描述,可以很清楚的了解Apple的構想是將該防竊系統安裝在iPod上。當然,手機以及筆記型電腦也是安裝該防竊系統的顯著標的。

美國國安局網站違法使用長期性“Cookies”

  雖然美國政府明文規定禁止聯邦政府機關使用長期性“Cookies”,但國家安全局(The National Security Agency, NSA)近日卻被發現將永久性“Cookies”放置於造訪該網站民眾之電腦之情形,且保存期限長達30年(直到2035年)。   所謂“Cookies”,指於使用者端紀錄該用戶造訪某一網站的過程與從事之活動,以使得下次進行相同網路瀏覽更為容易之工具。例如,透過Cookies紀錄的功能,使用者就可以將帳號與密碼記載於電腦中,再次造訪時即不用再次輸入帳號密碼以提供認證。   根據預算管理(Office of Management and Budget, OMB)於2000年公布之備忘錄Memorandum for the Heads of Executive Departments and Agencies(M-00-13)指出,聯邦政府機關除在於「必要需求」(Compelling need)下,不得使用長期性的“Cookies”。所有留在造訪民眾端的“Cookies”,必需隨著用戶關閉視窗而被消除。   NSA發言人Don Weber表示,NSA網站過去所使用的“Cookies”都是會隨者造訪者關閉網頁即刪除的暫時性“Cookies”,而這次之所以會產生長期性的“Cookies”留存在造訪者端,完全是因為NSA電腦系統更新不小心產生的,並非刻意用來作為監視使用者之工具。但民間團體則表示,這顯示了聯邦政府機關缺乏對於隱私權規範之認知,違反了國家最基本的隱私保護規範還不自知。   目前NSA已修正該程式,並清除了這些長期性的“Cookies”。

英國運輸部宣布擴大對平價零碳排車輛購車補助以推進車輛電動化

  英國運輸部(Department for Transport)於2021年12月15日宣布更新對零碳排放車輛購車補助計畫,未來將擴大對平價零碳排放車輛(affordable zero-emission vehicles)的購車補助,以創造更多購買電動車之誘因。充電式車輛購車補助計畫(plug-in grant scheme)在過去十年間已經補助超過50萬輛,並在2021年達成超過15萬輛,約每10台新車就有1台受該計畫補助,顯示電動車輛市場的持續擴大與需求的增加。   本次更新將著眼於針對售價低於32,000英鎊的電動車輛(目前英國市場中約有20款車型符合條件),提供最高1,500英鎊的購車補助,並且針對無障礙車輛售價與購車補助金額上限提高至35,000英鎊與2,500英鎊。在貨車購車補助方面,每年將提供1,000位消費者購買大型貨車5,000英鎊或小型貨車2,500英鎊的購車補助,2021年充電貨車計畫的購車補助規模較2020年已成長超過250%。而在電動機車與電動自行車方面,英國政府將對於售價低於10,000英鎊的電動機車與電動自行車分別提供500英鎊及150英鎊的購車補助。   英國政府指出,針對電動車輛的購車補助政策已經逐漸顯現效果,2021年電動汽車的銷售量已經超越2019年與2020年的加總數量,未來政府也將加強對充電基礎設施的建設,針對7.1千瓦以上的充電(包含快速充電)站訂定支付方式基本要求(例如必須具備無接觸支付方式)。英國政府承諾將提供35億英鎊用於支持英國汽車與供應鏈的電動化、電動汽車購車補助與興建基礎設施。

新加坡將推動國家電子醫療紀錄

  新加坡自今年(2018年)1月5日起推動「醫療服務法案(Healthcare Services Bill)」之制定,該法案預計取代現有「私人醫院和醫療診所法(Private Hospitals and Medical Clinics Act)」。其中「國家電子醫療紀錄(National Electronic Health Record),下稱NEHR」將整合並改善國營醫療機構及非國營醫療機構兩種醫療紀錄無法互通之情形,而行動醫療及遠端醫療亦納入之。   根據目前之諮詢狀況(已於今年2月15日結束),提案單位衛生部(Ministry of Health)表示,由於現代醫療技術已趨近複雜,若能整合各醫療單位之就診紀錄,將可大幅提升醫療效率,特別是在急診的狀況下,整合過的單一病歷將可降低評估所需的時間。   而對於病患之個資方面保護,該部表示,首先,NEHR並不會蒐集全部患者的醫療參數,只有患者之核心醫療參數才會上傳至NEHR之資料庫內,此外亦不提供非醫療目的外之使用(例如就業及保險評估)。而為降低非法使用之機率,非法使用亦將處罰之。   另外為尊重病患個人之資訊自決權,NEHR亦提供了病患選擇退出機制(opt-out)以作為個資保護的最後屏障。然而該退出機制仍不同於一般的退出機制(即退出後不得蒐集、處理及利用),該機制僅禁止各醫療機構讀取該病患之醫療紀錄,但是各該機構依NHER之架構仍應將每次就診紀錄上傳之,此一設計係避免緊急情況下或病患同意讀取電子病歷時,卻無醫療紀錄可供查詢之窘境。

TOP