美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=86&tp=1 (最後瀏覽日:2025/10/16)
引註此篇文章
你可能還會想看
歐盟要求自4月15日起,進口至歐盟的中國米類產品應檢附非基改證明

  根據歐盟GMO食品上市規則,唯有通過歐盟EFSA的安全評估並經歐盟審查通過發給上市許可的GMO,始得於歐盟境內流通上市。   過去兩年,歐盟陸續發現其自中國進口的米類產品,被未經許可的基改稻米Bt 63污染,對歐盟的食品安全產生重大疑慮,因而引起歐盟官方及消費大眾的高度關注。為此,中國主管當局雖已請求歐盟提供有關此非法GMO之基因構成(genetic constructs)的詳細資訊,並針對歐盟會員國通報至Rapid Alert System for Food and Feed(RASFF)的案件,開始進行調查並暫時禁止相關業者出口米製品,不過中國迄今未能依歐盟要求,提供其在實施出口管理時的控制樣品,以及其所使用的檢測方法與歐盟所要求者,具有相同品質之證明。   因此,歐盟已在今(2008)年2月通過一項緊急措施的決定,要求自4月15日起,進口至歐盟的中國米類產品應檢附非基改證明(GMO-free certification),且此非基改證明應由歐盟官方所設立或認可之實驗室,使用特定的GMO檢測技術檢測後,檢測結果發現未含有GMO成分時,始能核發非基改證明。   雖然歐盟並非我國農產品的主要外銷國家,但歐盟此項緊急措施仍值得我國注意,蓋我國當前GMO的進出口管理法制與先進各國尚有所落差,而我國最主要的農產品出口國—日本,其GMO管理法律中亦有授權主管機關對進口產品實施生物檢查(即是否含有GMO的檢測)的規定,倘若我國在發展GMO時,未能妥善落實GMO的管理,不無可能對非基改產品造成重大衝擊,當前歐盟要求中國出口的米類產品應檢附非基改證明,即是一例。

「你在哪裡? 我正在看著你!! 談行動定位服務與隱私權保護」

RFID應用與相關法制問題研析-個人資料在商業應用上的界限

美國最高法院裁定暫停執行環保署「清潔電力計畫」

  美國最高法院在2016年2月9日,以暫時處分裁定美國環保署在「清潔電力計畫」(Clean Power Plan)下所擬訂的「對固定污染源的碳排指引:電業發電單位」( Carbon Pollution Emission Guidelines for Existing Stationary Sources: Electric Utility Generating Units ),在北新(Basin)電力公司等對其所提起訴訟期間,暫緩實施。   所謂環保署「清潔電力計畫」(Clean Power Plan),係為因應氣候變遷,在2015年8月由美國總統在演說中公布,並於同年10月由美國環署公布「對固定污染源的碳排指引:電業發電單位」最終內容。該計畫的具體目標乃以2005為標準,在2030減少碳排32%,各州並得自行訂訂計畫;預期的計畫效果則包含:保護一般的美國家庭、促進經濟,與協助一般美國家庭節省費用。   由於該案涉及大規模以天然氣、風力與太陽能取代燃煤電廠,2015年的10月23日至11月5日間,由北新與其他近60家電業向聯邦哥倫比亞特區上訴法院(United States Court of Appeals for the District of Columbia Circuit)提出申請暫緩實施之聲請。2016年1月21日 該上訴法院駁回聲請,同月26日原本提出聲請的電業再向最高法院提出暫緩實施之聲請。   在向最高法院的聲請中,業者主張:因系爭指引所規範排放限制量為任何現行發電業者(Electricity Generating Units, EGUs)無法透過現行科技或流程改善單獨達成,將迫使整個電力產業作出轉變。業者並指出,由於淘汰既有電廠與建立新的再生能源計畫皆須長時間的努力來執行,若欲在2022年達成相關目標,電業必須現在就展開行動。   而最高法院也認同業者的主張,指出:因訴訟曠日廢時,若不暫緩實施系爭指引,立即、無法回復、且特別重大的損害將持續發生;且美環署仍將取得該計畫所欲取得之效果,縱使系爭指引最終被廢止。   基於上述理由,最高法院以暫時處分裁定系爭措施暫緩實施。

TOP