美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/04/28)
引註此篇文章
你可能還會想看
歐盟執委會提出確保其境內數位內容跨境攜帶性之法律案

  隨著行動載具普及和網路寬頻發展,利用行動電話收看線上訂閱數位內容,如電影、音樂或運動比賽直播等已成風氣。消費者更希望無論身在何地都能觀賞線上數位內容。在此背景下,歐執會於2015/12/09正式公布〈線上數位內容之跨境攜帶性法律案(Regulation on ensuring the cross-border portability of on line content services in the internal market)〉。其目的是為使居住歐盟境內之消費者能自由攜帶其所訂閱之數位內容進行移動。另一方面在打破國界限制之障礙後,為了確保數位內容之跨境攜帶性不至於侵害視聽產業之著作權,同時兼顧基於特殊目的(教育、研究等)而使用跨境線上內容之行為,在網路數位內容之可接近性與創作人權利保障間取得平衡。   網路數位內容服務提供業者之行為規則,涉及歐盟著作權如何因應數位時代之挑戰。在歐執會之〈歐盟單一數位內容市場策略〉報告中指出,為提高數位內容之可接近性,歐盟需提高其著作權法制之現代化程度,而令數位內容有跨境攜帶性將是歐盟邁向單一數位內容市場先跨出的第一步。歐執會今後除將於2016年陸續提出多項有關著作權之現代化法案化,並且希望網路數位內容之跨境攜帶性法律案能於2017年正式實施。

何謂德國「EXIST補助計畫」?

  德國在2000年以後便將聯邦政府補助的其中一個方向集中在鼓勵科技創業,主要推動機關為聯邦教育暨研究部(Bundesministerium für Bildung und Forschung, BMBF)與聯邦經濟暨能源部(Bundesministerium für Wirtschaft und Energie, BMWi)。其中BMWi的EXIST計畫訴求建立一個科技創業有善的環境,並分三項子計畫運作:EXIST創業文化計畫(EXIST-Gründungskultur),EXIST創業補助計畫(EXIST-Gründerstipendium),EXIST研發成果移轉計畫(EXIST-Forschungstransfer)。   其中,EXIST創業文化計畫著重於在學研機構內塑造創業文化,誘發學研機構創業潛力與企業家性格;EXIST創業計畫則是鎖定學研機構內的個人(科學家、研究生、大學生),希望透過對這些個人的生活補助,使其商業發想可化為營運計畫書(Businessplan),進而開發成為商品或服務;EXIST研發成果計畫則是透過經費補助,鼓勵學研機構內的研究團隊利用設立衍生公司方式運用研發成果,在創業前的籌備階段與公司設立初期導入專業團隊,協助評估相關的創業理念、經營模式、財務評估與資金運用等規劃是否妥適,使公司創立的籌備更為妥善且禁得起市場考驗。

歐盟佐審官建議修正與加拿大之「航空乘客個人資料共享協議(草案)」,以維護人權

  歐洲聯盟法院(CJEU)佐審官 (Advocate General ) Paolo Mengozzi 於今年(2016) 9月8日提出一份不具拘束力之「航空乘客個人資料共享協議(草案)」( European Union on the transfer and processing of passenger name record data (“PNR Agreement”)) 法律意見,認為協議應遵守歐盟憲章有關人權之基本原則。此份法律意見為歐洲聯盟法院首次就國際協議草案,檢視與歐盟憲章有關規範之一致性。 [背景]   PNR協議草案於2010年5月開始協商,2014年6月25日簽署。主要以反恐為目的讓歐盟與加拿大交換航空乘客資訊(包括旅客姓名、旅行日期、行程記錄、機票、聯繫資訊、旅行社等其他有關資訊)。除加拿大之外,歐盟亦與美國、澳洲簽有類似資料共享協議。關注到PNR協議有關隱私、人權之議題,歐盟議會將PNR協議提至歐洲聯盟法院審議。 [法律意見]   佐審官認為,協議同意在特定條件下就限定目標之乘客蒐集其敏感資訊,未違反歐盟憲章;然PNR協議草案仍有部分內容違反歐盟憲章:即草案允許歐盟、加拿大主管機關使用乘客姓名等數據,已逾越預防恐怖組織犯罪和跨國犯罪的必要範圍。   因歐洲聯盟法院去年已廢除歐盟與美國之間之安全港(Safe Harbor)法案,隨後雖起草隱私保護協議(Privacy Shield),但仍有意見質疑隱私保護之完整性。PNR協議草案法律意見之提出,可窺歐盟關於隱私保護之立場。

政府採購雲端服務新興模式暨資安一體考量之研析

TOP