美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/04/06)
引註此篇文章
你可能還會想看
全球首批奈米標章得獎名單出爐!

  經濟部於去(2005)年12月20日正式舉行「全球首批」奈米標章的授證儀式,本次獲得授證廠商共有6家,分別為:和隆興業股份有限公司(奈米級光觸媒抗菌陶瓷面磚)、冠軍建材股份有限公司(奈米級光觸媒抗菌陶瓷面磚)、尚志精密化學股份有限公司(奈米級光觸媒脫臭塗料)、新美華造漆廠股份有限公司(奈米級光觸媒脫臭塗料)、中國電器股份有限公司(奈米級光觸媒抗菌燈管)、台灣日光燈股份有限公司(奈米級光觸媒抗菌燈管),由於國外尚無奈米產品認證制度,這是國內也是全球首批獲證的奈米產品。   經濟部工業局有鑒於市面上奈米產品真偽莫辨,於九十三年特別委託工業技術研究院推動「奈米產品驗證體系」,目的在保護消費者權益、建立消費者的正確認知,並鼓勵優良廠商永續經營進而提升我國奈米產品之國際競爭力。目前奈米標章開放申請項目訂定的原則,是以該項產品在國內是否有市售商品、製造商及具能力的測試機構與相關之技術專家,以及國內外是否有測試方法可參考為前提,而基於安全性考量,有關健康、環境風險者,目前暫不開放,但對於尚未開放項目,可由廠商自行提出申請。

中國大陸網路安全法於6月1日正式施行

  中國大陸網路安全法於去(2016)年11月通過,於今(2017)年6月1日正式施行,該法主要係為了保障網路安全,維護網路空間主權與國家安全、社會公共利益,保護公民、法人和其他組織的合法權益,為第一個國家層級處理網路安全問題的法律,旨在確保維護網路空間的國家主權、保護使用者個資、防範網路攻擊及網路詐騙。   中國大陸網路安全法共七章79條,包括第一章總則、第二章網路安全支持與促進、第三章網路運行安全、第四章網路訊息安全、第五章監測預警與應急處置、第六章法律責任、第七章附則。其規範重點之一為關鍵資訊基礎設施正式納入網路安全保護範圍內,關鍵資訊基礎設施之定義不僅包括電力、運輸和金融等傳統關鍵行業,還包括法律規定涉及民生的其他基礎設施,表示任何關鍵資訊基礎設施相關廠商、供應商等外國公司,以及擁有大量中國大陸訊息的廠商,都有可能成為中國大陸網路安全法監管、執法調查、強制執行的主要對象。   中國大陸網路安全法亦要求關鍵資訊基礎設施相關廠商將個資與重要數據資料在地化,或是將這些數據資料傳輸至國外前,必須經過相關的監管機構進行自我安全評估或先加以批准。

以色列政府採購之創新實踐

音樂串流服務網站鼻祖Grooveshark正式關閉

  美國音樂串流服務網站Grooveshark於2015年4月30日在紐約聯邦法院與三家唱片公司(Warner Music Group, Universal Music Group, Sony Music Entertainment)達成和解協議,以避免由陪審團判決(jury verdict)所帶來高達7億3千6佰萬美金的侵權賠償金。Escape Media Group以5千萬美金、公開道歉及關閉經營將近10年的Grooveshark網站為代價結束了這起爭訟多年的著作權訴訟案。   Grooveshark網站的成立理念爲提供使用者上傳音樂的平臺,樂迷可透過平臺互相分享與檢索音樂,因此網站原本適用於數位千禧年著作權法(Digital Millennium Copyright Act)中的避風港原則。惟Grooveshark網站實質上透過員工上傳盜版音樂,此一做法已明顯超出避風港原則的保護範圍。紐約聯邦法院法官於去年秋季的裁定中指出,Escape Media Group透過員工上傳盜版音樂獲取利益為無可爭辯的證據,因此認爲該公司應對著作侵權負責。   紐約聯邦法院法官於審前會議中指出一旦Escape Media Group的故意侵權罪成立,每首歌曲應賠償15萬美金的侵權賠償金,而網站目前擁有近5千首歌曲,因此侵權賠償金額將高達7億3千6佰萬美金。此裁定成爲了此案達成和解協議的催化劑。對於此次的訴訟結果,美國唱片業協會(The Recording Industry Association of America,)代表三家唱片公司表示此次的和解成功杜絕了侵權音樂的主要來源,對於藝術工作者而言十分可貴。

TOP