美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/11/27)
引註此篇文章
你可能還會想看
北歐能源科技觀點報告討論建築能源效率等為達碳中和所採措施

日本「通信‧放送政策懇談會」提出最終報告

  日本總務省召開的「通信‧放送政策懇談會」,於本月 6 日進行今年第 14 次集會,提出該會之最終報告。   其中,有關 NTT (日本電信電話公司)之改革,預計於 2010 年解散目前所採行的控股公司架構,將其所掌控的 NTT 東日本、 NTT 西日本(主要經營固接電話以及上網服務),以及 NTT DoCoMo (主要經營行動通訊業務)三者完全分割,成為三間各自獨立的公司;且分割以後以上三者之間的合作關係亦應受到嚴密規制。至於 NHK (日本放送協會)之改革,則計畫釋出一個衛星頻道,兩個廣播頻道,同時娛樂以及體育節目相關部門,以及網路傳輸、國際播送業務等,應與 NHK 之核心業務切割,成立子公司自行獨立經營。   上開內容雖然是因應通信與放送兩大體系日漸匯流之趨勢而生,惟論者以為勢將引發輿論以及各大政黨之議論甚至反彈;而最終能否納入政府以及執政黨目前正在研擬規劃的施政綱領,仍在未定之天,有待持續追蹤觀察。

俄亥俄州通過醫療用大麻合法化

  在俄亥俄州長於2016年6月18日簽署通過HB523法案後,俄亥俄州正式成為美國第25個將醫療用大麻合法化的州。這項法案將在今年11月生效,並且允許重症患者使用及採買醫療用大麻。   與原本在2015年11月被退回的法案相比,娛樂性用途大麻直接被排除在本次法案適用範圍外,而且不允許個人在家裡種植或是直接抽食。因此,與一般人想像中,如同荷蘭般的大麻合法化政策相當不同。   當然,某種層面上來說,這項法案對重症病患是一大福音,他們可以合法取得大麻,不再因為持有大麻而被當成罪犯。但是俄亥俄州這部法案對於大麻使用者於現實生活中情況能帶來多大的改善,仍讓人懷疑。因為在俄亥俄州現行法律及行政系統下,俄亥俄州政府並未隨著新的法案,推行相關行政措施。一般來說,在大麻合法化之區域,通常會要求雇主不得禁止員工使用與持有醫療用大麻,或是不可以因當事人有使用、持有或散佈醫療用大麻之紀錄或習慣,而拒絕錄用或是解聘之,同時,會禁止對員工施行藥物檢查。倘若雇主有前列之行為,通常會面臨處罰,例如:主管機關會取消該名雇主原先所享有之稅捐優惠或其他惠優措施。此外,員工得因雇主反禁藥之行為,對雇主提起訴訟。是以,在缺乏相關行政配套措施的情況下,俄亥俄州的大麻使用者未來在工作場所中,仍將會面臨許多挑戰以及障礙。   總而言之,俄亥俄州通過這部法案,在法律上可謂是一大里程碑,但尚與一般大眾認知的「大麻合法化」仍存有很大的差距。同時,未在行政作為上採取相對應的保障措施,仍可以想像將來醫療用大麻使用者在社會上仍將面臨許多障礙。

美國聯邦資料戰略〈2020年行動計畫〉

  美國白宮於2018年3月發布〈總統管理方案(President’s Management Agenda)〉,其中發展「聯邦資料戰略(Federal Data Strategy)」,將資料作為戰略資產,藉以發展經濟、提高聯邦政府效能、促進監督與透明度,為方案中重要之工作目標之一。「聯邦資料戰略」之架構上主要包括四個組成部分,以指導聯邦資料之管理和使用:1.使命宣言:闡明戰略之意圖與核心目的;2.原則:有十大恆定原則對於機關進行指導;3.實作規範:有四十項實作規範指導機關如何利用資料之價值;4.年度行動計畫:以可衡量之活動來實踐這些實作規範。   於2019年12月23日,〈2020年行動計畫〉之最終版正式發布,其將建立堅實之基礎,在未來十年內支持戰略之實踐。詳言之,〈2020年行動計畫〉之內涵主要包含三大部分與二十個行動: 機關行動:旨在支持機關利用其資料資產,包括六大行動:(1)行動1:確認用於回答對於機關而言具有優先性之問題所需之資料;(2)行動2:將機關之資料治理制度化;(3)行動3:評估資料與相關基礎設施之成熟度;(4)行動4:確認提高員工資料技能之機會;(5)行動5:確認用於機關開放資料計劃之優先資料資產;(6)行動6:發布與更新資料庫存。 實踐共同體之行動:由特定機關或一群機關就一共通主題所採取之行動,可加速並簡化現有要求之執行,包括下列四大活動:(1)行動7:成立聯邦首席資料官委員會;(2)行動8:改善用於AI研究與發展之資料與模型資源;(3)行動9:改善財務管理資料標準;(4)行動10:將地理空間資料實務整合至聯邦資料事業中。 共享解決方案行動:為所有機關之利益、由單一機關或委員會試行或發展之活動:(1)行動11:開發聯邦事業資料資源儲存庫;(2)行動12:創建美國預算管理局聯邦資料政策委員會;(3)行動13:制定策畫之資料技能目錄;(4)行動14:制定資料倫理框架;(5)行動15:開發資料保護工具組;(6)行動16:試行一站式之標準研究應用程序;(7)行動17:試行一種自動化之資訊收集評論工具,該工具支持資料庫存之創建與更新;(8)行動18:試行用於聯邦機構之增強型資料管理工具;(9)行動19:制定資料品質評估與報告指引;(10)行動20:發展資料標準之儲存庫。   〈2020年行動計畫〉確定機關之初步行動,其對建立流程、建立能力、調整現有工作以更好地將資料作為戰略資產至關重要。未來之年度行動計畫將會在〈2020年行動計畫〉之基礎上進一步發展出針對聯邦資料管理之協調方案。

TOP