美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/12)
引註此篇文章
你可能還會想看
美國專利與商標局推出COVID-19專利優先審查領航計畫

  因應嚴峻的新冠肺炎,美國專利與商標局(United States Patent and Trademark Office, USPTO)於2020年5月8日公布「COVID-19專利優先審查領航計畫」(COVID-19 Prioritized Examination Pilot Program)。本領航計畫的法源依據是《美國專利法》第1.183條,授權局長在極特殊的狀況下,更改專利審查規則。本專利優先審查領航計畫之重點有二:其一,原本優先審查必須繳交相關的費用,本計畫針對小型或微型機構給予免費優待。其二,優先審查以12個月內完成最終處置(Final Disposition)為目標,並期待在6個月內完成。所謂最終處置包含:寄出核准領證通知(the mailing of a notice of allowance)、寄出最終核駁通知(the mailing of a final Office action)、請求延續審查(the filing of an RCE)、放棄申請(abandonment of the application)、提出上訴通知(the filing of a Notice of Appeal)。   美國專利與商標局局長Andrei Iancu表示:「獨立發明人與小型企業創新能力不亞於大企業,固有必要在對抗大型全球流行疾病給予有利的援助。為此,美國專利與商標局政策上給予小型或微型機構優先審查的程序優待,企盼加速其所提出之新冠肺炎相關的專利審查。」本計畫適用對象僅限於合於條件的小型或微型機構(Small or Micro Entity)。按美國專利審查程序指南(Manual of Patent Examining Procedure, MPEP)第509.02及509.04條,所謂小型機構係指個人、少於500人之公司、非營利組織和大學;微型機構則是指該機構作為申請人或投資人,其前一年年收入,少於美國家庭年收入中位數的三倍。   本專利優先審查領航計畫的專利請求項,必須是美國食品藥品監督管理局(United States Food and Drug Administration, FDA)批准,用以預防或治療新冠肺炎的產品或方法,包含但不限於:試驗用新藥(Investigational New Drug, IND)申請、臨床試驗器材豁免(Investigational Device Exemption, IDE)、新藥申請(New Drug Application, NDA)、生物製劑許可申請(Biologics License Application, BLA)、上市前許可(Premarket Approval, PMA)或緊急使用授權(Emergency Use Authorization, EUA)。

芬蘭電子化政府服務法制發展簡介

以色列政府採購之創新實踐

歐盟食品管理局擬建立風險評估外部專家資料庫

  近年來,由於(European Food Safety Authority, 簡稱EFSA)對GM產品之管理並未能進行足夠之科學分析,同時,亦過份仰賴業者所提供之數據資料等原因,而造成歐盟某些會員國家對EFSA所作出之評估報告於公正及客觀性方面產生質疑;甚至,歐洲食品業者亦對目前EFSA是否將會因為專家人力不足而導致整體風險評估能力下降之問題表示關切。一位EFSA官員指出:我們需要更多科學專家來協助處理與風險評估有關之事務。   其次,隨著各界因對GMO產品不當之批判與歐洲整體食品安全評估工作量增加等因素,EFSA於日前決定,欲透過建立一外部專家資料庫(External Expert Database),來協助其風險評估工作之執行並促進評估專家招募過程之透明化,以達成免除外界對於歐洲食品安全評估過程疑慮之目的。不過,這些將提供協助之專家,並不會因此而真正成為EFSA科學評估小組成員(其將被視為是由人民主動對該小組執行評估工作提供協助)。除EFSA擬徵求歐盟境內專家學者外,未來其亦將邀請歐盟以外其他國家並在該領域為重要研究先驅之專家提供協助,以增加風險評估之品質與客觀性。   再者,綠色和平組織歐洲發言人Mark對於EFSA現階段執行之工作狀況也表示意見並指出:目前EFSA是在一種配備不良(ill-equipped)之狀態下,來勉強執行其所執掌之事務;不過,更讓人感到憂心者,則是由EFSA科學評估小組所做出科學性之意見,於不同會員國家間或於歐盟以外其他國家其是否仍將會被完全採納之問題。有鑒於此,相關人士認為:應再次強化EFSA於風險評估方面之能力!   最後,一位非政府機組織專家也提醒:僅單純地透過專家庫之建立,其實,並不能圓滿地解決當前EFSA於決策機制中所遭遇之困難;而只有當EFSA在未來欲邀請外部專家提供協助與支援時,一併將資金及相關政策配套措施納入考量後,才是此問題真正解決之道。

TOP