美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/28)
引註此篇文章
你可能還會想看
不到一個月內,HP二次控訴Acer侵害其專利權

  2007年3月27日HP(Hewlett-Packard)公司甫向美國德州聯邦法院控訴台灣的宏碁(Acer)公司侵害該公司五項的專利權;不到一個月的時間,於4月19日又再度向該法院控訴宏碁公司侵害其四項的專利權,包含散熱裝置、電力儲存等專利。除請求賠償金外,亦要求法官禁止宏碁公司相關產品在美國市場上銷售。   不過HP公司第二次起訴的時間點正在市場研究機構IDC公司公佈相關的統計資料後,因為根據IDC公司於4月18日公佈2007年第一季的統計資料顯示,HP公司仍然穩坐全球電腦市場銷售的龍頭,其他領先的廠商依序為戴爾(Dell)、聯想(Lenovo)與宏碁等公司。但同樣是根據IDC的統計,宏碁公司在2005至2006年間已成長37.9%,而且榮獲美國市場多種的獎項,未來的銷售發展情形十分樂觀。   HP公司控訴宏碁公司的行為,是否基於競爭策略的考量目前尚不得而知,但據報導HP公司也在同(19)日向美國國際貿易委員會(ITC)提出申訴,要求禁止宏碁公司的產品進口到美國。原則上ITC的委員會在一個月內決定是否對該案件進行調查,接著在12至15個內完成調查後,才會做出最後的決定。

美國FDA於20250617宣布將試行「局長國家優先審查券」

COVID-19疫情後美國開始積極處理藥品供應鏈脆弱性,為提振本土製造與審查效率,美國食品及藥物管理局(Food and Drug Administration, FDA)於2025年6月17日宣布將試辦「局長國家優先審查券」(Commissioner’s National Priority Voucher, CNPV)。該計畫依據《聯邦食品、藥品與化妝品法》(The Federal Food, Drug, and Cosmetic Act, FFDCA)與《公共衛生服務法案》(Public Health Service Act, PHSA)授權。CNPV將不同審查分組集中處理,並結合資料預先提交機制,力求將一般10-12個月的審查流程壓縮至1-2個月,試辦期為一年,並與現行優先審查及優先審查券(Priority Voucher, PRV)機制獨立並行。 內容要點: 1.遴選資格:符合任一「國家優先」標準之廠商 因應公衛危機:如廣效疫苗開發 帶來潛在的創新療法:超越突破性療法認定成效的新型療法 解決未滿足公共衛生需求:如罕病或缺乏療效標準治療之疾病 提升美國供應鏈韌性:如將藥品研發、臨床、生產遷至美國 提高可負擔性:將美國藥價降至最惠國藥價,或減少下游醫療費用 2.使用與要求: 適用階段:可於申請臨床試驗或申請藥證等階段啟用,亦可先領「未指名券」保留資格。 文件要求:需提前60天提交完整藥品化學製造與管制(Chemistry, Manufacturing, and Controls, CMC)與仿單預審,如遇重大缺件FDA得延長審查期限。 有效性:2年內使用,逾期失效;不可轉讓,但併購案中可沿用。 CNPV透過團隊同日決策,有望在FDA人力縮減背景下縮短審查時程。並強調國家利益,可能優先惠及具戰略價值及在美投資的大型藥廠;對我國優化藥品審查流程與吸引製造投資等目標,亦具重要參考價值。

英國推動「公共緊急警報:行動通訊預警試驗」實證服務

  為試驗導入智慧防救災各項新興技術與機制,英國國民緊急事務秘書處 (Civil Contingencies Secretariat, CCS) 於2013年秋天分別對北約克郡 (North Yorkshire)、格拉斯哥 (Glasgow) 和薩福克郡 (Suffolk) 三地區進行共三次的「公共緊急警報:行動通訊預警試驗」(Public emergency alerts: mobile alerting trial)。由於英國已有92%民眾具有行動電話,並以隨時得接收訊息為出發點,進行有別於傳統預警系統之公共緊急預警系統試驗。此試驗由國民緊急事務秘書處與O2、Vodafone和EE三間行動網路業者 (mobile network operators) 和地方政府應變單位合作,雖係以行動電話為試驗主軸,但試驗重點則以政府或地方政府應變單位「不知道」民眾個人電話,亦不要求民眾簽署才能取得此次試驗訊息為主。   此三次試驗手段有二,包括「小型區域廣播服務」 (cell Broadcast service, CBS),係以單點對多點發送緊急簡訊,以及「以地區為基礎的簡訊」 (location-based SMS messaging),以群組方式發送簡訊至指定地區用戶,二種發佈緊急訊息的方法為試驗。   北約克郡 (North Yorkshire)主要與EE進行發送緊急水災警報系統,對於廣播訊息發送的時間或調整時間長短以供傳送「泡沫警報」(表訊息多寡)到地域寬廣或數個地區而言,是有效的手段。格拉斯哥 (Glasgow)地區為蘇格蘭最大城市,與O2業者進行最大型的試驗,發送數千緊急訊息給民眾。而薩福克郡(Suffolk)則是由於該區不僅於市中心具兩個火車站,遊客也眾多,因此試驗場域以住商混合住宅區及處於該區的人民為主。除小型區域廣播服務和以地區為基礎的簡訊外,薩福克郡也與社交網路Twitter合作,共傳送三種訊息試驗。   透過上述試驗,公共緊急警報:行動通訊預警試驗計畫報告也提出針對隱私與對於電信服務業者於災害發生當下之通訊服務義務未來應制訂相關規範,以及應統一發送訊息之通訊警報協定標準等建議。

RFID應用發展與相關法制座談會紀實

TOP