美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/05/12)
引註此篇文章
你可能還會想看
英國民眾請願禁止使用DRM

  超過1400位英國民眾共同連署後,於英國政府電子請願網站上,請求英國政府禁止「數位版權管理」(digital rights management, DRM)之使用。該項請願中引用去年英國國會獨立組織-All Party Parliamentary Internet Group(APIG)所發表之調查結果。該項調查結果中指出,為避免如2005年Sony所使用之數位版權管理程式般具有侵入性的科技侵害人民權利,應針對此類科技建立消費者保護機制。   除此之外,該份請願亦主張,數位版權管理使得消費者無法自由在CD或數位下載等不同競爭產品間自由選擇。而在不久之前,蘋果電腦之執行長Steve Jobs亦曾提倡無數位版權管理之合法數位音樂下載,Steve Jobs認為若能提供無數位版權管理之合法數位音樂下載,將可增加不同業者所提供音樂下載服務的相容性,進而促使數位音樂下載市場更為蓬勃發展。   不過對於該項請願,英國政府回應中認為數位版權管理不僅透過科技保護措施扮演著警察的角色,同時亦使得內容提供業者得以各種消費者期望的方式提供數位內容服務。因此,數位版權管理的存在仍有其貢獻,不應加以廢除。當然在使用數位版權管理的同時,亦應注意消費者權益之保護,合理的方式乃是在消費者購買產品前,清楚告知產品所提供之服務內容、消費者購買後可被允許之使用方式和各種使用限制。

歐盟正式通過資料治理法(DGA),歐盟資料共享發展跨出一大步

  歐盟理事會(Council of the European Union)於2022年5月16日正式通過了資料治理法(Data Governance Act, 簡稱DGA),本法是歐盟執委會(European Commission)於2020年11月提案,經過一年多的意見徵詢與協商,歐盟議會(European Parliament)於今(2022)年4月6日以501票贊成通過,隨後由歐盟理事會通過公布,本法預計將於2023年8月正式生效。   DGA包含幾大面向,除了針對資料中介服務(data intermediation)、資料利他主義(data altruism)、歐盟資料創新委員會(European Data Innovation Board)等機制建立的規定外,在第二章特別針對公部門所持有之特定類別資料的再利用(reuse)進行規定。當公部門持有的資料涉及第三方受特定法律保護的權利時(如涉及第三方之商業機密、智慧財產、個資等),本法規定公部門只要符合特定條件下可將此類資料提供外界申請利用;若為提供符合歐盟整體利益的服務且具有正當理由和必要性的例外情況下,得授予申請對象專有權(exclusive rights),但授權期間不得超過12個月;歐盟應以相關技術確保所提供資料之隱私和機密性。   再者,各會員國應指定現有機構或創建一個新機構擔任提供上述資料類型的單一資訊點(Single Information Point, SIP),以電子方式公開透明地提供資料清單,包含可申請利用之資料的來源及相關描述(至少包含資料格式、檔案大小、再利用的條件等),以提供中小企業、新創企業便利、可信的資料查詢管道。此外,歐盟執委會應建立一個單一近用點(Single Access Point, SAP),提供一個可搜尋公部門資料的電子登記機制(a searchable electronic register of public-sector data),讓使用者得直接搜尋各會員國單一資訊點(SIP)中所提供的資料及相關資訊。   DGA是歐盟2020年2月發布歐盟資料戰略(European Data Strategy)後的第一個立法,歐盟希望透過本法建立一套能提升資料可利用性和促進公私部門間資料共享的機制,以創造歐盟數位經濟的更高價值。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

RFID應用發展與相關法制座談會紀實

新加坡金融監管局發布金融服務產業轉型藍圖,以提升金融科技創新力

  考量金融服務業面對科技之影響,金融領域必須轉型,以維持競爭力與時並進,新加坡金融監管局於2017年10月30日發布金融服務領域之產業轉型藍圖(Industry Transformation Map),旨於成為一個連結全球市場、支持亞洲發展,以及為新加坡經濟服務之全球金融中心。   該產業轉型藍圖包含了三部分,分別係:商業策略、創新與監理、以及就業與技能。   一、商業策略:成為領先國際財富管理樞紐。為推動亞洲發展,新加坡金管局預計與業界合作,將新加坡發展為私募市場融資平台。   二、創新和監管:發展重點為促進金融領域創新之普及,並鼓勵使用科學技術提升效率與創造機會,其具體方式包括: 透過API應用程式介面,鼓勵金融機構提升創造力和科技創新。 與金融機構合作打造常用的工具,如電子支付、電子身分識別(know-your-client)機制等。 促進和投資研發,開發新的解決方案,包括使用分帳式技術進行銀行間的支付與貿易融資。 擴展與其他Fintech中心之間的跨境合作協議,讓新加坡成為國外Fintech新創企業之育成基地。 使用科學技術,簡化金融機構監管。   三、就業和技能:新加坡金管局將擴大金融服務業的人才庫,加強新入和中期轉換跑道之人員在資訊科技上的專業技能。   該金融服務產業轉型藍圖之目標為,每年在金融領域達到4.3%實際增長值,並創造3,000個工作,其中金融科技領域部分達成1,000個工作機會。

TOP