美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/02/10)
引註此篇文章
你可能還會想看
英國數位、文化、媒體暨體育部公布「應用程式商店經營者與開發者實踐準則」,強化消費者隱私與資安保護

  英國數位、文化、媒體暨體育部(Department for Digital, Culture, Media & Sport, DCMS)於2022年12月9日公布「應用程式商店經營者與開發者實踐準則」(Code of practice for app store operators and app developers),並規劃在未來九個月內要求Apple、華為、Microsoft等公司採行,以加強對消費者的隱私與資安保護。   根據該實踐準則之內容,APP商店經營者和開發者須滿足以下要求: (1)以友善使用者的方式與消費者共享資安和隱私資訊,如APP何時將無法在商店中取得、APP最近一次更新的時間、APP儲存與處理使用者資料的位置等。 (2)即便消費者禁用部分可選的功能與權限(如不允許APP使用麥克風或追蹤使用者位置),該APP仍可正常執行。 (3)制定穩定且具透明性的APP審查程序,以確保滿足實踐準則中資安與隱私最低要求的APP方能在商店內上架。 (4)當APP因資安或隱私原因無法於商店內上架時,向開發者提供明確的反饋。 (5)制定妥適的弱點揭露程序如聯絡表單(contact form),使軟體缺陷可在非公開(避免受駭客利用)的情況下被報告及解決。 (6)確保開發者即時更新其APP,以減少APP中的安全弱點數量。   總體而言,實踐準則要求APP必須具備相關程序,使安全專家能夠向開發者報告軟體弱點、確保安全性更新對消費者足夠醒目,以及將資安與隱私資訊透過明確易懂的方式提供給消費者。

FCC提出推動10年國家寬頻計畫

  2009年2月美國總統歐巴馬簽署美國振興經濟方案,釋出72億美元擴展寬頻網路連結應用,以網路開放為前提,要求聯邦通訊委員會提出國家寬頻計劃。美國聯邦通訊委員會(FCC )在2010年3月12日公布將推動一項歷時十年的遠大計畫,希望透過建立高速網際網路,重塑美國媒體與科技優先順序的概念。該計畫預定2010年3月16日送交國會。   這項計畫反映美國正視寬頻網路正逐漸成為取代電話與廣播電視業的普通媒介,工作重點在於強化網際網路存取方便性。該項計畫的重點包括補助網際網路提供者佈建偏遠地區的網路服務、拍賣頻譜以供無線寬頻設備使用,以及發展新型態的有線電視與上網功能之全面式機上盒。   此一計畫牽涉數百億美元的聯邦經費,但FCC認為,應可透過拍賣頻譜自給自足。此外,該計畫中的部分建議,尚須國會採取行動與業者支持才能落實,至於使用者恐怕要在數年後才能看到效果。   目前美國在使用寬頻與高速上網等方面落後包括亞洲國家在內的許多國家,約超過30%的美國人無法上網,原因是負擔不起或是沒有意願使用。而FCC的計畫希望能將美國打造成一個完全網路連結的環境,透過還有待矽谷研發的無線裝置讓民眾能快速上網取得健保資訊、進行網路學習,以及進行警民連線。   不過,FCC必須審慎處理既有業者上網費率與品質的問題,此外,不少電視業者以供公眾利益為由反對,並抗拒交回頻譜,以及認為這樣計畫將會導致訊號覆蓋及干擾的問題。

基因資訊醫療運用與業務過失

歐盟執委會發布2020歐洲創新計分板報告

  歐盟執委會(European Commission, EC)於2020年6月23日發布2020歐洲創新計分板報告(European Innovation Scoreboard 2020, EIS),其以「整體結構條件」(Framework conditions)、「投資」、「創新活動」和「影響力」(Impacts)四大指標評比歐盟成員國以及其他歐洲國家的研究與創新績效、創新環境等;各指標下再細分為10個次標和27個子標,例如人力資源、友善創新環境建構、政府部門研發創新支出、企業專業職能訓練、專利與商標申請、高科技產品出口等。   歐洲計分板將歐盟會員國創新表現分為四組,以2020年綜合創新能力分別為:(1)創新領導者(Innovation Leaders):包含丹麥、芬蘭、荷蘭、瑞典等國,為創新表現大於歐盟成員國平均創新度20%以上者;(2)優秀創新者(Strong Innovators):包含奧地利、比利時、法國、德國、葡萄牙等,創新表現大於歐盟成員國平均者;(3)中等創新者(Moderate Innovators):包含希臘、匈牙利、義大利、西班牙、波蘭等國,其創新表現小於歐盟平均者;以及最後一組(4)適度創新者(Modest Innovators):包含羅馬尼亞及保加利亞,為創新表現低於歐盟平均之50%。   此外,在各特定領域上,該報告亦有對不同國家進行排名。例如在創新研究體系領域,表現最好者為盧森堡、丹麥、荷蘭;中小企業帶領創新則以葡萄牙和芬蘭表現最佳;創新協力合作(Innovation linkages and collaboration)以奧地利、比利時、芬蘭最佳。而在全球綜合創新表現上,南韓為創新表現最佳,其向加入專利合作條約(Patent Cooperation Treaty, PCT)國家提交之專利申請數、商標申請數、設計專利申請數量最多,分別為世界其他先進國家的2-10倍不等(申請數量以每十億GDP為一單位計算);其次是加拿大、澳洲、日本、歐盟、美國與中國。歐盟已是第二年超越美國,並在其他主要競爭者中(美國、中國、巴西、俄羅斯、南非等)保持優先,唯優勢差距開始減少。此外,EIS跨年度分析評比,是以歐盟2012年創新表現為基準。報告中將歐盟2012年之創新表現預設為100,在2012-2019年間,中國的創新表現評分自79成長至97,而美國則在93-99間穩定變動;特別是2019和2020兩年,美國創新表現均維持在99,而無顯著之進步。故報告預測若依此趨勢,中國創新表現將在近年超越美國。

TOP