美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/01/02)
引註此篇文章
你可能還會想看
英國4G釋照近況

  在經歷1個多月、共50回合4G(含LTE與Wimax)頻譜拍賣後,英國Ofcom在2月20日宣布Everything Everywhere Ltd(EE)、 Hutchison 3G UK Ltd、 Niche Spectrum Ventures Ltd、 Telefónica UK Ltd (O2)與Vodafone Ltd五家公司取得頻譜執照。這次4G釋照拍賣收入比預期少10億英鎊,但也挹注英國政府23.4億英鎊,使財政得以紓緩。目前,英國民眾最晚於2017年,就可享有更快、更便宜與覆蓋性更佳的4G服務。   此次頻譜釋出共有250MHz取自於800MHz與2.6GHz。800MHz之得以釋出,來自於類比電視訊號關閉後,因頻譜重整所取得之「數位紅利」,並採取分頻多工(frequency division duplexing,FDD);至於,2.6GHz則依頻段不同,而分別採用分頻多工與分時多工(time division duplexing,TDD)。由於,800MHz擁有優良覆蓋性,是故,英國政府藉由800MHz特性,釋放一張2*10MHz之執照,並規定業者覆蓋義務,以達到英國發展行動網路之目標。目前,取得該執照的O2,最晚於2017年須提供98%人口於室內可取得行動寬頻服務、至少95%人口能於英國境內(英格蘭,北愛爾蘭,蘇格蘭和威爾士)取得4G服務。   在Ofcom採取組合價格鐘拍賣型式(combinatorial clock auction,CCA)下,目前,業者已完成頻譜標得區塊數目(Eg:EE於800MHz取得一張2*5MHz),待得標者完成配置(Assignment stage)頻段位址(Eg:EE頻段確定在800 MHz ~805 MHz),最快於2013年夏天,英國民眾可更普及的享有下述優點:   1.網速可達到100Mbp,超越現今3G五至十倍。   2.使用智慧型手機、平板觀看電視,雜訊、遲緩的問題將不復見。   3.使用高畫質視訊將更為輕鬆,並且,照片與影片上傳於社群網站將非常迅速。   4.偏遠地區可因4G的覆蓋性廣而具有網路服務。   OFCOM不僅促進4G市場競爭外,並在今(2013)年年底提供報告,告知消費者與企業4G服務發展現況、地理位址,與網路速度,讓使用者有能力作出最好的選擇。而在未來的發展上,許多研究單位估計2030年時,行動網路的傳輸需求將可能是現在80倍,英國亦開始探討釋出頻譜發展5G的可能性,以因應未來供不應求所導致的「容量危機」(capacity crunch )。

桃莉羊誕生十年 複製技術之醫療運用距收成階段仍遙遠

  十年前的 7 月 5 日 ,全世界第一隻複製的哺乳類動物桃莉羊在英國誕生。 複製羊成功的案例,吸引了如潮水般的錢潮,流入探索利用這項新技術的領域,諸如有關治療癌症、心臟病、阿茲海默症和其他嚴重疾病的研究。科學家應用在姚莉身上的技術是屬於「細胞核轉置技術」( SCNT ),簡言之,是把卵子的細胞核取出,然後把身體細胞的細胞核放入這個卵子中。在這個新建構的卵子中,只有來自身體細胞的染色體,而沒有原卵子的染色體,新卵子中僅含有提供身體細胞者的基因組,所以稱之為「複製」。科學複製有很大的潛在風險,代價又高,但它對醫學研究仍有很大的貢獻,其中最引人注意的,就是可取得胚胎幹細胞。   幹細胞是一群尚未完全分化的細胞,同時具有分裂增殖成另一個與本身完全相同的細胞,以及分化成為多種特定功能的體細胞兩種特性,在生命體由胚胎發育到成熟個體的過程中,扮演最關鍵性的角色。研究人員相信未來可以利用幹細胞,修復或是更換受傷或是病變的器官中的細胞或組織,特別是利用有患者自己基因的幹細胞組織移植,可以避免免疫系統的排斥現象。   當年科學家複製桃莉羊時所抱持之野心不小,然而這十年來,科學家們並沒有能夠達成以幹細胞治療人類疾病的目標,雖然因複製 技術本身具有高度爭議性,許多國家已立法予以規制,然卻依舊無法避免如 前首爾大學教授黃禹錫偽造幹細胞研究成果的醜聞發生,這項醜聞使原本即因幹細胞研究和倫理會產生衝突而不易獲得公私部門經費支持的研究工作,更為雪上加霜。   英國胚胎學者指出,回顧過去醫學研究史上的新發現,不論是試管嬰兒或是其他的技術,從第一次到最後技術完全成熟階段,都需要花很長的時間一步步完成,未來可能還需要五十年的時間,複製技術對醫學的貢獻才可能到達豐收階段。

Horizon Europe

  Horizon Europe為歐盟2021-2027年之科技研發架構計畫。科技研發架構計畫(Framework Programmes for Research and Technological Development,依不同期別縮寫為FP1-FP8)為全球最大型的多年期科研架構計畫,今期之Horizon 2020已進入尾聲,2021年起所實施的歐盟科研架構計畫──FP9正式命名為「Horizon Europe」。   為打造歐盟成為創新市場先鋒,延續Horizon 2020計畫成效,Horizon Europe重視投資研發與發展創新,包含強化歐盟的科學與技術基礎、促進歐洲創新能力,以及永續歐洲社會經濟的模式與價值。   Horizon Europe發展方向分為三大主軸,分別為: 卓越科學(Excellent Science):透過歐洲研究理事會(European Research Council, ERC)、新居禮夫人人才培育計畫(Marie Skłodowska-Curie Actions, MSCA)和研究基礎設施(Research Infrastructures)加強歐盟科學領導力。 全球挑戰與產業競爭力(Global Challenges and European Industrial Competitiveness):此主軸再分別發展6個子題,以應對歐盟和全球政策並加速產業轉型。該6個子題分別為(1)健康;(2)文化與創造力;(3)社會安全;(4)數位與太空產業;(5)氣候、能源與交通;(6)糧食、生物經濟(Bioeconomy)、自然資源、農業與永續環境。 創新歐洲(Innovative Europe):促進、培育和部署市場創新,維護友善創新環境之歐洲生態系統(European ecosystems)。   此外,Horizon Europe擬把實驗階段中具備高潛力和前瞻性的技術帶入市場,轉以任務導向協助新創產業設立,推動跨事業多方整合。

日本促進產學合作相關計畫簡介

  日本在促進產學合作,除了A-step計劃外,亦成立了創新中繼站構築援助事業(Support Program for Forming Innovation Hub)與創新中心(COI)等。   創新中繼站構築援助事業,由JST協助國立研發法人推動改革,以強化法人之效能,並做為大學與企業之中繼站,大學主司研究,企業則負責產業化階段,中間點則由JST與國立研發法人一同合作。JST負責召集人才、評定人才並進行創業援助、技術調查與分析。國立研發法人則提供人才培育及交流所需之資源(例如:機具設備的整修與提供,推動研究開發等等)。   創新中心(COI)則是政府預測未來10年之社會變遷及人口結構,再根據未來社會可能之需要,以建立理想社會為目標,通常進行具有高難度、高風險研發之創新中心。目前日本有18個創新中心分佈全國各地,由國家指定企業與大學共同進行,但是研究負責人只能是大學。

TOP