美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/03/24)
引註此篇文章
你可能還會想看
美國國家製造創新網絡2016年度報告

  依2014年復甦美國製造與創新法(Revitalize American Manufacturing and Innovation (RAMI) Act of 2014),美國國家製造創新網絡計畫於2016年2月公布年度報告(Annual Report)。國家製造創新網絡計畫的目標是處理發生於執行面的、介於初期基礎研究與技術布建之間的製造技術轉型(manufacturing related technology transition)挑戰。   國家製造創新網絡計畫的關鍵核心之一,是連結創新與製造,而「研發機構」(Institute)在這當中扮演最為關鍵的角色。此所稱之研發機構,係指2013年「國家製造創新網絡先期規劃」(NNMI-PD)以及2014年復甦美國製造與創新法(RAMI Act of 2014)第278s條(c)項所界定之「製造創新中心」(center for manufacturing innovation)——其採公私合營制(public-private partnership),其成員可包括各該業界之業者與學研機構,以及商務部長認屬適當之產業聯盟(industry-led consortia)、技職教育學校、聯邦政府所屬實驗室、以及非營利機構等。「研發機構」將以上之利害關係各方匯聚形成一個創新生態系(innovation ecosystem),以共同因應高風險之製造業挑戰並協助製造業者維持並提升產能與競爭力。   我國於民國105年7月由行政院核定通過之「智慧機械產業推動方案」,亦規劃透過「智機產業化」與「產業智機化」,建構智慧機械產業生態體系,整合產學研能量,並深化智慧機械自主技術中長期布局與產品創新。

美國聯邦貿易委員會第一起關於智慧聯網案例之簡介—In the Matter of TrendNet, Inc.

基因改造 70g胖老鼠減重成為40g

  中研院今天發表一份研究成果:利用「基因改造」,成功的將七十公克的胖老鼠減重到四十公克,而且沒有什麼副作用。未來經過人體實驗,將有機會成為人類減肥的最新方法。    研究團隊發現,脂肪細胞活性與細胞內的粒腺體含量有關,而「粒腺體」就相當於細胞的「火力發電廠」,專門幫助代謝熱量、並轉化為能量供體內使用。當脂肪細胞含有大量粒線體的時候,就可以自行代謝體內所堆積的油脂、健康瘦身。計劃主持人、分子生物研究所副研究員李英惠解釋:利用藥物刺激,可以誘發體內的一種「Gs蛋白」,在老鼠胚胎上進行基因改造,或是後天以藥物餵食老鼠,活化體內GS蛋白質,透過各種方式,証明GS蛋白質的確可以增加脂肪細胞中粒腺體含量和活性,慢慢的代謝掉細胞內堆積的油脂。研究團隊還意外發現,改造後的老鼠,不但不容易發胖,而且平均壽命還增加了20%。    目前動物實驗已經證明:體內具有這種改造過的脂肪細胞,不但不容易發胖,壽命也可以增長。未來經過人體實驗,將有可能成為人類「健康減肥」的最新方法。

任天堂將自YOUTUBE影片上傳者收取利潤

  YOUTUBE遊戲頻道 - Rooster Teeth’s Let’s Play的建立者Lewis Turner近期擁有111部上傳遊戲剪輯並超過74890次瀏覽量,現被任天堂(NINTENDO)控訴侵害著作權。   任天堂依YOUTUBE的Content ID政策,向Lewis Turner主張凡運用任天堂遊戲剪輯而賺取收益的部分,一旦這些剪輯被識別包含Content ID所認定之完整或部分的內容,均被要求需支付獲利予任天堂。Content ID為YOUTUBE 的著作權政策,有助保護企業並控制相關影片上傳的內容,藉識別使用者上傳的相關影片(視訊或音訊)的內容,與著作權人提供的內容比對是否侵權的功能,進而採取預先選擇的處理方式,如:透過影片賺取收益或封鎖這類的影片。   許多玩家習慣將時下流行的遊戲闖關歷程上傳至社群網站與其他玩家分享,展現如何破解高難度關卡,或進階的闖關技巧,任天堂此舉,招來許多玩家的不滿,甚至表示再也不玩任天堂的遊戲或上傳更多的遊戲歷程剪輯。一名”Let’s play”玩家表示:「電動遊戲非如電影或電視;當我看到別人正在看的影片,我可能不會再去看;但當我看到別人正在玩的遊戲,我會想自己體驗。每個遊戲過程,都有其獨特視覺經驗,藉由瀏覽遊戲歷程能夠引起購買慾望。」   對此,任天堂則聲明,若是為了持續推動並確保為任天堂的遊戲,仍可透過社群平台分享,即玩家仍可繼續在YOUTUBE上分享任天堂的遊戲歷程;而非像對待娛樂公司一樣,阻止玩家使用任天堂智慧財產權(著作權)的原因。

TOP