美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/03/04)
引註此篇文章
你可能還會想看
普利司通公司就安裝在美國汽車中之零組件價格壟斷乙案認罪,並同意支付4億2仟5佰萬美元刑事罰金

  美國司法部宣布日商普利司通(Bridgestone Corp.)股份有限公司,就其共謀操縱安裝於汽車中並銷售至美國及其他國家之汽車防震橡膠零組件價格乙案認罪,並同意支付4億2仟5佰萬美元之刑事罰金。   根據俄亥俄州(Ohio)地方法院所提起的一項重罪控訴,該公司於美國及其他國家共謀參與分配銷售、操縱報價及壟斷、提高並維持其出售予豐田(Toyota)、日產(Nissan)汽車公司、富士重工業(Fuji Heavy Industries)公司、鈴木(Suzuki Motor)公司、五十鈴(Isuzu Motors)汽車公司及其某些子公司、加盟和供應商之汽車防震橡膠零組件價格。除了刑事罰金外,普利司通公司並同意配合司法部進行後續之汽車零組件案調查。本認罪協議(plea agreement),業經法院批准。   在2011年10月,普利司通公司即因「海洋軟管」(marine hose)乙案涉嫌壟斷價格及違反「海外貪污防治法」(Foreign Corrupt Practices Act)而遭控訴,經認罪協議並支付2仟8佰萬美元罰金。但於是案答辯中,該公司並未就其同時涉及防震橡膠零組件共謀操縱價格乙情,主動為揭露。該公司未主動揭露上情,乃是本次罰金高達4億2仟5佰萬美元原因之一。   美國司法部副助理部長Brent Snyder表示:「美國司法部反托拉斯署將針對屢犯卻未主動揭露其他反競爭行為者,採取強硬態度。本案之鉅額罰金,即重申該署致力於令企業就其傷害美國消費者之行為,負起責任。」普利司通公司遭指控因價格壟斷違反謝爾曼法案,依法最重可處1億美元之刑事罰金。如企業因犯罪所獲利益之兩倍數額,或犯罪被害人所受損失之兩倍數額,其一逾前開法定最高罰金時,得加重至該數額。

談我國基因改造生物田間試驗管理規範之現況與修正方向

美國擬制訂私人通聯記錄保護法案

  美國國會能源及商業委員會( Energy and Commerce Committee )於 2006 年 3 月 8 日 透過匿名表決的方式,通過「防止詐欺取得通聯記錄法」草案( Prevention of Fraudulent Access to Phone Records Act ),希望透過立法的方式保障消費者之隱私權,並要求電信公司加強保護消費者之通聯記錄。由於各黨派對本法案已有共識,故預計於近期排入國會議程後,順利完成立法。   根據美國國會議員 Joe Barton 表示,美國目前對於電話通聯記錄的取得並未進行規範,任何人均可輕易的透過網路購得相關資料。由於通聯記錄中往往包含許多個人之隱私或是敏感性資料,部分不肖之徒(如身份竊盜者、非法的個人資料販賣商)會藉此故意取得個人通聯記錄,以窺探隱私,甚或以此進行犯罪行為。   有鑑於此,美國計畫透過本法案,嚴格禁止以詐騙方式取得電話記錄的情形,並賦予聯邦公平交易委員會( Federal Trade Commission )有權對違反本法規定者進行民事處罰。此外,本法案亦要求電信業者必須符合本法規定之資料安全保護的要求,若違反本法之規定而造成損害,單一案件得處以最高 30 萬元之罰鍰,若為多重案件,則得處以 10 萬元以上 300 萬元以下之罰鍰。

新加坡通過第一個個人資料保護法制

  新加坡於2012年10月15日通過該國第一個消費者個人資料保護法案,該法案主要規範私人機關蒐集、利用以及揭露個人資料之行為,將於2013年1月正式施行。   該法案亦成立新加坡個人資料保護委員會(Personal Data Protection Commission, 以下簡稱PDPC),並成立拒絕來電登記處(Do-Not-Call Registry),該處由PDPC進行維運。PDPC將是新加坡主要掌管個人資料保護的主管機關,而且也負責推動個人資料保護法案以及被賦予增進新加坡人民個人資料保護認知之任務。    於該法案之規劃中,資料當事人可以在拒絕來電登記處註冊其位置在新加坡之電話號碼,以防止私人機關為了商業行銷之理由而進行電話行銷。假設資料當事人已完成相關登記卻持續收到行銷電話時,可以向PDPC進行申訴。    除此之外,私人機關於蒐集、儲存個人資料前,必須尋求消費者之同意,而且必須通知當事人資料蒐集之目的。私人機關於傳輸個人資料至新加坡境外時,也必須確保以提供相對安全的個人資料保護作法,例如透過契約或者協議之簽訂等。    違反個人資料保護法規之公司,每一個違反事件可能被科以最高美金820,000元之罰鍰,對於每一個消費者最高可能必須負上美金8200元之賠償責任。法律施行後,企業被賦予18個月的法規遵循準備期間,而停止打來登記處預計將於2014年年中設置完成。

TOP