美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/01/30)
引註此篇文章
你可能還會想看
英國資訊委員會(ICO):企業應用巨量資料技術時可能得以合法權益為由處理個人資料

  英國資訊委員會(Information Commissioner’s Office, 以下簡稱ICO)最近對於2014年「巨量資料與個資隱私保護報告」(Big Data and Data Protection)進行公眾意見徵集。其中有意見認為ICO過度聚焦於以取得資料當事人同意為前提,才得以進行巨量資料統計分析技術應用;且未充分認知當資料控制者(企業或組織)具合法權益(legitimate interest)時,可能得以處理個人資料的可能。意者並進一步建議當資料控制者(企業或組織)符合合法權益時,應可將個人資料用於新用途,強調這種依據合法權益所進行之資料處理,應著重於該資料控制者(企業或組織)對於個人資料的責任(accountability),而非各別取得資料當事人的同意。   對此,ICO回覆,認為巨量資料統計分析技術的應用,應在資料控制者(企業或組織)的合法權益、與資料當事人的權利、自由與合法權益間,取得平衡。依據歐盟資料保護指令(Data Protection Directive)與英國資料保護法(Data Protection Act)的規定,資料控制者(企業或組織)得於具法定依據時,處理個人資料,例如取得個資當事人的同意處理其個人資料,或資料控制者(企業或組織)具法定義務處理個人資料(例如法院命令)。除此之外,企業或組織還可以主張於其對於個人資料具合法權益(legitimate interest),主張進一步處理個人資料(新用途),除非資料處理對於資料當事人的權利、自由與合法權益造成過份偏頗(unduly prejudice)的損害。ICO亦同意,資料的應用應著重監督資料控制者(企業或組織)與加強其責任(accountability)。   ICO除再度闡明在「巨量資料與個資隱私保護報告」,資料控制者(企業或組織)必須公平且通透(transparent)地處理個人資料,對於當資料控制者(企業或組織)發現個人資料的新用途時,亦明列出得依據先前所取得之資料當事人的同意進行個人資料的各種情況。   ICO建議,資料控制者(企業或組織)應當先行檢視資料當事人是否確實同意其個人資料的處理,或該資料控制者具處理個人資料之其法定依據。再者,如果不具上述二者之一,資料控制者(企業或組織)若需將使用個人資料於新用途,則必須另行取得資料當事人的同意,始得為之。此時,必須同時評估為了新用途所為之個人資料處理,是否與資料蒐集之特定目的相容(compatible)。   至於,判斷新用途是否與個人資料蒐集與處理之特定目的相容,部分取決於個人資料處理是否公平(fair)。這意味著資料控制者(企業或組織)必須對於為新用途所為之個資處理,提出對於資料當事人隱私影響之評估,以及該個資的使用與處理,是否仍合於資料當事人的合理期待。

歐盟針對電子通訊網路及服務之管制架構規範進行公開徵詢

  基於維持「更好的管制」原則,歐盟執委會針對電子通訊管制架構之內容,公開徵詢社會大眾的意見。   此一電子通訊管制架構,係包括「架構指令」(2002/21/EC)、「發照指令」(2002/20/EC)、「網路接續指令」(2002/19/EC)、「普及服務指令」(2002/22/EC)及「隱私及電子通訊指令」(2002/58/EC)五個指令。除了此了指令之規範上,此次公開徵詢內容尚包括執委會有關「相關市場的建議」(C(2003)497)。   諮詢議題內容,則包括「管制架構的優劣點」、「現行管制架構是否能達到預期目標」、「現行管制架構如何改進」,以及特定之主題,如「範圍及目標」、「匯流及科技發展」、「頻譜管理」、「市場競爭及網路接續管制」、「執照核發及使用權」等。公開諮詢時間至2006年1月24日止。

臉書(Facebook)被控告違反和解協議

  臉書(Facebook)在2011年11月與美國聯邦貿易委員會(Federal Trade Commission, FTC)針對用戶資料的隱私權問題達成和解,包括第一:臉書必須遵守其自行提出的隱私權政策;第二:臉書必須要事先得到使用者的同意,才能更改其資訊分享的設定;第三:當使用者刪除其帳號的三十天內,臉書必須實際上使任何人不能再取得相關資訊;第四:必須對新產品或服務建立並維護其隱私權保障的計畫;第五:在未來二十年內,臉書必須由獨立的第三人稽查其隱私政策,以維護使用者的資訊隱私保護。   但是公益團體電子隱私資訊中心(Electronic Privacy Information Center, EPIC)最近指控臉書的Timeline功能違反和解協議的第二條。在EPIC的指控中表示:臉書必須要事先得到使用者的同意,才能更改其資訊分享的設定。而Timeline的功能在2011年12月6日上線後,完全改變了使用者揭露其資訊的方式,強化使用者張貼的重要事件,並回溯資料至該使用者第一次登入臉書時(甚至更早至第一次輸入相關資料時)。雖然臉書提供七天時間給使用者可以編輯Timeline,刪除不希望公開的照片或貼文,但幾乎沒有人知道。EPIC因而要求FTC介入調查。

美國重新闡述無障礙通訊設備裝置

  為了落實美國2010年公布之21世紀通訊與視訊無障礙法(Twenty-First Century Communications and Video Accessibility Act of 2010,CVAA),讓身障者得以使用新興通訊技術,FCC於今(2013)年4月29日公布第二次報告與命令(Second Report and Order)。本次規範重點在修訂2011年對1934年通訊法(Communications Act of 1934)第716、718條之規範,使通訊服務與設備製造之業者,負擔更多的無障礙義務。   針對第716條,規範消費者終端設備,包括手機、筆記型電腦或平板電腦等,在安裝或具備瀏覽器後,將被視為具有提供先進通訊服務(Advanced Communications Services,ACS)之能力,而須提供身障人士無障礙使用非互連VOIP(non-interconnected VoIP)、電子通訊與視訊會議服務。第二次報告與命令相較於2011年,FCC將消費者終端設備皆納為先進通訊服務,而須承擔無障礙義務,本次規則限縮設備製造商之無障礙使用義務。至於第718條則是要求手機製造商與電信服務商提供之手機,如具有網路瀏覽器,則須能使視障者無障礙使用。例如以語音將網址輸入於地址攔(Address Bar)、或是準確使用工具鍵(例如是回復鍵),增加提供瀏覽器業者(e.g .微軟Google)之義務。   FCC要求2013年10月8日以後生產、提供的設備與服務,皆須符合第716、718條規範,使身障者更得方便使用通訊設備。不過, ACS在下述條件可不受無障礙使用限制: 1.手機無法進行相容。 2.設備為客製化、且未有公開販售。   美國於2010年時超過40%以上的成年人,使用網際網路收發郵件、或獲取即時消息,但是,身障者卻難以享有資通訊的便利性。是故,這次FCC對第716、718條重新闡述,是否能降低美國身障者之數位落差,更能受益於科技的進步,將是未來持續觀察的重點。

TOP