美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/12)
引註此篇文章
你可能還會想看
加拿大隱私主管機關發布個人資料保存與處理指引文件

  在世界各國,無論是公務機關或非公務機關,均無可避免地大量蒐集個人資料,這些資料包括一般民眾、雇員、顧客或潛在客戶等。對此,加拿大隱私委員會辦公室(Office of the Privacy Commissioner of Canada,簡稱OPC)發布關於「個人資料保存與處理指引文件:原則與良好實作」(Personal Information Retention and Disposal:Principles and Best Practices),以協助聯邦機構與私人機構對組織內部保有之個人資料,做好妥善保存與處理。   OPC建議組織應在內部制定相關管理政策與程序,並於指引文件中提出11項參考要點,其中包括1.是否定期審查蒐集個人資料與保有目的之關連與妥適性?多久審查一次;2.對於保有之個人資料及保存目的是否進行清查與盤點?多久確認一次?3.個人資料儲存的形式與地點為何?是否有備份?4.法律是否有規定最低保存期限?5.組織如何處理個人資料與相關備份檔案?6.對於儲存個人資料之裝置或設備,是否採行適當地安全維護措施?7.個人資料保管與處理相關政策的核決人為誰?8.對於利用資料生命週期追蹤資料,是否存在適當管制程序?9.內部員工是否了解並熟悉組織關於個人資料保存與處理之政策規定?;是否有制定文件銷毀之安全措施?10.資料等候處理期間是否受到安全妥善之保管?11.對於使用資料之第三方,是否有透過合約或其他機制進行有效監督管控措施?是否制定定期查核機制?等,期以協助組織掌握政策與程序制定要領。

以法制工具支援文化創意產業之發展與推動-文化創意產業發展法及相關配套子法

日本內閣府公布最新科學技術基本計畫草案,期以智慧聯網服務平台實現超智能社會

  日本內閣府2015年12月10日於「綜合科學技術創新會議」上公布最新「科學技術基本計畫」草案,預計將投入26兆日圓,約占GDP1%的資金。該計畫之法源基礎係1995年公布之《科學技術基本法》第9條第1項,要求政府自1996年開始制定以五年為期,整體、宏觀且跨部會之科技發展計畫,目前最新之「第五期科學技術基本計畫」將於2016年開始施行。   「第五期科學技術基本計畫」共計七章,作為本期計畫核心之第二至第五章,揭櫫四大原則及相應規畫: 一、 以未來產業創新及社會變革為方向創造新價值(第二章)   旨在發展對未來產業創新及社經變遷具有前瞻性之技術及服務,如智慧聯網、巨量資料、人工智慧等,並以此為基礎實現領先世界之「超智能社會」。 二、 因應經濟社會新課題(第三章) 1. 確保能源、資源及糧食供應穩定。 2. 因應超高齡化、人口減少等問題,打造永續發展的社會。 3. 提高產業競爭力及地區活力。 4. 確保國家安全及國民安全。 5. 因應全球範圍內發生的社經問題,並對世界發展做出具體貢獻。 三、 強化科技創新基礎能力(第四章)   企圖打破產官學界間障壁,加速人才流動及人才多樣化,對造成障礙之制度進行改革,此外,將增加青年及女性研究者比例,及提升學術論文品質。 四、 構築人才、知識、資金三要素的良性循環制度以朝向創新發展(第五章)   將透過產官學界合作,打造創新人才培育及適其發展之環境,強化國際知識產權及標準化之運用,並依國內各區域特性推動相關創新措施。   在這當中,「實現超智能社會」為本期計畫最重要之發展目標,由於資通訊技術高度發展帶動生產、交通、醫療、金融、公共服務等各方面之巨大變革,創造出新產品、新服務,卻也相應帶來新挑戰及社會問題,日本政府計畫打造「智慧聯網服務平台」(IoTサービスプラットフォーム),將內閣府2015年6月19發布之「科學技術創新綜合戰略2015」中所列舉的11個系統分階段完成串連整合,以推動跨系統間之數據應用,達成各科學領域巨量資料之流通使用,同時兼顧資訊安全保障的「超智能社會」。

新國際協定針對未經請求之行銷電話或電子訊息展開聯合行動

  加拿大隱私專員於2016年6月14日表示,制定支持全球電信監管機構和消費者保護機構,針對垃圾郵件和行銷騷擾電話之跨境共同合作協議。   倫敦行動計畫(London Action Plan)備忘錄(MOU)之簽署國,現已可針對打擊跨國界或逾各個國家監管部門範圍之犯罪從事者的執法行動,相互分享資訊和情報,以獲取協助。   包括加拿大隱私專員辦公室(OPC)在內,目前既已簽署方分別為:澳大利亞通訊及傳媒管理局;加拿大廣播電視和電信委員會、韓國訊息安全局(KISA)、荷蘭消費者和市場監管局(ACM)、英國資訊委員辦公室及公民諮詢局、紐西蘭內政部、南非國家消費者委員會、美國聯邦貿易委員會和聯邦通訊傳播委員會。其他國家之政府當局亦表示願提交備忘錄,以及將來可能加入之意願。   對於加拿大隱私專員辦公室而言,這項協議將有助於達成加拿大反垃圾郵件法(CASL)關於電子郵件地址蒐集和間諜軟體之調查義務與責任,並與具有相同任務之夥伴機構間,進行偵查技巧及策略之分享。   加拿大隱私專員辦公室致力於和國內及國際夥伴合作,並已與國內之CASL執法合作夥伴及其他許多國家的隱私保護機構簽訂協議。

TOP