美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw//article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/01/19)
引註此篇文章
你可能還會想看
經濟部推動奈米標章,第一個奈米標章即將在今年發出

  市面上強調奈米的產品充斥,舉凡從燈管、面膜、瓷磚等各種產品都宣稱是奈米產品,因此經濟部決定推動奈米標章認證制度。該制度的推行,可讓消費者對奈米產品有更正確的認知和信任,對於鼓勵廠商開發優良奈米產品也有正面影響。   經濟部於今年辦理第一階段的技術初審,共有六家廠商通過,預定十月中旬將要進行第二階段的跨部會複審,只要能通過複審審查,就可以取得奈米標章。   有鑒於 奈米技術工業納入新興重要策略性產業已在日前拍板定案,為避免奈米標章浮濫,而可能造成租稅浮濫,經濟部指出,未來該標章的核發審查將審慎把關,預期僅很少數廠商的奈米技術工業可成為新興產業。

新加坡修正通過電子交易法

  新加坡於2010年5月19日修正通過電子交易法,並於7月1日正式施行。此次新修正之「電子交易法」,是依據新加坡資通訊發展局(Infocomm Development Authority,IDA)及司法部於2004到2005年間推行之公眾意見諮詢,進行法條之全面翻修。作為電子交易法制之先驅國家,新加坡於此次修法中納入聯合國「跨國契約中使用電子通訊公約」(United Nations Convention on the Use of Electronic Communications in International Contracts)之相關規定,此一公約旨在促進全球之電子通訊及交易以相同之法律模式加以運作。     該法之修正係為因應新加坡電子商務之日趨成長以及國民對電子化政府之需求,以建立新加坡成為全球可信賴之資通訊中心。此次修正重點如下: 一、參照聯合國「跨國契約中使用電子通訊公約」之規定,調整電子簽章之要件以及對於收發電子文件時間與地點之認定。納入以自動處理訊息系統做為契約訂立之方式,以電子文件作為正本以取代實體書面之正本文件,並就電子交易中要約之引誘以及電子通訊中發生錯誤時之解決方式加以規定,使新加坡之法律制度能與國際電子商務法律制度接軌。 二、促進民眾及企業與政府機關進行互動時,更有效率地使用電子文件相關服務,以加強電子化政府服務之應用。如提供綜合性電子表格,讓使用者僅需填寫一次相關資訊,即能利用不同種類的電子化政府服務。 三、對憑證管理中心之規範採用技術中立的認證架構,未來憑證管理中心不一定要使用公開金鑰基礎建設(Public Key Infrastructure,PKI)之相關技術作為提供驗證服務之方式,相對地,在其他技術逐漸開發之狀況下,也可採用其他技術提供驗證服務,如生物鑑識技術。當然,主管機關仍會以相同標準對採用不同驗證技術之憑證管理中心進行監督,以確保憑證服務之安全性及有效性。 。

中國大陸布局推動智慧城市建設,發布「2013年測繪地理信息藍皮書」

  中國大陸近年來積極布局智慧城市建設,並逐步將智慧城市的概念發展為具體的地理空間,2014年2月14日智能系統國家測繪地理信息局測繪發展研究中心--社會科學文獻出版社,發布2013年測繪地理信息藍皮書—《智慧中國地理空間智能體系研究報告(2013)》(以下簡稱「藍皮書」),揭示提出打造2030年智慧中國地理空間智能體系的具體目標。係以巨量地理資訊資源為基礎,透過新一代網際網路,以智慧聯網(Internet of Things, IoT)、雲端計算(Cloud Computing)和巨量資料(Big Data),實現地理資訊的智慧化應用,並透過相關政策形成以地理資訊獲取、處理及應用為主的雲端產業鏈。   自2013年起,中國大陸國家測繪地理信息局每年選擇10個城市作為智慧城市建設試點,目前已有太原、廣州、徐州、臨沂、鄭州等試點城市完成初步項目,正進行設計論證及完善基礎設施等工作。該局副局長李維森並指出,大陸將在2015年全面完成數字城市地理空間框架建設,並於此基礎升級為智慧城市。 中國大陸國土資源部亦從2013年底配合「十二五規劃」逐步推動以雲端運算、巨量資料以及智慧聯網等新一代資通訊技術所建構之「國土雲」,以滿足國土資源資訊利用、查詢、監管的需求,並透過資訊數位化,為其他領域重大工作提供基礎資訊。   從中國大陸近年來對於國家地理資源之蒐集、調查與管理手段觀察,可探知其對於國土資訊產業發展的高度重視,並欲在維護國土安全的前提下,加強推動有助於促進資訊流通效率以及資源廣泛利用的公共服務平台建設;對於此等具有國家安全戰略意義之新興科技領域,目前仍以國家投資為主要推動手段,後續相關法規發展殊值注意。

澳洲國家交通委員會提出「自駕車政策革新報告」,並展開「控制自駕車規範建議」意見徵詢

  2016年11月澳洲國家交通委員會(簡稱NTC)公布「自駕車政策革新報告」(Regulatory reforms for automated road vehicles Policy Paper),當中釐清對自駕車各項可能遭遇的法規障礙並設定修正時程,2017年4月16號NTC並進一歩依前份文件規劃提出「控制自駕車相關規範建議」討論文件,釐清自駕車的控制定義與相對應規範,並提出法制規範修正內容。   2016年澳洲政府並通過了關於陸路交通科技的「政策原則」(Policy Principles),其中包括政府決策時應基於改善交通安全、效率、永續發展和成果的可能實現,並且應以消費為中心等原則,這些原則構成了澳洲政府的政策框架。   澳洲NTC此份討論文件中,提出應釐清能「控制(in control)」自駕車的對象,此將影響自駕車事故的負責人為誰。NTC提出目前仍應定義人類駕駛為控制自駕車的一方而非自駕系統,以避免人類駕駛做出不適當的操作行為。   NTC並釐清「恰當控制」的定義。「恰當控制」為澳洲道路法規第297條第1項:「駕駛者不得駕駛車輛除非其有做出恰當控制」中所規範。恰當控制被目前的執法機關詮釋為駕駛者應坐在駕駛座上並至少有一隻手置於方向盤上。但「恰當控制」將因自動駕駛系統的操作方式受到挑戰。因此NTC認為「恰當控制」不一定需要將手置於方向盤上,而是要有足夠的警覺性和能即時進行干涉,此定義並應隨著科技發展而修正。   本次政策文件意見徵詢至2017年6月2日,收到意見後NTC將會意見納入未來的全國性實施政策方針,提交給澳洲交通與基礎建設諮議會(Transport and Infrastructure Council)通過,預計於2017年年底前完成此自駕車方針。

TOP