美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/02/19)
引註此篇文章
你可能還會想看
新加坡個人資料保護委員會針對企業蒐集、使用、揭露永久居留證(NRIC)號碼提出新的諮詢指引

  考量各行各業的從業習慣及民眾對企業蒐集、使用、揭露永久居留證(National Registration Identification Card, NRIC)號碼之看法,新加坡個人資料保護委員會(Personal Data Protection Commission, PDPC)於2017年11月提議修改個人資料保護法的諮詢指引(Advisory Guidelines on the Personal Data Protection Act ),明確界定企業蒐集、使用、揭露NRIC及其號碼之範圍。   依據舊的諮詢指引,新加坡個人資料保護法允許企業在基於合理特定目的並依法獲得當事人有效同意之情況下,蒐集、使用或揭露NRIC號碼。因此,不少企業活動習慣蒐集利用民眾的NRIC號碼,包括零售商店所舉辦的抽獎活動。然而,在PDPC提出新的諮詢指引後,企業可蒐集利用NRIC號碼的情況受到大幅限縮。   由於NRIC號碼與個人資訊息息相關且具不可取代性,無差別地蒐集利用將增加資料被用以從事非法活動之風險,故新的諮詢指引闡明,原則上企業不應蒐集、使用或揭露個人NRIC號碼或複印NRIC,除非有下列兩種例外情況之一:(一)法律要求;(二)為確實證明當事人身分所必要。第一種例外情況,雖因法律要求無須取得當事人同意,但企業仍應踐行告知義務,使當事人知悉NRIC號碼被蒐集、使用或揭露之目的,並確保企業內已採行適當安全措施,防止NRIC號碼被意外洩漏。第二種例外情況則仍須就NRIC號碼的蒐集、使用或揭露取得當事人同意,除非符合個人資料保護法規定下毋庸取得當事人同意之例外(如急救等緊急狀況)。   此外,PDPC針對得蒐集、使用或揭露NRIC號碼或複印NRIC的情況,以情境案例方式於諮詢指引中說明供企業參考,另給予12個月的審視期間,使企業得修正組織內部政策並尋找可行替代方案。

日本成立供應鏈資通安全聯盟(Supply Chain Cybersecurity Consortium)

  日本經濟產業省(下稱經產省)於2020年6月12日發布其國內產業資通安全現況與將來對策(昨今の産業を巡るサイバーセキュリティに係る状況の認識と、今後の取組の方向性)報告,指出近期針對供應鏈資通安全弱點企業所展開的攻擊,有顯著增長趨勢。為此,該報告建議共組供應鏈的企業間,應密切共享資訊;於關鍵技術之相關資訊有外洩之虞時,應向經產省提出報告;若會對多數利害關係人產生影響,並應公開該報告。遵循該報告之建議要旨,同年11月1日在各產業主要的工商團體引領下,設立了「供應鏈資通安全聯盟(原文為サプライチェーン・サイバーセキュリティ・コンソーシアム,簡稱SC3)」,以獨立行政法人資訊處理推進機構(独立行政法人情報処理推進機構,IPA)為主管機關。其目的在於擬定與推動供應鏈資通安全之整體性策略,而經產省則以觀察員(オブザーバー)的身分加入,除支援產業界合作,亦藉此強化政府與業界就供應鏈資通安全議題之對話。   只要贊同上述經產省政策方向與聯盟方針,任何法人或個人均得參加SC3。針對產業供應鏈遭遇資安攻擊的問題,經產省與IPA已有建構「資通安全協助隊(サイバーセキュリティお助け隊)」服務制度(以下稱協助隊服務),邀集具相關專長之企業,在其他企業遭遇供應鏈資安攻擊時,協助進行事故應變處理、或擔任事故發生時之諮詢窗口。而SC3則規畫為這些參與提供協助隊服務的企業建立審查認證制度。其具體任務包含擬定認證制度的審查基準草案、以及審查機關基準草案,提供IPA來建構上述基準。依該制度取得認證的企業,將獲授權使用「資通安全協助隊」的商標。同時在業界推廣協助隊服務制度,讓取得認證的中小企業得以之為拓展其業務的優勢與宣傳材料。

日本IT總合戰略本部提出數位程序修正法案,簡化行政流程並提高使用便利性

  日本IT總合戰略本部於2019年3月18日公告提出「數位程序法案(デジタル手続法案)」,本法案係集結多部法律修正案之包裹法案,包含行政程序網路化法(行政手続オンライン化)、居民基本簿冊法(住民基本台帳法)、官方個人認證法(公的個人認証法)、及個人編號法(マイナンバー法)。該法案的目的,在於應用資通訊技術簡化行政運作並提高使用便利性,藉此增進行政效率,因此在相關法令中明文擬定行政數位化的基本原則,增修推動行政程序線上辦理的共通規定與配套措施,賦予行政機關應履行的各項法定義務,同時為落實各領域推展行政數位化的規劃,制定個別具體規範。   於制定行政數位化基本原則、與增訂推動行政程序線上辦理的共通規定與配套措施之部分,主要為修正原「行政程序網路化法」,更名為「數位行政推進法(デジタル行政推進法)」,定位該法目標與功能為促進社會整體數位化,使國家、地方公共團體、民間業者、國民與其他人於從事各種社會活動時,均能享受到資通訊技術帶來的便利性。該法要求的基本原則,包含數位優先(digital first, 藉由數位手段一體化完成各項手續或服務)、免去重複提供資訊(once only,曾提供的資訊得被保留供再次使用)以及一步到位(connected one-step,謀求複數的程序或服務簡化為一步到位)。至於推動行政程序線上辦理的共通規定與配套措施,則包含要求地方公共團體須致力於達成行政程序線上辦理的目標,授權主管機關訂定得辦理網路身分認證與支付手續費等數位化法定程序、要求行政機關提出實現行政程序線上辦理與廢除紙本附件流程的資訊系統整備計畫等。   另一方面,針對各領域推展行政數位化的具體規範,該法案預備修正「居民基本簿冊法」、「官方個人認證法」以及「個人編號法」,主要內容包含:1. 保存個人電子認證資訊等相關官方服務的適用對象擴及旅外國民,同時得發行旅外國民之官方個人認證之電子證明書與個人編號卡,使其得透過網路使用相關的行政電子化服務;2. 長期且確實保存本人過去的居住遷徙紀錄,增設住民票註銷後原有相關記錄仍予以保留的「除票」制度,使國民過去的居住地紀錄,不會因為變更戶籍、依法註銷原戶籍地的住民票而消失;3. 過去使用官方個人認證之電子證明書與個人編號卡時須輸入密碼,官方個人認證法修正案則授權主管機關增設其他不需輸入密碼的使用方式,以呼應擴大電子證明書使用範圍的政策規劃;4. 賦予個人編號IC卡(マイナンバーカード)作為獨立有效之身分證明文件的地位,廢止原依法需和個人編號IC卡併用的紙本通知卡(通知カード)制度,免去個人住所等基本資料變更時,需同步更正通知卡紙本登載資訊的行政程序,減輕主管機關負擔。

英國電信市場競爭服務達到700萬線路

  英國的寬頻市場競爭在透過執行網路元件細分化(LLU)政策後,英國電信公司(BT)的對手競爭公司如Sky或TalkTalk,利用BT擁有的電話銅線,提供競爭通訊服務的線路數已達到700萬。這顯示英國電信管制機關Ofcom的細分化政策(LLU)已見成效。   這項政策係在2005年9月,由BT向Ofcom做出具有法律效力的承諾,Ofcom要求BT分拆成立一個新公司,稱為Openreach,負責向競爭對手提供線路出租的批發服務。Openreach是基於功能分離之實體,提供BT和其競爭對手完全一樣的交易條件,如契約條款、價格、系統和商業關係。   政策實施初期,英國電信市場僅有約12.3萬條細分化線路。多數人只能選擇BT作為寬頻及固網電話服務的供應商。   根據Ofcom的最新研究,目前英國有超過1900萬條寬頻線路。其中70%以上是由BT以外的其他公司提供服務,其中許多服務建立在BT的細分化網路元件的基礎上。   現有超過30家不同的公司,為家庭和小型企業提供非捆綁式(unbundled)服務。這有助於提升寬頻網路普及、降低固網電話的價格。與2005年9月相較,當時僅37%的家庭和小型企業有寬頻網路,現在這個數字是71%。   競爭對消費者而言,也帶來較低的費用。根據Ofcom的研究,在2005年最後一季時,消費者每月平均為寬頻網路服務支出約23.30英鎊。今天,他們為相同的服務每月付出大約13.31英鎊。   因此由零售價格、寬頻普及、競爭業者數量來看,英國的寬頻市場競爭已經達到一個重要的里程碑。

TOP