美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/05/20)
引註此篇文章
你可能還會想看
日本發布《IoT產品資安符合性評鑑制度建構方針》順應國際IoT產品資安政策趨勢

日本經濟產業省於2024年8月23日發布《IoT產品資安符合性評鑑制度建構方針》(IoT製品に対するセキュリティ適合性評価制度構築方針),以順應國際IoT產品資安政策趨勢,因應日益嚴重的資安威脅。 本制度為自願性認證制度,由情報處理推進機構(情報処理推進機構,簡稱IPA)擔任認證機構進行監督。以IoT產品為適用對象,制定共通因應資安威脅之最低標準,再依不同產品特性需求,制定不同符合性評鑑等級,依評鑑結果進行認證,授予認證標章。不同評鑑等級差異如下: 1.等級一:為共通因應資安威脅之最低標準,可由供應商進行自我評鑑,並以評鑑結果檢查清單申請認證標章,IPA僅會針對檢查清單進行形式確認。 2.等級二:係考量產品特性後,以等級一為基礎,制定應加強之標準,與等級一相同係由供應商評鑑,自我聲明符合標準,IPA僅會針對檢查清單進行形式確認。 3.等級三:係以政府機關或關鍵基礎設施業者為主要適用對象,須經過獨立第三方機構評鑑,並以IPA為認證機構進行認證,確保產品值得信賴。 本制度可協助採購者及使用者依資安需求,選用合適的IoT產品,亦有助於日本與國際IoT產品資安符合性評鑑制度進行協作,達成相互承認,減輕IoT產品供應商輸出海外之負擔。

大倫敦政府推動城市資料市集,期尋求資料利用及隱私保護間之平衡,建立民眾對資料市集之信賴

  資料利用之層面越來越廣,且無論是基於商業或公益目的,產生越來越多難題。穿戴式裝置及物聯網的發展,亦使得資料之蒐集利用及界線等問題更顯其重要性。有鑑於此,大倫敦政府(Greater London Authority, GLA)在今(2016)年3月公布「倫敦城市資料策略」(London City Data Strategy),積極推動「城市資料市集」(City Data Market),期將倫敦打造成世界首屈一指的智慧城市。   增加大眾對資料市集之信賴並減少疑慮乃「倫敦城市資料策略」之一環,近年在英國有一系列新法上路,除新的歐盟資料保護規範(GDPR)外,英國國內有關「開放銀行」(open banking)之新規範,以及已有能源及電信公司參與之MiData initiative等,上述機制均為促使個人更容易掌握其個資被利用之狀況。   大倫敦政府亦推動「倫敦資料交易」(London Data Exchange),大眾可利用此一機制掌握其個資流向。其中有關建置新的數位符號(digital tokens of proof),使民眾未來可利用此等符號證明符合特定資格,例如在道路受檢時,毋須拿出駕照說明個人姓名、地址、出生年月日等資料,利用該等符號,便可判定符合駕駛年齡。   近期,大倫敦政府透過資料科學合作夥伴(Data Science Partnership)推動資料科學倫理架構(Framework for Data Science Ethics),著手研究民眾對資料交易新機制的反應,試圖在資料利用與法律和道德問題間尋求平衡。

新加坡通訊與資訊部發布「數位連結性藍圖」,以提升數位基礎設施數量、效能、安全性與能源效率作為戰略性優先事項

新加坡通訊與資訊部(The Ministry of Communications and Information)轄下資通訊媒體發展管理局(Infocomm Media Development Authority)於2023年6月5日公布「數位連結性藍圖」(Digital Connectivity Blueprint, DCB),指出新加坡將透過數位基礎設施的建置,實現提升網路容量、最大化運算能量、整合基礎設施集合(infrastructure stack,即將多個基礎設施作為一整體進行定義、提供與更新)、確保安全與韌性,以及永續性設計(Design for sustainability)目標,並識別五項戰略性優先事項如下: (1)在未來十年將海底電纜數量提升為現有的兩倍; (2)透過將新加坡國家寬頻網路(Nationwide Broadband Network, NBN)的頻寬提高十倍、分配頻譜予5G專網(Standalone, SA)等方法,於未來五年內建構並提供無縫、端到端且速度高達10 Gbps的國內網路; (3)與供應商合作,強化運算基礎設施的透明性與可歸責性,並與國際最佳作法保持一致; (4)為新的綠色資料中心(Green data centre)制定長期成長路線圖並使其更具能源效率; (5)推動對新加坡數位公用設施(Digital Utility, DU)集合的採用,以擴張無縫數位交易的優勢,並持續探索能從現有DU中受益的使用案例。 除戰略性優先事項外,新加坡將在更新興且前沿的領域中採取行動,具體措施包含: (1)在未來十年推動新加坡量子安全(Quantum-safe)願景; (2)為普遍的自動化系統使用奠定基礎; (3)透過測試平台與沙盒建立利害關係者生態系統,推動綠色軟體(green software)的開發、標準制定與評估; (4)透過低軌道衛星服務為關鍵產業提供創新解決方案。

WHO發布《2019‑nCoV戰略準備和應對方案》呼籲全球加速研發創新以對抗疫情

  2020年2月3日,世界衛生組織(World Health Organization, WHO)發布《2019新型冠狀病毒戰略準備和應對方案》(2019 Novel Coronavirus: Strategic Preparedness and Response Plan),呼籲全球合作以加速研發創新,對抗新型冠狀病毒(2019 novel coronavirus, 2019-nCoV)。WHO提出的戰略目標包含六大項:限制人與人間的傳播防止疫情擴散、盡速發現並隔離以便提供患者最佳照護、查明並減少動物來源的傳播、加速診斷治療和疫苗開發、傳達重要且正確的風險與事件資訊、透過合作夥伴關係減少疫情對社會經濟影響。而WHO設立的戰略目標,可以透過以下方式實現:(1)加速建立國際協調方案,透過現有機制及合作夥伴關係提升防疫戰略、技術及業務支持。(2)擴大各國家的災難準備與緊急應變行動方案,包括加強準備、迅速發現、診斷並進行治療;在可行的情況下發現並追蹤感染者;強化醫療機構中的感染預防及控制;實施旅行者的健康管理措施;提升人民對疫情風險認識、減少社區交流風險等。(3)加速對2019‑nCoV的研究及創新,優先推動快速篩檢追蹤與擴大研發創新規模、開發候選療法、疫苗及診斷方法,確保醫療資源的公平可用性。藉由防疫標準化流程與知識平台的建立,促進並匯集學界合作的研究成果。   另外,WHO在本戰略中明列出八大衡量指標,用以評估各國因應2019-nCoV的計畫準備與成效,以便WHO能與政府合作,共同改善全球防疫系統。該八大指標分別為:流行病學症狀分析與疫情規模判斷能力、戰略準備及預算管理計畫、防疫物資供應程度、研究開發與臨床實驗比例、國家公共衛生系統疫情準備能力、建構檢驗與快篩的即時通報系統、完善診斷流程與安全隔離措施、疫情報告與資訊分享機制等。

TOP