美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/05/25)
引註此篇文章
你可能還會想看
開放原始碼撤出蘋果Safari?

  兩年前蘋果選擇開放原始碼成像引擎( rendering engine ) KHTML 做為 Safari 瀏覽器的基礎;兩年後,蘋果則打算以自己的程式碼取代該引擎,藉以解決相容性的問題。 KHTML 成像引擎──也是其瀏覽器的核心,考慮在其架構上放棄 KHTML 的程式庫( code base ),或者所謂的「樹狀圖」( tree ),改用蘋果自己的版本,也就是所謂的 WebCore (網頁核心)。 KHTML 原本是為了要在 KDE ( K Desktop Environment )上執行而撰寫的──這是 Linux 和 Unix 作業系統的介面。   Safari 並不是蘋果唯一以開放原始碼為基礎的軟體,其麥金塔( Macintosh )作業系統就是以達爾文( Darwin )開放原始碼計畫為基礎。   企業在某些方面受到限制,而開放原始碼社群以不受限制為傲。蘋果自己內部有些問題搞不定,以致銜接不上 KDE 開發 KHTML 的模式,導致 KHTML 與 Safari 逐漸產生分歧,後來情況則越來越嚴重。

內政部、經濟部發佈「新建建築物節約能源設計標準」,自七月一日施行

何謂電子菸?

  由於電子煙係利用電流通過霧化器,加熱煙彈(液)內之液體,因該液體混有尼古丁、丙二醇(分子式為C3H8O2,可作為食品添加物)及其他香料,可模擬吸菸時產生類似煙霧的蒸氣及味道。惟縱使電子煙不含焦油,仍可能混有尼古丁和其他化學物質,對於身體健康仍有一定的影響。因此,許多國家基於國民健康等因素,且電子煙之煙彈(液)因可能混合薄荷、水果香味等,造成未成年人誤以為非一般菸品而進行吸食,故多採取必要之管制,例如:禁止電子煙廣告、促銷或贊助。   依我國菸害防制法第14條規定,任何人不得製造、輸入或販賣菸品形狀之糖果、點心、玩具或其他任何物品。違反者,依同法第30條規定,對製造、輸入業者,處新臺幣1萬元以上5萬元以下罰鍰,並令限期回收;屆期未回收者,按次連續處罰;對販賣業者,處新臺幣1千元以上3千元以下罰鍰。此外,違反藥事法第69條規定,非藥物不得為醫療效能之標示或宣傳之規定,故電子煙如宣稱具有「幫助戒菸」、「減少菸癮」或「減輕戒斷症狀效果」等有醫療效能的詞句,即在禁止之列。

蘇格蘭期望透過刑事司法革新,強化數位證據資料之管理,以提升刑事司法之效率

蘇格蘭於2024年9月24日向刑事司法委員會提交刑事司法革新與家庭暴力審查法案(Criminal Justice Modernisation and Abusive Domestic Behaviour Reviews (Scotland) Bill),期望透過數位程序,提升司法部門的有效性與效率。 在刑事司法數位化部分,主要為將2020年及2022年因疫情而制定的臨時措施正式化,臨時措施包含: 1、在訴訟文件上使用電子簽名。 2、以電子方式寄送訴訟文件。 3、以虛擬方式參加刑事法庭。 4、提高定額罰款限額。 5、羈押的全國管轄權。 此外,在刑事司法數位化部分,亦新增兩項數位創新條款,例如透過數位證據共享功能(Digital Evidence Sharing Capability, 下稱DESC)平臺來進行: 1、在刑事程序中使用證據照片而非實體證據。 2、使證據之複製品效力等同於實體證據。 對於刑事司法革新與家庭暴力審查法案而言,DESC在其中扮演了十分重要的角色。DESC改變了數位證據的儲存、編輯、傳輸以及在法庭上展示的方式。且DESC可透過多種身分驗證,並透過系統自動生成之具唯一性的資料識別碼並記錄上傳者及上傳時間,資料上傳系統後亦會自動留存所有資料編輯、修改、刪除行為等審核措施,確保數位證據的正確性、完整性與可驗證性,防止數位證據在上傳DESC後遭到竄改或損毀,亦可透過資料識別碼的比對確保數位資料的正確性與完整性。 蘇格蘭提交的刑事司法數位化與家庭暴力審查法案顯示,數位技術的應用範圍已擴大到司法領域,並透過身分驗證、記錄上傳者、上傳時間及資料識別碼等資料存證技術,確保數位證據資料的正確性、完整性與可驗證性。我國由司法院、法務部、臺灣高等檢察署、內政部警政署及法務部調查局等機關合作,透過區塊鏈技術建置「司法聯盟鏈共同驗證平台」,提升辨識數位證據同一性之效率,並確保數位證據難以被竄改,以達到加速訴訟進行之效果。惟如要透過法院採納數位資料為證據之方式,來達到加速訴訟進行之效果,重點在於要強化針對數位證據資料之管理,有訴訟證明需求的組織須通過b-JADE證明標章,以確保上鏈前之資料管理與上鏈後之資料品質。我國企業如欲強化數位資料的正確性、完整性與可驗證性,可參考資訊工業策進會科技法律研究所創意智財中心所發布之重要數位資料治理暨管理制度規範(EDGS),建立資料存證制度,確保數位資料作為證據之效力,以提升法院採納數位資料作為證據之可能性,亦有利於加速訴訟程序之進行。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

TOP