美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/11/25)
引註此篇文章
你可能還會想看
歐盟部長理事會通過第16輪對俄羅斯制裁規定,持續打擊規避管制行為

歐盟部長理事會(The Council of the European Union)於2025年2月24日通過第16輪對俄羅斯的制裁規定,以因應俄羅斯持續滿三年非法侵略烏克蘭的行為。第16輪制裁針對俄羅斯經濟中具有系統重要性的部門,例如能源、貿易、運輸、基礎建設和金融服務加強管制,並且加強打擊規避制裁的行為。 第16輪制裁中有關出口管制的黑名單交易對象、物流與金流的措施概述如下: 1.實體名單更新與反規避 (1)制裁名單新增管制理由,包括制裁支持不安全油輪(unsafe oil tankers)營運者。 (2)將74艘貢獻俄羅斯能源收入的船隻,列入制裁名單。 (3)對53家支持俄羅斯軍工複合體(military-industrial complex)或從事規避制裁的新公司(其中包括俄羅斯以外國家的34家公司),實施針對性的出口限制。 (4)實體名單新增83個實體(包括48名自然人及35個法人實體),例如支持俄羅斯軍工複合體、積極從事規避制裁、俄羅斯加密資產交易所,以及海事領域的公司。 2.軍民兩用項目出口管制 (1)違反化學武器公約,用於生產氯化苦(chloropicrin)和其他用作化學武器的防暴劑(riot control agents)的兩用化學前驅物(precursor)。 (2)用於製造武器的電腦數控(Computer Numerical Control,即CNC)工具機相關軟體,以及俄羅斯軍隊在戰場上駕駛無人機時使用的視訊遊戲控制器。 (3)鉻礦石及化合物。 3.金融業措施 (1)將13家提供專門金融訊息服務的金融機構列入實體名單。 (2)對於使用俄羅斯中央銀行金融訊息系統(Financial Messaging System of the Central Bank of Russia)規避歐盟制裁者,在交易禁令(transaction ban)中增加3家銀行。

美國針對政府雲端運算應用之資訊安全與認可評估提案

  為建構政府雲發展的妥適環境,美國於今年度啟動「聯邦風險與認可管理計畫」(Federal Risk and Authorization Management Program, FedRAMP),由國家技術標準局(National Institute of Standards and Technology, NIST)、公共服務行政部(General Service Administration)、資訊長聯席會(CIO Council)及其他關連私部門團體、NGO及學者代表共同組成的跨部會團隊,針對外部服務提供者提供政府部門IT共享的情形,建構一個共同授權與持續監督機制。在歷經18個月的討論後,於今(2010)年11月提出「政府雲端資訊安全與認可評估」提案(Proposed Security Assessment & Authorization for U.S Government Cloud Computing),現正公開徵詢公眾意見。   在FedRAMP計畫中,首欲解決公部門應用雲端運算所衍伸的安全性認可問題,因此,其將研議出一套跨部門共通性風險管理程序。尤其是公部門導入雲端應用服務,終究會歸結到委外服務的管理,因此本計劃的進行,是希望能夠讓各部門透過一個機制,無論在雲端運算的應用及外部服務提供之衡量上,皆能依循跨機關的共通資訊安全評定流程,使聯邦資訊安全要求能夠協調應用,並強化風險管理及逐步達成效率化以節省管理成本。   而在上述「政府雲端資訊安全與認可評估」文件中,可分為三個重要範疇。在雲端運算安全資訊安全基準的部份,主要是以NIST Special Publication 800-535中的資訊安全控制項作為基礎;並依據資訊系統所處理、儲存與傳輸的聯邦資訊的敏感性與重要性,區分影響等級。另一部份,則著重在持續性的系統監控,主要是判定所部署的資訊安全控制,能否在不斷變動的環境中持續有效運作。最後,則是針對聯邦資訊共享架構,出示模範管理模式、方策與責任分配體系。

微軟控告台灣廠商侵害該公司電腦滑鼠的專利權

  微軟公司(Microsoft)於上月30日向美國國際貿易委員會(ITC)控訴台灣致伸科技公司(Primax Electronics)侵害微軟公司的專利權,其中包含七項與電腦滑鼠有關的硬體專利權。     根據微軟公司所公開的資訊內容,該公司在與致伸公司協商授權協議未果後,已經向ITC提出控訴,要求ITC下令禁止致伸公司涉及侵權的產品進口到美國。此外微軟公司高層Horacio Gutierrez表示,在該公司提告之前曾多次與致伸公司協商相關授權條件,但致伸公司卻無授權的意願,因此才向ITC提出控訴。     微軟公司向ITC控告致伸公司侵犯該公司七項的專利權,這些專利權的內容主要是與電腦滑鼠的技術有關。其中一項為U2技術,該技術可以讓電腦滑鼠連結USB與PS/2二種不同規格的連接埠,並自動偵測目前在使用中的是哪一種連接埠。另外還有一項技術為TiltWheel,該技術使滾輪可以左右方向的滾動,並藉由傾斜方式讓滑鼠增添更多移動的功能。     一般來說,ITC收到專利相關案件的控訴後,會視案件的複雜程度,在12-18個月內完成審理及判決,因此本案後續判決結果尚有待觀察。

國際能源總署發布2022年再生能源報告,分析全球再生能源發展現況並預估未來趨勢

  國際能源總署(International Energy Agency, IEA)於2022年12月6日發布2022年再生能源報告(Renewable 2022),其整理和分析各國之再生能源政策和市場發展現況,並預測再生能源於2022至2027年間在電力、交通和供熱的部署情況,同時提出相關產業在發展上的主要障礙。報告重點如下:   (1)能源危機加速再生能源成長   烏俄戰爭所導致之能源危機,迫使各國加速其推動再生能源之政策,例:中國的十四五年規劃、歐盟的REPowerEU計畫,以及美國的降低通膨法案(Inflation Reduction Act)等等,將使2022至2027年間全球的再生能源裝置容量提升約2400GW,等同於中國目前電力的總量,其中歐盟、中國、美國和印度在未來五年間所建置之再生能源,將是過往五年的兩倍;而未來五年間全球成長之電力裝置容量中,再生能源的部分將占90%以上,並且,其總裝置容量將於2025年超越燃煤,成為最大宗的電力來源,其中,又將以太陽光電和風電為主要的發電方式。   (2)各國再生能源法制政策仍有進步空間   國家再生能源法制的不確定性、經濟措施不足、許可程序繁冗,以及電網設施的缺乏,都將阻礙再生能源的發展,若能消除該些障礙,包含簡化許可程序、改善競標方式及提升誘因機制,全球再生能源的成長速率將能再提升25%。   (3)再生能源轉換為氫氣之應用將大幅提升   隨著超過25個國家的氫能政策,全球用於電解產氫的風電和太陽光電裝置容量於2022至2027年間將達50GW,提升近100倍,而主要發展之國家為中國,其次則是澳洲、智利和美國。   (4)生質能的需求持續增加並需開發更多元的原料來源   國際對於生質能的需求將持續增加,在未來五年裡預計成長22%。其中,廢棄物和殘渣的利用是生質燃料重要的一環,至2027年時將有約三分之一的生質燃料來自該兩者,而在燃料需求擴增並造成供應壓力的情況下,則有待政策的推動和技術的研發,以開發更多元且永續的生質能原料。   (5)再生能源供熱的發展程度仍無法取代化石燃料   由於越來越多的供熱來源是依賴電力,而電力中再生能源的比例亦不斷提升,因此,2022至2027年間的再生能源供熱將會提升三分之一,而亦有部份原因是來自政策的推動,尤其是遭遇天然氣危機的歐盟。不過,依目前再生能源供熱技術的發展程度,還無法追上傳統化石燃料所能供熱的數量。

TOP