美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/12/07)
引註此篇文章
你可能還會想看
歐盟執委會發布關於歐洲境內資料流監控之新研究

  歐盟執委會(The EU Commission)於2022年2月3日發布了一項研究,其繪製並預估歐盟27個成員國以及冰島、挪威、瑞士和英國等國家彼此之間的主要雲端基礎設施的資料流量。該研究概述了各級產業、位置、企業規模和雲端服務類型的雲端資料流入和流出的流量和類型。政策、決策者、商業領袖與公共行政部門可以將其作為參考,以支持對未來貿易協定、工業決策和雲端投資的決策。   在歐盟的歐洲資料戰略中,認識到獲取有關資料流的經濟情報的戰略重要性,因此提出了資料流戰略分析框架的發展。為了實現這一關鍵行動,歐盟執委會開展了上述關於繪製資料流的研究,首次開發和測試了一種全新、自我維持與可複製的方法,從而產生了資料流可視化工具,用於測量、映射和分析歐洲31個國家與地區的各級產業、地理和企業規模的雲端資料流。而該資料流可視化工具中顯示的資料預計將每年更新一次。使用的資料收集來源從官方統計資料等主要來源到調查和訪談等次要來源。   該工具得以讓歐盟執委會: 一、繪製和估計歐盟27個成員國(即歐盟內部資料流)和冰島、挪威、瑞士和英國(即歐盟外資料流)的雲端計算領域主要資料流的數量 二、預測至2030年的資料流出 三、分析各產業、公司規模和雲端服務類型的資料流量   該研究顯示2020年最大的資料流來自醫療衛生產業,而德國的資料流入量最大。該報告還估計,到2030年,來自歐洲企業的資料流量將是2020年的15倍。   作為資料流市場關鍵層面之一,透過進一步調查資料趨勢,將協同即將出現的資訊法案打造一個更加生動、動態和流動的雲端市場。

美國佛羅里達州「基於保險目的之基因資訊法」最新修正於2020年7月1日正式施行

  美國佛羅里達州州長於2020年6月30日簽署「基於保險目的之基因資訊法」(Genetic Information for Insurance Purposes)法律修正案,並於2020年7月1日正式生效施行。本次「基於保險目的之基因資訊法」修正重點有二: 將「人壽保險」和「長期照護保險」保險人納入「禁止僅根據個人基因資訊即取消、限制、拒絕承保或設定不同保險費費率」之列; 明確規定醫療保險、人壽保險及長期照護保險之保險人,不得基於保險目的,向要保人、被保險人索取基因檢測結果,或要求要保人、被保險人須完成基因檢測後方同意核保。   同時,本次「基於保險目的之基因資訊法」修正理由亦明確說明:禁止醫療保險、人壽保險及長期照護保險之保險人利用基因檢測結果,並非禁止保險人依據醫療紀錄和醫療診斷結果進行核保或計算保險費費率,以此釋疑保險人對此次修正之擔憂。   美國聯邦參議院於2008年即通過「基因資訊平等法」(Genetic Information Nondiscrimination Act of 2008, GINA),惟「基因資訊平等法」僅禁止醫療保險保險人利用基因資訊進行核保,並未禁止其他類型之保險人。美國佛羅里達州本次修正「基於保險目的之基因資訊法」將人壽保險和長期照護保險一併納入規定,是全美首次擴大禁止利用基因資訊進行核保之保險類型。

日本政府公布「日本再興戰略2016 (草案) 」,並以實現第四次工業革命為主軸

  日本首相官邸之「日本經濟再生本部」於2016年5月19日召開第27次「產業競爭力會議」,並於該會議上提出「日本再興戰略2016(草案)」進行討論。再興戰略以實現「第四次工業革命」為主軸,透過活用IoT、巨量資料、人工智慧(AI)、機器人等技術,目標在2020年創造出30兆日圓的市場附加價值。為了推動相關政策,今年夏天將會成立具備統整指揮機能之「第四次工業革命官民會議」,該會議下並設置「人工智慧技術戰略會議」、「第四次工業革命 人才育成推動會議(暫定名稱)」,以及「機器人革命實現會議」。   「日本再興戰略2016(草案)」,特別對於製造業相關之議題提出討論。再興戰略指出,日本相較他國,雖然在網路空間的「虛擬資料(バーチャルデータ)」平台方面發展較晚,然而在健康資料、交通資料、工廠設備運轉等「即時資料(リアルデータ)」領域有潛在的優勢,因此為了讓日本的企業超越目前的框架,將以建構取得「即時資料」之平台為目標。綜整「日本再興戰略2016(草案)」具體重要政策方面如述,包括: (1)日本政府認為,第四次工業革命普及的關鍵,在於根據中小企業的現場需求,導入IT及機器人等技術,因此將請機器人專家支援,在兩年內將技術導入1萬家以上的企業。 (2)人工智慧的研發係屬第四次工業革命的基礎技術,因此要建構提供AI軟體模組工具,以及推動標準化的完善環境,並於今年內提出研發及產業化的具體施政內容,並留意開發人工智慧的透明性、控制可能性等原則及國際動向。 (3)關於產業活用區塊鏈技術(Block chain)、整備制度促進資料流通等議題,預計於今年秋天提出對應方針。 (4)於「機器人革命倡議協議會」檢討製造業之商業模式改革、與德國共同提案國際標準化及先進案例。 (5)於2020年以前,運用傳感器蒐集資料,創造50件以上,工廠和總公司間,企業和企業間等超越組織框架的先進案例,並提出國際標準。 (6)進行智慧工廠實證,建構具備AI技術的自動化模組以及智慧的產業保全。此外,為超越既有企業間的框架,將於機器設備進行資料共有及活用的實證,並根據實證結果修正相關制度。 (7)整備促進資料利用的環境,特別著重能夠蒐集、分析的資料平台,形成健全的資料流通市場。因此,為釐清彼此的權利義務關係,今年內個人資料保護委員會將提出相關交易指針。 (8)強化智財紛爭處理系統,將徵詢產業界的意見,於今年提出法制改革的結論。 (9)強化中小企業的智財戰略以及必要審查體制,協助其申請及活用專利權,預計明年度開始擴大支援業務,負責機關為獨立行政法人工業所有權資料‧研修館(INPIT)。

何謂德國「中小企業創新核心計畫」(Zentrales Innovationsprogramm Mittelstand)?

  中小企業創新核心計畫(Zentrales Innovationsprogramm Mittelstand ,以下簡稱ZIM)是一項覆蓋全國範圍、不限制技術領域和行業的補助計畫,補助對象除中小企業外,還包括與之合作的研究機構。該計畫整合過往其他許多補助計畫,德國聯邦經濟與能源部於2015年1月公佈了最新的ZIM計畫實施方針,擴大受補助中小企業的範圍,且提高資助資金的數額,將對企業補助的最高數額從35萬提高到38萬,對研究機構補助的最高數額從17.5萬提高到19萬歐元,以持續提升德國中小企業的創新能力與競爭力;企業與合作研究機構可以在補助的架構下針對先進技術研發獲得資金,研發主題不限,重點在於創新內容與市場價值。   ZIM計畫中的中小企業為員工人數不超過499人,同時年營業額低於5000萬歐元或資產負債表總額低於4300萬歐元的企業。在此基礎上,ZIM計畫中分為以下三種補助類型: 1.ZIM個人計畫(ZIM-Einzelproejkte):補助個別經營企業的研發計畫。 2.ZIM合作計畫(ZIM-Kooperationsprojekte):補助兩個或兩個以上的企業或研發機構之共同研發計畫。 3.ZIM網狀型合作計畫(ZIM-Kooperationsnetzwerke):補助在創新網狀架構下至少六個中小企業合作之全面性研發計畫。

TOP