美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=645&tp=1 (最後瀏覽日:2026/05/20)
引註此篇文章
你可能還會想看
歐洲議會初步通過化妝品新法案,奈米化妝品成為規範之列

  奈米科技在化妝品領域之應用實例日益增多,對於此類產品之管理趨向也成各界關注的重點,可惜國際間遲遲未有突破性進展。   今(2009)年3月24日,歐洲議會初步通過化妝品規則之新法提案(提案編號:COM(2008)0049-c6-0053/2008-2008/0035(COD)),未來若獲正式通過,將可直接適用於歐盟各國。   就實質內容而言,歐盟在該規範中首次納入奈米科技之考量。其所界定之奈米材料為:「一種具有非溶解、抗生物性之材料,係經由人為單一或多次外部切割或內部建構,尺寸範圍在1至100奈米之間」。為確保奈米化妝品之安全性,該規範透過強制通報、安全評估,以及禁止使用有害人體健康之物質等機制進行管理。此外,化妝品倘若含有或使用奈米材料,製造人必須在產品包裝上之內容物清單中加以標明。   歐洲議會是以633位之多數票一讀通過了該法案,不過也有29位投票反對、11位放棄表示意見。 此外,各界對此立法之反應不一,消費者團體認為應儘早實施該法案;歐洲議會綠黨議員則對法案中的奈米材料之定義不予認同。   根據歐盟執委會評估,目前約有5%的化妝品使用奈米材料,主要是市面上銷售之防曬油、口紅以及抗老化乳霜。隨著此項運用趨勢的發展,很多消費者團體抱怨立法過於緩慢而無法趕上市售產品之發展腳步,而本次立法可望為奈米化妝品之管理開展新的契機與方向。

日本發布新版之農業資料利用推動報告,並透過資料交換及利用機制確保資料共享及協作

日本農林水產省於2025年9月在智慧農業網站上發布新版之農業資料利用推動(下稱報告),其內容包含2025年通過閣議決定之食材、農業、農村基本計畫,並指出為確保農業數位資料與人工智慧(下稱AI)之間的串聯應用,農業資料合作基礎平台(下稱WAGRI)的建立與資料協作、共有、提供功能是其不可或缺的要素。 報告指出,透過各式農業數位資料的蒐集與整合,諸如過往作物收成量資料、市場價格資料、土壤資料、農地資料、氣象資料等,並經過統合及分析後,可以達到提升作業效率及收益、減少勞動作業時間與器材損耗,以及降低環境負荷之效果。截至2025年9月為止,WAGRI網站上已提供高達223種農業數位資料相關的API,供農業領域從業者介接運用,並作為未來開發農業領域基礎AI模型的前置準備。 此外,報告亦指出WAGRI已於日本全國範圍內蒐集大量的農業數位資料,用以開發農業領域之基礎AI模型,並預計於2026年在WAGRI網站上提供基礎AI模型服務。未來農業領域從業者可透過WAGRI網站提供之基礎AI模型服務,輔以自身之農業數位資料,建立符合自身農業場域特性之特化型AI模型。 然而,報告亦指出不論是農業數位資料的API介接運用,還是將農業數位資料用以開發基礎AI模型,農業數位資料之法制配套仍需整備。因此,除了資料權屬等關係釐清外,報告特別提出於AI開發應用、資料共享之模式下,尚須建立「涵蓋資料整體生命週期之資料交換及利用機制」,包含資料對外公開之選擇權、資料提供之事前同意權、資料安全管理對策,以及資料刪除請求權等範圍,以確保農業數位資料在利用前的安心共享與協作。 我國政府如欲於農業領域發展基本AI模型,除應於全國範圍內蒐集大量之農業領域數位資料外,亦應建立串聯資料整體生命週期之資料交換及利用機制,以降低農業數位資料之間的協作風險。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

美國加州於6月28日通過新版個資隱私法規

  加州立法體系在2018年6月28日通過了美國最嚴格的個人資料隱私法規,該法案無異議通過,並已經加州州長Jerry Brown簽署同意,將於2020年1月1日施行,以賦予科技產業修正其內部政策的緩衝期間。   該法案之所以如此速戰速決,據媒體解讀是為了避免該法案內容成為加州11月選舉併公民投票之公投提案的一部分。如以公投方式通過這部法規,日後修正時將重新以公民投票進行,有造成修法困難的疑慮;而以立法者立法方式通過這部法規,賦予立法者有對其修訂改正權限,於日後能以一般修法程序進行修法。   該法案內容與2018年5月25日實施的歐洲GDPR規範相近似,將造成加州原先隱私權規範些許改變,與倡議最初法案不同的地方在於,揭露接受個資第三人的相關資料時需揭露該第三者之類型(category)而非其身分。   隨著本年度加州消費者隱私保護法(The California Consumer Privacy Act)的修法,大型科技公司如Google和Facebook等蒐集有大量消費者個人資料者,都將受到重大影響,依據該法,一般使用者可以向企業確認被蒐集的個資種類以及個資販賣流向,亦可以請求中止個資的蒐集及販賣,提升了一般使用者在以往對於個資使用上的地位。   自歐洲GDPR規範實施以來至目前,美國聯邦法尚未有相應強度之規範,本次加州修法可認係GDPR實施以來美國國內第一部因應而修正之法律。

歐盟執委會提出醫藥品管理整體配套方案,保障歐盟境內大眾用藥安全

  為確保歐洲民眾於健康醫療方面之利益,歐洲製藥工業協會聯合會(European Federal Pharnaceutical Industrial Association;簡稱EFPIA)於2009年2月17日,向歐洲議會(European Parliament)提出建議,並敦促其應儘速通過歐盟執委會(European Commission)於去年年底所提出一項關於醫藥品安全、創新與易近用性之議案。而一位業界代表Günter Verheugen於當(17)日會面後指出:「此次會面,主要是希望能就新近執委會所提交之醫藥品管理整體配套方案(Pharmaceutical Package),進行初步意見之交換與討論」。   由於保障歐盟境內民眾之健康安全,實乃歐盟決策者(Decision-makers)所應掮負之重要責任,故EFPIA總幹事Brian Ager於此次會面交流之前,亦曾高聲向歐洲議會與各會員國家呼籲,應優先將病患安全(Patient Safety)議題納入考量,並採取果斷之行動;同時,其也指明,歐洲醫藥各界為尋求各種可能落實之方法,先前早已經歷過各個階段,並遲延了決策做成之時機;故,此次會面,除要為執委會提案之審查,奠定啟動之基外,亦盼能再次集聚並挹注歐洲醫藥各界之能量,於保護歐洲人民健康安全相關之行動當中。   關於歐盟執委會於去(2008)年底所提出之議案,由於其中有多項內容對歐洲醫藥各界之影響實廣且深;因此,該項提案目前業已廣泛地受到EFPIA與業者之重視。此外,就此項醫藥品管理整體配套方案中擬採行之具體立法規範措施,實包含如後3個面向:首先,是欲透過規範擬提昇藥物警戒(Pharmacovigilance)方法之現代化;其次,強化管制規範以減少假藥滲入歐洲整體醫藥品供應鏈之機會;最後,則是要要提供高品質之健康與醫藥品相關資訊給有需要之病患或大眾近用(Access)等。   由此可知,未來歐盟整體醫藥品管理立法方向,將分由3個不同之角度出發;並同時朝「改善歐洲大眾用藥安全」之目標前進;不過,在進一步進行條文化之前,前述由執委會所提出之醫藥品管理整體配套方案,將會先交由歐洲議會與歐盟理事會官員共同進行初步之討論。

TOP