美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/28)
引註此篇文章
你可能還會想看
美國發明法(America Invents Act)修正法案通過,為美國專利制度寫下里程碑

  美國參議院在2011年9月通過發明法修正案(Leahy-Smith America Invents Act),並經總統歐巴馬簽署同意公布,預計新修正的法案內容,將為美國專利制度寫下里程碑。觀察該法案幾項重要變革包括: 一、 專利權之取得:以先申請制(First to file)取代先發明制(First to invent),目的在於增進美國專利制度與國際專利制度的調和,以及確保發明人的權利保障可與國際普遍的制度接軌。新規定將自2013年3月16日開始實施。 二、 先前技術(prior art)之定義與新穎性優惠期(grace period):新法擴張先前技術(Prior Art)之範圍,申請專利之發明於申請日之前,如已見於刊物、已公開使用、已銷售或其他公眾所得知悉者,即因已公開而成為先前技術之一部分,喪失新穎性。惟在例外的情況下,申請專利之發明,在申請日前一年內由發明人或共同發明人自己,或間接透過第三人進行之公開行為等,則不被視為先前技術。 三、 支持小型企業或獨立發明人:修正條文要求美國專利及商標局(USPTO)應與相關智慧財產權協會合作,為小型企業或獨立發明人提供協助,並設立專利監察專案(Patent Ombudsman Program)提供申請專利之相關幫助,同時給予小型企業與微型實體(Micro Entities)最高75%的規費減免優惠。   美國在此次修正其發明法的過程中,納入過去25年來國際專利制度協商後的成果,雖有論者指出該法仍未解決部分問題,然而儘管有這些不足之處,新通過的法案仍解決了舊法時期不合理之處。

蘋果申請新專利,使點餐不再需要大排長龍

  蘋果電腦設計一項系統,能使個人利用數位裝置來進行點餐,未來將不用在咖啡店或是速食店排隊等候也可訂到美味餐點。   蘋果公司就此項技術已經向美國商標專利局申請專利,倘若此項專利變成產品,那蘋果公司的產品就不再只限於電腦、iPod、線上音樂收費的市場。不僅如此,蘋果將變成餐廳、咖啡店甚至是零售商與顧客間的媒介。蘋果在2007年12月20日就此項技術申請專利,在申請案中,說明人們可以利用這項系統對餐廳進行點餐,而餐廳也能利用此項系統接收訊息。未來餐廳運用此項系統後,消費者就可以藉由數位PDA、手機來進行點餐,點餐者只須在線上排隊,無須為了他們喜愛的漢堡、飲料在店裡大排長龍。   此外,此項技術不僅僅是點咖啡的工具,蘋果在去年九月宣佈與星巴克簽約,所提供的技術還包括下載音樂,使用者將可以在喝咖啡時利用i-phone下載音樂並播放,消費者可以一邊享用咖啡,一邊聽喜愛的音樂。

競業禁止新方向-「勞資雙方簽訂離職後競業禁止條款參考原則」

歐洲區塊鏈數位基礎設施聯盟預計於2024年正式開始運作,將進一步擴大推動區塊鏈的公共應用服務

歐洲區塊鏈夥伴關係(European Blockchain Partnership, EBP)的成員於2023年6月正式向歐盟執委會(European Commission, EC)申請成立區塊鏈的「歐洲數位基礎設施聯盟」(European Digital Infrastructure Consortium, EDIC),若審核通過,未來歐盟將有一個正式的機構負責推動區塊鏈的發展與應用。 歐盟執委會於2023年1月發布了「2030年數位十年政策計畫」(Digital Decade Policy Programme 2030, DDPP),為促進歐盟數位轉型的大規模部署及能力建構,達到DDPP所設定的具體目標,執委會提出跨(多)國專案(Multi-Country Projects, MCPs)的概念,期待整合歐盟、各成員國、私部門的資源,以實現單一成員國無法獨立部署的數位化基礎設施。 執委會參考2009年開始陸續成立的「歐洲研究基礎設施聯盟」(European Research Infrastructure Consortium, ERIC),提出了「歐洲數位基礎設施聯盟」(EDIC)的規劃。EDIC並非由歐盟的資助計畫支持,而是由成員國申請(至少要包含3個成員國)成立以執行MCPs,EDIC具有法人格,並有獨立的財務來源;此外,EDIC成立後開放私部門參加。 2023年3月執委會發布的「數位歐洲2023~2024年工作計畫」(Digital Europe Work Programme 2023-2024)中,即將「區塊鏈」列為MCPs的重要發展項目之一。2023年6月15日於瑞典舉辦的歐盟數位大會(Digital Assembly 2023)上,執委會表示EBP及歐洲區塊鏈服務基礎設施(European Blockchain Services Infrastructure, EBSI)的相關成員國已遞交EDIC的申請。 斯洛維尼亞共和國(Republic of Slovenia)的區塊鏈小組負責人Nena Dokuzov是成立聯盟的主要推動者之一,其受訪時表示,EBSI從2018年以來,主要是由執委會以專案方式支持,未來聯盟成立以後,將能集結更充足的資源,強化歐洲區塊鏈的治理和穩定性,進一步地擴大推動歐洲區塊鏈的公共應用服務。我國「司法聯盟鏈」於2022年成立,為我國第一個跨部會、大規模的區塊鏈應用案例,並制定了跨組織協作標準規範(簡稱b-JADE),未來可持續觀測歐盟區塊鏈聯盟的發展,作為我國的參照。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

TOP