美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/01/08)
引註此篇文章
你可能還會想看
美國參議院擬針對生物燃料提供稅賦優惠

  先進的能源發展方向是開發先進技術,利用生物材料(如能源作物或生物排泄物)等生物性資源來生產能源,此種能源生產方式又稱為生質能源。由於生質能源的建置成本高,故業界多冀盼政府能給予財務方面的支援。   最近美國布希總統已經設定透過增加對潔淨、再生的生物燃料的使用,降低美國對進口石油的依賴以及溫室氣體排放量,而基於同樣的目標,美國參議院財務委員會(Senate Finance Committee)最近更提出了能源進化及投資法(Energy Advancement and Investment Act of 2007, EAIA),希望能鼓勵大規模的商業投資,以促進生物燃料的生產與使用。   EAIA特別針對使用纖維性質的生物材料(cellulosic biomass)來生產生物燃料之製造者,提供生產上的租稅扣抵(production credit),與此同時並擴大既有針對乙醇所實施的優惠措施之適用範圍。這兩大租稅優惠是為了鼓勵企業生產者加速推動生物燃料的開發,儘快使生物燃料可以供應市場所需達到10億加侖的水準。

澳洲政府發布國家區塊鏈路線圖,建立澳洲區塊鏈技術發展策略與目標

  澳洲產業創新科技部(Department of Industry, Innovation and Science)於2020年2月7日發布「國家區塊鏈路線圖:向區塊鏈賦能之未來前進(National Blockchain Roadmap: Progressing towards a blockchain-empowered future)」政策文件。此路線圖為澳洲政府為彰顯其對區塊鏈技術之重視,並認知到區塊鏈與其他科技結合後將可進一步增進工作機會、促進經濟成長、減少商業成本與提升整體生產力,因此提出之區塊鏈發展方向規劃。   本路線圖文件指出,為實現區塊鏈技術,澳洲政府將於三個關鍵領域建立相關策略:一、建立有效且合理的規範與標準;二、建立可驅動創新之技術與能力;以及三、促進國際投資與合作。   路線圖文件並針對2020至2025年之區塊鏈發展進行規劃,相關措施包含: 重新命名國家區塊鏈諮詢委員會為國家區塊鏈路線圖推動委員會,並使其具有監督路線圖推動之職權。 建立由產業、研究團隊以及政府合作之團隊,以分析未來可能之應用案例。 對目前使用案例進行經濟分析與研究可能措施選項。 建立與連結政府端區塊鏈使用者,以促進學習交流與進一步應用。 進行國際研究以辨識出其他國家中適合學習做為政府服務之實際案例。 與區塊鏈服務提供商密切合作進行商業創新研究,以提出可供實際案例運用之解決方案。 確保區塊鏈發展涵蓋於整體國家策略中以促進數位科技能力管理。 使產業與教育機構合作發展關於區塊鏈資格技能之共同框架與課程內容。 為澳洲區塊鏈新創公司提出能力發展協助計畫,使其可向全球擴張並與支持合格企業。 引導外資投資以促進澳洲區塊鏈生態系建立。 引導既有雙邊協議進行區塊鏈前端計畫之合作與發展。 增加政府部門合作以確保澳洲企業可與發展中之新興數位貿易基礎設施進行連結等。   澳洲政府期待透過推動本路線圖與結合先前提出之AI路線圖政策,達成於2030年前成為數位經濟國家之目標。

從法規及經營面探討電力線通訊開放的相關問題-從美國聯邦通訊委員會的管制措施談起

美國維吉尼亞州消費者資料保護法

  2021年3月2日美國維吉尼亞州州長簽署了維吉尼亞州消費者資料保護法(Virginia Consumer Data Protection Act),是繼加州之後,第二個自行制定相關規範並且採用的州,預計在2023年1月正式生效。   該法在主軸上與加州消費者隱私保護法相去不遠,其為消費者提供六項主要權利,包括近用權、刪除權、資料可攜權、選擇退出權、更正權,以及申訴在合理期間內未獲妥適處理之再申訴權;又或者在義務上要求企業進行資料的蒐集、處理或利用時,需經當事人同意並且符合合理利用與必要範圍之限制,亦要求企業建立技術保障管理機制,以及向消費者提供隱私權政策。   該法與加州消費者隱私保護法也有些許不同之處,例如,該法並無賦予人民為一切訴訟行為之權,訴訟權掌握在檢察總長手中、該法案適用主體必須是控制或處理十萬筆以上消費者個人資料之企業,或是總收入50%來自於利用消費者個人資料,且該資料量總數達二萬五千筆以上之企業,相比加州消費者隱私保護法適用主體之資格更為寬鬆。無論就形式上或實質上而言,維吉尼亞州消費者資料保護法普遍被認為比加州消費者隱私保護法更加友善企業,並且廣泛得到亞馬遜等相關科技行業的支持。   在數位科技發展下,美國的紐澤西州、猶他州,以及許多其他州政府,紛紛考慮進行相類似之資訊隱私保護立法,此一趨勢發展已然勢不可擋。

TOP