美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/12/15)
引註此篇文章
你可能還會想看
綠不綠有關係?!-論綠色資料中心及其相關能源效率法制政策

美國與中國大陸簽訂第一階段經貿協議,關注智財及技轉議題

  美國白宮與中國大陸國務院,於2020年1月15日簽訂第一階段經貿協議,關注智財及技轉議題並提出解決方案。協議包括前言、智慧財產權、技術轉讓、糧食與農產品貿易、金融服務、經濟政策與匯率和透明度、擴大貿易、雙邊評估和爭端解決、最終條款等九個章節。協議強調應遵守國際條約,為世界貿易發展作出貢獻並促進國際合作以符合美中雙方利益;其中,雙方針對中國大陸現有及未來關於智慧財產權及貿易投資技術轉讓問題,提出解決方案如下: 一、提升智慧財產權保障   中國大陸作為全球主要技術供應方,必須建立並實施全面的智財權保護與執法體系,發展新創企業以促進高質量的經濟成長;並將營業秘密保護視為優化商業環境的核心要素,有效防止資訊遭竊取。藥品專利部分,為促進製藥領域的創新合作並滿足患者需求,美中雙方應提供藥品專利及非公開試驗或上市許可申請提交之相關資料;擬定專利有效期限延長方案。另外,為促進電子商務發展,美中應加強合作共同打擊電商市場中的侵權及偽造行為,阻止盜版產品的製造與銷售。確保產品地理標示保護,符合公正透明程序;加強商標權保障,防止惡意註冊商標;強化智財權的司法與行政程序等。美中雙方應根據本協議,提供立法機關法律修正建議,確保能充分履行本協議之要求。 二、改善強制技術轉讓   為確保美中雙方進行科技合作研發與企業市場准入,避免企業間因併購、合資及投資交易導致技術外流,中國大陸應改善強制技術轉讓問題;特別應加強美中雙方在關鍵技術問題上的相互信任與合作,保護智慧財產權、促進貿易投資,以解決中國大陸長期存在的結構性問題,包括提升行政程序公正透明度、避免政府過度介入民間企業、加強外資敏感資訊保障等。

美國通過《地理空間資料法》,明確化地理空間資料管理

  美國於2018年10月5日,通過《2018年地理空間資料法》(Geospatial Data Act of 2018,下稱《GDA 2018》),並編列入《2018年美國聯邦航空總署重新授權法案》(Federal Aviation Administration Reauthorization Act of 2018)。該法是接續《2017年地理空間資料法》(Geospatial Data Act of 2017,下稱《GDA 2017》),做出進一步的調整。   《GDA 2017》的核心目標就是要根本性地重整管轄權,以順利發展「國家空間資料基礎建設」(National Spatial Data Infrastructure)。要點如下: 原先美國有許多管轄的地理空間資料旁枝機構,工作重疊性高、權責不清,《GDA 2017》指定「聯邦地理空間資料委員會」(Federal Geographic Data Committee, FGDC)作為權責機關,並管理國家空間資料資產(National Geospatial Data Asset)。 指定「國家地理空間資料諮詢委員會」(National Geospatial Advisory Committee, NGAC),提供FGDC建議並進行監督。 擴充「地理空間資料」的定義,把所有量測(Survey)和製圖(Mapping)成果解釋成地理空間資料(Geospatial Data)。   《GDA 2018》進一步提出規範,明確化地理空間資料管理: 回饋報告 要求執行與地理空間相關計畫的聯邦單位,提供年度報告;並要求聯邦地理空間資料委員會(FGDC)按《GDA 2017》所列的職責,對於所有相關單位進行評估報告。這些評估報告會提交給國家地理空間資料諮詢委員會(NGAC)寫成報告,在兩年內提供給國會。 國家空間資料基礎建設 明確設立兩個目標:第一個目標是地理空間資料的隱私管理和安全性保障;第二個目標則是建置全球空間資料基礎建設。 國家空間資料資產 希望FGDC會能夠就各個主題指定專責機構進行管理。

歐盟將立替代能源新法

  日前,歐盟執委會於2008年1月23日提交了一份關於整合性發展境內替代能源之新法制架構指令建議案,並欲藉該建議案來進一步促進生質能、太陽能與風能等相關新興能源技術之開發。該建議案還提到,歐盟所屬會員國原則上須依據於2005年當時替代能源之貢獻比例為基礎,再向上調增5.5%後來作為該會員國之替代能源預定貢獻目標。不過,考量各會員國之國情並不相同,故該建議案要求歐盟對於各會員國替代能源預定貢獻目標之制定,應採「差別化」之方式,使其可先自由調整與決定究欲採取何種比重與模式來發展各類替代能源,最後,再將所決定之能源發展策略大綱置於國家行動方案書內(National action plans, 簡稱NAP),並於2010年3月31日前提交執委會進行審核。此外,執委會也設定了一系列短期性目標,以確保能漸次穩定地朝2020年之目標前進。而有關開發生質能及永續性方面,鑑於生質燃料之發展仍具相當之爭議,故於飽受各界沉重之壓力下(如:非政府民間組織以及科學聯盟團體),未來布魯塞爾方面勢要提出一更加周嚴之永續性基準,以確保在該建議案所制定之生質燃油目標下,不會進一步導致生態系統失衡、森林濫伐、人口遷徙、糧食價格上漲以及釋放更大量CO2等問題產生。

TOP