美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/08)
引註此篇文章
你可能還會想看
何謂「“十三五”技術市場發展專項規劃」?

  中國大陸發布「“十三五”技術市場發展專項規劃」,在十二五時期,中國大陸不斷的推動技術市場的進步與發展,在政策上,不斷的更新法規,包括修訂《中國大陸促進科技成果轉化法》,進而促使《中國大陸促進科技成果轉化法》、《中國大陸科技進步法》、《中國大陸合同法》和地方技術市場法規共同規範了對中國大陸技術市場的保障。   在十三五時期,中國大陸提出六項主要任務,分述如下:(一)使保障技術市場的法規更為完整;(二)完整技術市場體系的建構;(三)加速促進成果轉化的步調;(四)利用技術平台,使創新創意相互流動;(五)提高技術市場人才的專業能力;(六)合理化的監督管理機制。

日本公布資料信託功能認定指引ver1.0並進行相關實驗

  日本總務省及經濟產業省於2017年11月至2018年4月間召開6次「資料信託功能認定流程檢討會」(情報信託機能の認定スキームの在り方に関する検討会),檢討具備資料信託功能之「資料銀行」認定基準及模範條款等事項,於2018年6月公布「資料信託功能認定指引ver1.0」(情報信託機能の認定に係る指針ver1.0),以利實現個人資料流通並創造新服務型態。資料銀行係指基於與個人間資料利用契約,透過PDS(personal data store)等系統管理個人資料,根據個人指示或預先設定的條件,於判斷妥當性後向第三方提供資料之行業。目前指引內容包括︰(1)資料信託機能認定基準︰具體內容包括業者適格性、資訊安全原則、資訊安全具體基準、治理體制、業務內容等;(2)模範條款記載事項︰針對個人與資料銀行、資料銀行與資料提供者、資料銀行與接受資料提供者間關係,列出具體應記載事項;(3)資料信託機能認定流程。   作為日本總務省「資料信託功能運用推動計畫」(情報信託機能活用促進事業)一環,日立製作所、東京海上日動火災保險、日本郵局等於2018年9月10日發表將根據「資料信託功能認定指引ver1.0」,進行「資料銀行」個資管理、提供及運用等實驗,參與者分別扮演資料提供者、資料銀行和資料利用者三種角色,未來將會參考實驗結果,提出認定基準改善建議。

Ofcom公佈「2014年通訊基礎建設報告」

  英國電信管制機關Ofcom於2014年12月8日提出第二版通訊基礎建設報告(Infrastructure Report 2014)。依據英國2003年通訊法(Communications Act 2003)規定,Ofcom必須每三年向英國文化、媒體與體育大臣(Secretary of State for Culture, Media and Sport)提出英國電子通訊網路及服務檢討報告,此次報告是在2011年11月第一版通訊基礎建設報告之後,對於英國現有政策施行情況再進行檢討,重點在於檢視目前整體基礎設施建設情形,內容大致可區分為:1. 網路及服務的覆蓋率、成效以及範圍、2. 頻譜使用、3. 基礎設施共享、4. 安全性與彈性。   在未來整體的規劃上,報告指出以下三項是未來決策者可能會面臨的挑戰,在政策推行與改善時應該一併考量。   一、寬頻普及服務義務:在固網寬頻部分,2009年英國政府推行寬頻普及義務(Universal Service Commitment for Broadband),目前英國超過2Mbit/s的寬頻覆蓋率已達97%,超過10Mbit/s的寬頻覆蓋率則達到85%。在高速寬頻方面,目前已達75%覆蓋率,家戶可接取寬頻速度至少有30Mbit/s。英國政府希望能在2017年使95%可達接取24Mbit/s以上之寬頻。   在行動網路覆蓋率部分,目前英國政府投注一億五仟萬英鎊在新的基礎建設上,希望將行動網路覆蓋率普及於未有服務的家戶,並配合其他政策增加覆蓋率,例如以漫遊、靜態基礎設施共享或MVNO業者來完成。   二、新科技廣泛運用於市場:目前,手機營運商積極推展4G服務,希望終端用戶能達98%之覆蓋率。但在推行之際,尚需要政府的補助,以及法規政策的調整。   三、檢視未來基礎建設的發展:為促進不同科技產業的發展,對固網與行動寬頻速度不斷地進行改善仍為現階段重要的推行項目。因此,應定期依據市場的供需,持續進行政策上的調整。   此外,報告指出,將來在前述三項主要政策推行目標上,除了考量基礎建設應達成的網路速度以外,符合民眾需求的品質經驗等因素亦應一併在政策施行之時納入考量。Ofcom提出之報告重點在於能提供目前英國通訊基礎建設政策推行時之參考指標,此在後續我國的通訊基礎建設方面,亦能做為參酌,以因應物聯網或其他新興科技的迅速發展。

日本正式敲定今年版智慧財產權推動計畫

  日本為了提高產業競爭力,於 2002 年提出智財戰略計畫,並於內閣中設戰略本部,由首相小泉純一郎領導,每年並仔細擬定當年度的智慧財產權推動計畫。在今年剛定案的「二零零六年智慧財產權推動計畫」中,以開發或利用大學的智慧財產及加強與產業界的合作並提出對付仿冒品等的對策為重點。   根據「二零零六年智慧財產權推動計畫」,未來將加強整合大學內部的大學智慧財產本部與民間的技術移轉機關( TLO ),以便集中運用人才、研究成果。計畫也將建立一套可簡便利用專利或論文的資料庫系統,預期明年四月起可供利用。   日本的大學院校去年在國內取得專利權的有三百七十九件,大學將專利技術移轉至民間組織件數在二零零四年度有八百四十九件,藉由技術轉移所得收入為三十三億日圓,雖然這些表現相較於以往年度均有所成長,但日本不論在專利件數或收益上,都與美國相差甚遠,日本政府為了加強國際競爭力,認為有必要加強產、學界的合作,故「二零零六年智慧財產權推動計畫」也規劃,大學院校若有意到海外申請專利權,政府將補助申請費;此外,原本只限定優惠大學正副教授的專利申請費減免措施,也將及於研究所的學生等,以期促進大學內部研發。

TOP