美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/03/25)
引註此篇文章
你可能還會想看
歐盟宣布欲在2019年時達成U-space的管理系統建置以創造無人機服務市場

  歐盟執委會(European Commission)的移動與運輸專員(European Commissioner for Mobility and Transport )Violeta Bulc在2016年11月23日於華沙發表歐盟目前到2019年的無人機發展計畫───U-space管理系統,該計畫希望能使無人機融入歐盟公民日常生活中的一部分。   U-Space為都會區上的空間(Urban-Space),也代表「你的空間」(Your space),範圍為150公尺以下涉及日常生活的空域空間。其在經濟目標上,期望藉由具體的政策,包含全自動化的導航與空中交管系統的建立,可以使一般人可以公平且容易的使用無人機,讓無人機應用在未來的日常生活成為普遍的應用活動,藉以促進整個歐盟無人機產業的發展。因此,進一步在法規管理上,需要在歐盟地區確立有關無人機之註冊、辨識以及衛星輔助設備之要求的全面一體化(Harmonized)系統,以確保該系統下的無人機操作均符合安全和保安的標準且可以達到隱私與環境保護的訴求。   目前看來,U-Space是推動無人機應用的管理系統,法規方面需要歐洲航空安全總署(European Aviation Safety Agency, EASA)於2016年8月22日公布之的初步無人機法規草案(EASA ‘Prototype’ Commission Regulation on Unmanned Aircraft Operations)支持,像是全自動化的導航系統需要的衛星輔助系統(Geo-fencing)就在EASA草案中提及。   而根據歐盟同一天的新聞稿,為達成U-Space之建置有三個面向須努力: 1.新創技術專案之展示:根據U-Space制度涵蓋之項目為運作基礎的展示專案應該評估特定技術的可行性,以讓相關產品服務早日投入應用,具體專案計畫將在2017年上半年推出。 2.產業密切合作:必須在產業相信歐盟執委會的決心以及願意投資無人機科技的前提下,執委會發展相關基礎設施才有意義。 3.設立新的法規標準:即就前述提及之EASA初步無人機法規草案徵詢各界之意見,預計蒐集各界相關意見後,並經由歐盟執委會、歐盟理事會(Council of the European Union)以及歐洲議會(the European Parliament)的三方會議後,在近期內出現更為具體的草案,議題將包含安全、資安、環境以及隱私等。

美國藥品學會建議調整HIPAA隱私權規範以兼顧醫療研究及隱私保護

  隸屬美國科學院(National Academy of Sciences)之藥品學會(Institute of Medicine)於2009年2月4日發表一份研究報告,指出美國醫療保險可攜及責任法的隱私權規範(HIPAA, Privacy Rule),對於醫療研究中有關個人健康資訊之取得及利用的規定未盡周全,不僅可能成為進行醫療研究時的障礙,亦未能完善保障個人健康資訊。   在目前的規範架構下,是否允許資訊主體概括授權其資料供後續研究利用,並不明確;另外,在以取得資料主體之授權為原則,例外不需取得授權但必須由審查委員會判斷其妥適性的情況下,亦未有足夠明確的標準可資審查委員會判斷依循,此些問題不僅使得醫療研究中之資料取得及運用,產生若干疑慮,亦突顯個人相關健康資料保護之不足。   該報告建議國會應立法授權主管機關制訂一套新的準則,將個人隱私、資料安全及資訊運用透明化等標準,一體適用於所有醫療相關研究的資料取得及利用上;在未來的新準則中,應促進去名化醫療資訊之運用,同時對於未取得資料主體授權的資料逆向識別(re-identification)行為,應增設罰則;此外,審查委員會在判斷得否不經資料主體授權而以其資料進行研究之妥適性時,亦應納入道德考量因素,倘若研究係由聯邦層級的組織所主導,則研究團隊應先證明其已採取充分保護資料隱私及安全的措施,藉以平衡隱私權保護與醫療研究的拉鋸。

英國公共廣電服務將可收取轉播之著作授權金

  英國2017年數位經濟法(Digital Economy Act 2017)已於2017年4月27日經英國國會通過,該法第四章規範智慧財產權,其中第34條條文內容意旨係公共廣電服務(Public Service Broadcaster)對其經轉播之內容享有著作財產權,任何欲轉播公共廣電服務內容之有線電視平臺將不得無償轉播,應交付授權金。   在舊法之架構下,英國1988年著作、設計及專利法(Copyright, Design and Patents Act 1988)第73條免除有線電視平臺轉播公共廣電服務內容所生之著作權侵權之責任。舉例而言,維珍集團旗下的電視媒體(Virgin Media)若轉播英國獨立電視臺ITV之節目,因不涉著作權侵權,故毋庸給付授權金。該條之立法目的原係為扶持80年代後有線電視發展之政策目標,然現今因多頻道、衛星數位電視,甚至是網路平臺持續蓬勃發展,該條文已相對過時,故透過2017年數位經濟法將該條文刪除。   英國公共廣電服務業者如BBC、Channel 4和ITV近年來大力倡導並遊說此立法政策,強調大多數的英國原創節目都是由其產出,主張有線電視平臺應當給付合理的轉播授權金,始能支持公共廣電服務業者持續為英國民眾帶來高品質的節目內容。惟,考量部分公共廣電服務業者與有線電視平臺之關係,如維珍媒體是ITV之大股東,往後公共廣電服務是否能有足夠的議價能力收取到合理的授權金,抑或反而造成英國民眾須支出更多節目費用,值得關注。

英國電信廣播主管機關發布未來三年之數位廣播(digital audio broadcasting)服務推動聲明

  日前英國電信廣播主管機關 Ofcom(Office of Communication) 就未來三年之數位廣播服務推動發表聲明,其主要內容為: • 全國性數位廣播服務執照 Ofcom 預計於 2006 年底開始第二張全國性的數位廣播服務執照之發放工作,預計於 2007 年挪出頻段以供該全國性數位廣播服務之用,於 2008 年時民眾將可收聽該全國性數位廣播服務,其服務範圍將含蓋全英國地區,但為避免對他國頻段之運作造成干擾,部分沿海地區將無法接收到該服務。 • 地方性數位廣播服務執照 Ofcom 預計於 2006 年下旬開始 12 張地方性數位廣播服務執照之發放工作;其次,於 North Wales, Suffolk 以及 Northern Ireland ,目前並無額外的頻段可作為地方性數位廣播服務之用,但 Ofcom 仍會尋求釋出其他頻段,以供地方性數位廣播服務之用的可能性。

TOP