美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/01/12)
引註此篇文章
你可能還會想看
電信業者提供視訊服務之外國法制研析

「資訊儲存服務」提供者法律責任之研究-以日本實務新興發展為例

2005 台日科技高峰論壇 揭示綠色環保的新契機

  「 2005 台日科技高峰論壇」於本﹙九﹚月 16 、 17 日在台北圓山飯店盛大展開,與會者包括台日高階產官學研代表,分就環境政策、環保科技及綠色產品等議題進行交流,研擬未來可能進行的合作模式。   於第一天開幕式中,亞東關係協會科技交流委員會主任委員蕭萬長即表示,藉由科技論壇可以增加政策和策略的相互了解,並減少重複浪費的研發 ; 藉由知識相互激盪可以維持競爭力和高度經濟成長,創造雙贏的局面。日本交流協會台北事務所的池田維代表則指出,先前日本於八大工業高峰會議中所倡議的 3R(REDUCE 、 REUSE 、 RECYCLE) 觀念,獲得各國極力贊成,他希望將日本特性表現在本次研討內容中,以加強彼此合作。   台日科技高峰論壇從 2003 年 4 月成立後,今年乃第三度在台灣舉行,與會貴賓包括日本眾議員水野賢一﹙ Mizuno, Kenichi ﹚ , 以「日本環境政策」發表專題演說;地球環境戰略研究機關理事長森 ( 山鳥 ) 昭夫﹙ Morishima, Akio ﹚則以「建構環保型產業」為題,自法律觀點說明,日本政府如何透過修訂法規之方式,逐步落實 3R 理念及其他永續發展措施;除此之外,日本 JST 、東京大學、北九州市立大學、日立製作所、東元電機、豐田汽車、福特六和汽車等台日環保科技代表亦分就「綠色產品」、「環保科技」等面向擬定專題發表談話。預料本次研討內容,對於未來台日科交流將能形成實質的幫助 , 並為未來科技發展指出綠色環保的新契機。

英國公布合成生物學公眾對話報告,以避免早期爭議的產生

今(2010)年5月,美國克雷格文特爾研究所宣布,成功完成首個由電腦設計之人造基因組控制,並具有自我繁殖功能的合成細胞,研究人員將其取名為辛西亞(Synthia),並發表於科學雜誌,此舉意味生物科技的發展,已經從生命複製階段步入生命創造階段。此次合成細胞的成功,引發先進國家政府方面的對經濟利益、管理及社會法制影響等方面的重視。美國總統歐巴馬便敦促生物倫理委員會對此發展進行密切觀察,評估此研究將之影響、利益和風險。 英國對於合成生物學發展的規範議題也十分關心,該國2009年開啟有關合成生物學的公眾對話(public dialogue),並於今年6月完成並公布報告。獲得的結論如下: 一、肯定合成生物學所帶來的機會: 英國民眾普遍認為合成生物學的應用將會帶來許多重要的機會,可協助解決當前社會所面臨的重大挑戰,例如氣候變遷、能源安全與重大疾病等。 二、關心合成生物學發展的不確定性: 由於合成生物學的發展充滿著不確定性,故當長期的負面影響尚未可知時,有些民眾反而因發展過於快速而覺得到沒有確定感。 三、期待國際規範形成: 英國民眾認為希望能有國際性的合成生物學規範與管理措施,尤其應針對合成生命物質在未受到管制而釋出於環境之生物安全議題,猶應有國際性的管理規範。 四、衡量科研人員動機: 英國民眾擔心,研究者好奇心的驅使,會使合成生物學發展過於快速,故應衡量其研究所帶來的廣泛影響。 五、強調科研人員之責任 負責資助的研究委員會應有清楚角色,促使科學家在此新興科技領域研究中,培養思考科學家責任之能力。 此次對話結果將會納入英國對合成生物學研究補助的法規政策,成為決定補助方式、項目與範圍的重要參考依據。這樣的作法是考量到,希望使合成生物學在健全的管理與法規下持續發展,預先減低過往生物科技發展導致民眾疑慮而致延滯發展的可能性,也更能將政府科研資助有效地投入有利於國家整體發展的領域中。

TOP