美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/03/08)
引註此篇文章
你可能還會想看
美國傳播通訊委員會發動推展國家寬頻計劃

  美國聯邦通訊傳播委員會(FCC)於2009年04月08日宣佈開始推展國家寬頻計劃進程,以達到能使每位美國民眾均有能力負擔與使用寬頻網路的服務。   此項引發廣大爭議的寬頻計畫係植基於2009年的「美國經濟復甦與再投資法」(American Recovery and Reinvestment Act of 2009)─即眾所周知的「振興經濟方案」。在此之前,FCC曾於2007年04月根據1996年電信法第706節發佈法規制定提議意見調查書(NOI,FCC 09-31),希望蒐集各界對於以下四個問題的看法:1.) 何為「先進通訊服務」?;2.) 如何促進美國民眾先進通訊的使用;3.) 目前推動是否合理合時?4.) 何種方式可以更有效推動先進通訊服務發展。   此次,該計畫將獲得72億美元以實現下列要求:1.) 以最有效能與效率的方式確保全美民眾能接近使用寬頻網路服務;2.) 提出人民有能力負擔與寬頻服務最大效用化的策略;3.) 評估目前寬頻推展現狀(包括其他相關的計畫);4.) 如何運用寬頻網路服務以提升消費者權益、公民參與、公眾安全、社區發展、健康照護、能源獨立效率性、教育、員工訓練、私部門投資、企業活動、創造工作機會與經濟成長。   參眾兩院要求FCC必須在2010年02月17日前,將該最終方案遞交眾議院與參議院相關委員會審議。但是,有論者認為目前FCC的計畫與方向並未考量到終端使用者真正需求與如何使用該等科技;同時,歐巴馬政府針對寬頻網路議題未提供足夠的公民思辨機會,最後恐將事倍功半。

美國2020年國防太空戰略(Defense Space Strategy)

  美國國防部於2020年6月17日發布「國防太空戰略」(Defense Space Strategy),作為確保美國維持其太空戰略優勢的發展藍圖。國防部長Mark T. Esper指出,一個安全、穩定且開放的太空領域是美國用以支持其國家安全、繁榮科學發展的基礎,然而在各國太空技術競逐之下,太空已儼然成為新的作戰領域(warfighting domain),對此美國應針對政策、策略、任務、投資、能力與專業等面向實施全面性的改革,「國防太空戰略」擘劃出美國如何在接下來的10年內達成其確保美國太空戰略優勢的目標。   「國防太空戰略」提出三大目標:首先,國防部將支持並捍衛美國在太空中的軍事行動自由(freedom of operations),並遏止任何具有敵對意圖的使用以維持美國的太空優勢;其次,美國太空軍(U.S. Space Force)將運用其先進的國防太空技術優勢以協助美國及其盟友的太空軍事行動,並支持民間與商用太空技術產業發展;最後,美國將與盟友共同維持太空領域的穩定,防止任何侵略性的太空活動、建構國際公認的太空行為準則,並支持美國在太空交通與長期外太空活動的領導地位。   為了達成上述三大目標,「國防太空戰略」提出四個優先行動方向,分別為:(1)藉由太空軍的組織改造整合資源,以應對敵對勢力的太空軍事行動並建立全面性的太空軍事優勢。(2)提升作戰層次,整合太空軍事力量包含任務、情報、技能與人員於國家與國際聯合軍事行動當中。(3)提升國際對於太空潛在威脅的重視,推動國際太空行為準則以打造太空戰略環境。(4)透過情報共享、研發與採購(research, development, and acquisition, RD&A)與盟友、合作夥伴、產業及其他政府部門合作,提出對於國家太空政策與國際太空行為準則的建議。

美國眾議院通過綠色化學研發法案

  美國眾議院本(9)月通過「2007年綠色化學研究發展法案」(The Green Chemistry Research and Development Act of 2007),其目的在要求總統建立「綠色化學研究發展計畫」(Green Chemistry Research and Development Program),統籌改善聯邦政府對於綠色化學研發、教育宣導及技術移轉等活動之資源投入,而綠色化學則是指那些依安全與有效生產程序製造高品質產品時、能減少使用或產生毒性化學物質之化學產品或製程技術。美國化學協會(American Chemical Society)讚許眾議院通過本法案是睿智的舉動,表示發展綠色化學最能證明經濟和環境得同時併進,發展綠色企業實務,改善藥學加工及本土營建產業以迎刃氣候變遷及能源危機等挑戰。   本法案並要求自明(2008)年起,編列經費由以下政府單位合作執行本計畫,即國家科學基金(National Science Foundation)、國家標準技術研究院(National Institute of Standards and Technology)、能源局(Department of Energy)及環保署(Environmental Protection Agency)。參議院在過去兩屆都通過類似的法案,尚等待參議院支持通過相同法案,以獲得生效。   為減低對石化原料的依賴、發展生物經濟,美國政府積極投入促進綠色科技、生質科技之研發活動,例如從農林廢棄物或副產品或其他來源開發再生性原物料供綠色化學使用。此外,美國政府亦資助建立了生質(biomass)能源及產品的網路圖書館(BioWeb);BioWeb所收錄的生質科技資訊、文獻,許多都是來自大學或國家實驗室著名研究人員,都會先經各領域專家進行嚴格的同儕審查(peer-review),再開給所有公眾瀏覽;BioWeb將會持續蒐羅各種基礎及應用科學知識,並擴充各種經濟及政策相關資訊。BioWeb的理想目標,是擴大規模成為最大最有價值的生質燃料、能源及產品公共資料庫。

MPAA 藉由 BT 網站伺服器記錄對 P2P(BT) 軟體用戶提起訴訟

  追蹤、定位、起訴,所有 P2P(BT) 軟體使用者的噩夢再次上演。全美製片業團體「美國電影協會」 ( Motion Picture Association of America ; MPAA ) 在 8 月 25 日對美國境內 286 位居民提起訴訟,成為首宗利用 P2P(BT) 網站伺服器記錄 ( server logs ) 追蹤 ( track down ) 盜版電影下載者的案例。   今年 2 月,著名 BT 網站 LokiTorrent 與 MPAA 的大戰告一段落。德州法院下令 LokiTorrent 關閉網站外,並命令 LokiTorrent 將伺服器記錄轉交給 MPAA 的調查員 ( investigator ) 。 MPAA 的發言人聲稱本月 25 日的訴訟與此事件無關,但所有人都明白 MPAA 正是憑此線索,最終找到了 P2P(BT) 用戶的行蹤。好萊塢希望藉此行動阻嚇免費下載電影的行?, MPAA 資深副總裁 John Malcom 聲稱「下載盜版電影的人要當心了,當你為著作權侵害行為時,網路上並不會有朋友站出來替你撐腰。」   儘管 P2P(BT) 軟體背負著助長盜版的惡名,但 P2P(BT) 的合法用途也在逐漸增加,例如使用 P2P(BT) 技術分發 ( distribute ) 開放原始碼軟體 ( open-source software ) ,網路瀏覽器軟體公司 Opera 即在新版的程式中內建了此種技術。 BT 技術的發明人 Bram Cohen 曾警告用戶,使用 P2P(BT) 軟體下載盜版是個蠢主意,因?軟體在設計時並未刻意隱藏用戶的識別資訊,這也是為何 MPAA 此次能憑藉著伺服器記錄對用戶提起訴訟的主要原因。

TOP