美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/04/19)
引註此篇文章
你可能還會想看
歐盟公布「朝向現代化著作權架構行動計畫」,研議推動措施及規範調修規劃

  歐盟執委會在2015年12月9日提出歐盟朝向現代化著作權架構行動計畫(Towards a modern, more European copyright framework),目的為落實歐盟數位單一市場策略(Digital Single Market Strategy),對於創意產業能夠激勵投資,並且打造公平的競爭環境。行動計畫分為四項重點:   一、放寬歐盟地區內容取得服務: 歐盟已針對線上服務內容如影音、遊戲等,提出草案,未來將允許線上服務內容可以跨境取得,不受地區性之限制,範圍僅限於歐盟會員國地區。歐盟亦將利用創意歐洲計畫持續鼓勵創意產業發展,增加更多使用服務之民眾。   二、放寬著作權相關免責規範之適用: 未來歐盟將修正規範,使研究人員就資料內容之取得與利用更為便利。此外,教育為另外一項重點,例如應訂有明確使用線上內容做為教學之規範。在身障者保護部分,則亦應設立規範。   三、創造公平市場: 歐盟將評估線上作品之使用與分享是否為公平授權,且未來將首先針對新聞服務業者進行檢討,對於使用者在網路上單純分享作品連結者,將視為合理使用。另外,針對作者與表演者報酬部分,歐盟未來將有一致性之政策規範標準。   四、打擊盜版: 歐盟認為,新政策的執行將使著作物能經過合理管道使用,因此可抑制盜版行為。而在2016年預計進行之“follow the money”計畫,預計與使用者及權利人相互配合,阻斷盜版所產生之資金流動。   未來,歐盟預計於六個月內將此架構願景轉換為草案或政策推動方針,其中在允許線上服務內容可以跨境取得之草案規範部分,歐盟執委會則希望於2017年能正式生效施行。

英國、韓國共同簽署資料適足性協議,以期促進資料經濟商機

  英國數位文化傳媒和體育部(Department for Digital, Culture, Media & Sport, DCMS)於2022年11月23日發布新聞稿,宣布英國與韓國共同簽署的資料橋接規則(The Data Bridge Regulation)於同年12月19日正式生效。在此之前,英國於2022年7月5日已與韓國個人資料保護委員會(Personal Information Protection Commission, PIPC)簽署資料適足性協議(Data Adequacy Agreement),以促進兩國未來進行資料傳輸。這也是英國在脫歐後,首次與其他國家簽訂的資料協議,而依據過往兩國的數位貿易統計資料,本次協議預估將帶來超過14.8億英鎊的商機。   英國DCMS部長更進一步表示,未來將積極與其他國家的戰略夥伴,開展資料經濟商機。英國於聲明中強調參與全球跨境隱私規則論壇(Global CBPR Forum)的決心,以加速資料共享、促進創新與產學研究,聲明摘要如下:   1、本協議為加強英國與韓國資料共享的里程碑,其宗旨為創建更值得信賴的資料共享環境,以及共創更安全的資料傳輸方式。   2、本協議耗時約一年完成討論與擬訂,並期待能透過該協議,深化並擴展英國與韓國之間的資料夥伴關係。   3、英國與韓國政府承諾將促進資料在國際商業、創新及研究等領域的發展。在加強個人資料保護的前提下,促進資料的合理利用。   4、在資料自由傳輸的基礎上,本協議將提供更完善且可持續推動的全球資料生態系統。雙方政府承諾共同改進數位時代下個資料保護框架,如英國發布國家資料戰略(National Data Strategy)、修訂UK GDPR相關規範,以及韓國PIPC提出個人資料保護法部分條文修正案等具體措施。   英國政府肯認應與其他戰略合作夥伴開展多邊倡議,如參與全球跨境隱私規則論壇(Global CBPR Forum)及經濟合作暨發展組織(OECD),共同推動可信賴之政府存取資料(Trusted Government Access to Data)的目標。

蘋果申請新專利,使點餐不再需要大排長龍

  蘋果電腦設計一項系統,能使個人利用數位裝置來進行點餐,未來將不用在咖啡店或是速食店排隊等候也可訂到美味餐點。   蘋果公司就此項技術已經向美國商標專利局申請專利,倘若此項專利變成產品,那蘋果公司的產品就不再只限於電腦、iPod、線上音樂收費的市場。不僅如此,蘋果將變成餐廳、咖啡店甚至是零售商與顧客間的媒介。蘋果在2007年12月20日就此項技術申請專利,在申請案中,說明人們可以利用這項系統對餐廳進行點餐,而餐廳也能利用此項系統接收訊息。未來餐廳運用此項系統後,消費者就可以藉由數位PDA、手機來進行點餐,點餐者只須在線上排隊,無須為了他們喜愛的漢堡、飲料在店裡大排長龍。   此外,此項技術不僅僅是點咖啡的工具,蘋果在去年九月宣佈與星巴克簽約,所提供的技術還包括下載音樂,使用者將可以在喝咖啡時利用i-phone下載音樂並播放,消費者可以一邊享用咖啡,一邊聽喜愛的音樂。

行動上網吃到飽對電信產業之影響

  隨著4G開台,各家電信業者為獲取用戶數,爭相推出無限上網吃到飽方案,然在數據流量呈現爆炸性成長下,電信業者之收益卻持續下探。為解決此問題,本研究嘗試提出建議方案,期望實現我國對數位經濟之願景。

TOP