美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/02/13)
引註此篇文章
你可能還會想看
任天堂將自YOUTUBE影片上傳者收取利潤

  YOUTUBE遊戲頻道 - Rooster Teeth’s Let’s Play的建立者Lewis Turner近期擁有111部上傳遊戲剪輯並超過74890次瀏覽量,現被任天堂(NINTENDO)控訴侵害著作權。   任天堂依YOUTUBE的Content ID政策,向Lewis Turner主張凡運用任天堂遊戲剪輯而賺取收益的部分,一旦這些剪輯被識別包含Content ID所認定之完整或部分的內容,均被要求需支付獲利予任天堂。Content ID為YOUTUBE 的著作權政策,有助保護企業並控制相關影片上傳的內容,藉識別使用者上傳的相關影片(視訊或音訊)的內容,與著作權人提供的內容比對是否侵權的功能,進而採取預先選擇的處理方式,如:透過影片賺取收益或封鎖這類的影片。   許多玩家習慣將時下流行的遊戲闖關歷程上傳至社群網站與其他玩家分享,展現如何破解高難度關卡,或進階的闖關技巧,任天堂此舉,招來許多玩家的不滿,甚至表示再也不玩任天堂的遊戲或上傳更多的遊戲歷程剪輯。一名”Let’s play”玩家表示:「電動遊戲非如電影或電視;當我看到別人正在看的影片,我可能不會再去看;但當我看到別人正在玩的遊戲,我會想自己體驗。每個遊戲過程,都有其獨特視覺經驗,藉由瀏覽遊戲歷程能夠引起購買慾望。」   對此,任天堂則聲明,若是為了持續推動並確保為任天堂的遊戲,仍可透過社群平台分享,即玩家仍可繼續在YOUTUBE上分享任天堂的遊戲歷程;而非像對待娛樂公司一樣,阻止玩家使用任天堂智慧財產權(著作權)的原因。

德、法、盧森堡三國推動跨國境數位測試場域(Digitalen Testfeld))「自動化與聯網駕駛」計畫測試應用

  德國,法國和盧森堡共同推動「數位測試場」:自動化與聯網駕駛之跨國境測試。三國交通部門部長在2017年9月15日法蘭克福國際車展中決定擴大測試場域的範圍。令自動駕駛的測試場域,現在擴及到三國,並進行跨國界的測試。   三方「數位測試場域」推動的目的在於將科技從實驗室帶到跨國境的實地測試。「行動4.0是邁向歐洲單一市場的一個重要里程碑」,德國交通部長希望「自動駕駛領域是由歐洲來主導的市場」。並由德、法與盧森堡共同簽署三邊「數位測試場域」協議。   二月初同意的「數位測試場域」,是德法在2016年9月開始執行的「法德電動與數位方案」計畫跨國界測試自動駕駛的一部分。以共同合作,兩國希望推動電動車和自動駕駛領域的創新。如今又加入第三個國家:盧森堡。   目前,測試場域的選擇,從德國薩蘭邦梅爾茲,經過薩爾路易和薩爾布呂肯,最後到法國梅斯。此次,將盧森堡的貝唐堡設置的測試車道納入成為一個跨越三個國家的車道測試圈。   計畫所進行測試著重以下應用:車間通信(車對車)和與透過LTE/5g等行動通訊信號與基礎設施通訊;自動化和聯網駕駛下的超車、切車、煞車;普及化的智慧交通引導系統與預警服務。   數位測試領域讓工業,研究和政策獲得在實際交通狀況的經驗。研究資金提供對象,聯邦政府將提供約1億歐元給測試領域的研究項目。研究測試補助重點在以下領域:駕駛人和車輛之間的相互作用;交通管理和規劃;聯網與資料管理;社會層面。

義隆電子否認與蘋果電腦已和解專利爭訟!

  台灣觸控模組暨晶片解決方案公司義隆電子 (Elan Microelectronics)對外否認已解決2009年4月於美國舊金山聯邦地方法院對蘋果電腦(Apple)所提出的專利侵權訴訟案。   該案件由義隆電子向Apple提出控告,認為Apple相關產品iPhone, iPod touch及MacBook,使用到義隆電子兩項專利,分別為U.S. Patent No.5,825,352(簡稱352專利),具有可同時察覺兩個或多個手指接觸感應之輸入設備之能力;另一U.S. Patent No.7,274,353(簡稱353專利),為具有能在鍵盤和手寫輸入模式兩者間互換的觸控板的技術。   Apple希望平息該案件,據說Apple提出7,000萬美元的和解價值,但義隆電子堅持說明該案仍於美國國際貿易委員會審議中。   義隆電子近年來,利用所擁有的觸控相關專利,與國際大廠提出專利侵權訴訟案,如2008年向新思國際(Synpatics);2009年4月向蘋果電腦(Apple);2010年1月向蘇州瀚瑞微電子(PixCir),以保護自身的智慧財產權。

Golan v. Holder: 美國高等法院確認公共領域之外國著作可取得著作權保護

  美國高等法院於2012年1月18日對Golan v. Holder案做出裁定,確認維持將目前在公共領域的外國著作納入著作權保護的聯邦法。Golan v. Holder案之主要爭點為,美國國會於1994年為符合伯恩公約及WTO「與貿易有關智慧財產權協定(TRIPS)」的規定,決議通過讓之前無法在美國取得著作權保護的外國著作可以回溯取得美國著作權,一夕之間近上百萬件於1923年至1989年之間在國外發表的著作在美國不再屬於公共領域,包括了許多經典的電影,名畫及交響樂等,這個法案引起了許多樂團指揮家、表演者、老師、電影檔案保管者及電影發行商等人士的不滿,因為他們將無法像之前一樣無限制的使用這些著作。   美國聯邦地區法院於2009年曾判定認為恢復屬於公共領域的外國著作的著作權違反了保障言論自由的美國憲法增修條文第一條,但高等法院以6:2的多數意見認為,恢復公共領域的外國著作的著作權保護並不違反憲法修文第一條及憲法下的著作權條款。身為著作權擁有者,這個裁定對電影與音樂業者可以說是場勝戰,但對Google建立電子圖書館的計畫則將是個挑戰,Google表示這將使他們無法把近一千五百萬冊書籍的內容公開在網路上提供,並且也會影響到他們已完成電子化的上百萬冊書籍的使用。

TOP