美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/05/28)
引註此篇文章
你可能還會想看
數位內容傳輸新服務:推動數位內容產業的另一個面向

伊格奈科技公司(Ignite Technologies Inc.)推出了一款數位內容傳播輔助工具,可幫助企業傳輸大量的數位內容檔案。此項名為伊格奈溝通者(Ignite Communicator)的服務,能協助企業傳輸各種數位內容的檔案,包括視訊、圖形及軟體。此項工具最大的特色,在於能跨越各種不同的作業平台,進行檔案傳輸。   伊格奈此項新服務,能協助企業傳遞資料給遠端行動的使用者,亦可聯結企業夥伴或客戶各種不同層級的網路系統。對於內容豐富而檔案龐大的數位內容傳播而言,此類跨平台的傳播技術與服務,對於 B2B 與 B2C 的數位內容應用,都是一大推動助力。

宏碁起訴代工廠 反擊惠普侵權控訴

  宏碁(Acer)歷經惠普(HP)今年相繼兩次之侵權控訴,於向惠普尋求和解未獲得回應後,宏碁之美國子公司於5月9日在美國德州聯邦法院遞狀,向其代工廠鴻海、緯創及廣達等三家廠商提起訴訟,要求下游代工廠商共同負責,協助其與惠普的官司訴訟。   此三家廠商在擔任Acer的供應商之同時,亦是HP的設計代工製造(ODM)廠商。宏碁為回擊惠普在美國對其專利侵權之訴訟,因而使出該絕招,並要求此三家供應廠商「共同履行訴訟保證責任」負起連帶保證之責任,並對惠普之侵權訴訟案給予協助。   宏碁表示,此一訴訟僅為配合美國法律程序而採取之必要行動。鴻海則表示,宏碁、惠普兩大客戶都是依據法律途徑正當保障並維護本身的權益,鴻海會依法律程序配合。廣達表示,此案已進入法律程序,未來將依法律途徑,尋求圓滿的解決。緯創則不予置評。   宏碁今年登上全球第三大PC寶座,而惠普連續兩次向美國法院控告宏碁涉嫌侵權之舉,被認為係意圖阻擋宏碁在美國市場之發展。宏碁表明,代工廠挨告的原因係由於與其合作模式為宏碁負責銷售,代工廠負責研發設計,和代工廠在合作之初,即已確保其所有提供給宏碁的技術,不會侵犯其他公司的專利,也約定廠商有義務負責相關專利訴訟賠償。

非評論、批判之著作若具新目的之轉化亦屬合理使用範疇之新見解 - Patrick Cariou v. Richard Prince

  美國聯邦第二巡迴上訴法院針對Patrick Cariou v. Richard Prince一案做出侵害著作權之合理使用判斷新見解,合理使用之目的主要為平衡著作權與美國憲法第一修正案之間的衝突,故1976年著作權法第107條中編寫有關合理使用之條文─在第106和第106A之規定外,對一受著作權保護作品的合理使用,無論是透過複製、錄音或其他任何上述規定中所提到的手段,以用作批評、評論、新聞報導、教學、學術交流或研究之目的,不屬於侵權。上訴法院認為被告Prince使用雖不符合批評、評論、新聞報導、教學、學術及研究等,卻是另有目的,可構成合理使用,更進一步指出被告的創意方法、表現形式等都與原告作品本質上不同,甚至還比原作新穎,因此,在轉化測試法則上建立了若以不同美學表達且加入挪用藝術手法的話,即使不具批判卻另有目的並加入新元素於創作,使原作改變之轉化,則構成合理使用。至於轉化測試法則確立於1994年的Campbell案,最高法院指出戲謔仿作可藉由諷刺原著作而轉化成與原著作不同的另一著作。   此案可謂針對合理使用於判定著作權侵害案件時,合理使用原則第一項因素成立轉化測試法則與否之新指標。著作權合理使用原則發展亦可觀察出美國有逐漸將判斷標準擴大之趨勢,而轉化測試法則之發展亦將持續追蹤之。

銜接實體與虛擬的新票據交換制度-美國二十一世紀支票交換法

TOP