美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/04)
引註此篇文章
你可能還會想看
行動上網吃到飽對電信產業之影響

  隨著4G開台,各家電信業者為獲取用戶數,爭相推出無限上網吃到飽方案,然在數據流量呈現爆炸性成長下,電信業者之收益卻持續下探。為解決此問題,本研究嘗試提出建議方案,期望實現我國對數位經濟之願景。

Google關鍵字廣告在美國贏得重要勝利

  美國聯邦法院近日判決Google販售含Rosetta Stone的關鍵字廣告,並不會造成Rosetta Stone商標的混淆而構成侵權,同時也沒有商標淡化、輔助侵權以及侵權的連帶責任等問題。   在Rosetta Stone與Google一案(Case No. 09cv736, E.D. Va., 8/3/10)的判決中,法院並未再著墨於過去十年來爭論不休的關鍵字廣告販售是否構成商標使用的問題;在本案中,法院假定Google的行為構成潛在可訴的商標使用,在沒有事實爭議的情況下做出對Google有利的即決審判(summary judgment)。判決中認定Google販售Rosetta Stone關鍵字廣告給第三人,並不會對Rosetta Stone的商品來源造成混淆,法院認為Google的使用者可以分辨實際的搜尋結果,以及廣告主的贊助廣告連結。   法院也認定Google對於Rosetta Stone商標的使用受到功能性原則的保護。在本案中法院認為Google的關鍵字扮演著必要的指示功能,並影響廣告的成本與品質。如果沒有這樣的功能,Google將必須為希望鎖定在目標客戶的廣告主創造一個沒效率的搜尋系統。   而過去6個月近200個案例中,Google都在接到Rosetta Stone的通知後,將相關訊息移除,因此,法院援引近期Tiffany 與eBay一案(600 F.3d 93, 2d Cir. 2010),認為Google對於贗品販售者購買關鍵字廣告的一般性認知,尚不足以構成輔助侵權的主觀認知要件。   另外,法院認為僅僅廣告購買的交易關係,並不足以讓Google與贗品之間建立起侵權的連帶責任,就像時代廣場的廣告看板租用一樣,沒有證據顯示提供廣告空間的Google掌控這些贊助廣告的外觀與內容;而在2004年Google開始開放以商標作為關鍵字廣告之後,Rosetta Stone的聲譽持續成長,法院表示無法證明Rosetta Stone的商標因為Google關鍵字廣告販售而淡化。   本案的判決可能終止長久以來對於以商標作為搜尋引擎關鍵字的爭議,儘管商標權人在Rescuecom與Google一案(562 F.3d 123, 2d Cir. 2009)中確認了這樣的行為構成了可訟的商標使用行為,但這樣的行為是否構成侵權仍有待進一步的檢驗,而近五年來Google的關鍵字廣告販售已經變成普遍的商業型態,而Google使用者也越來越習慣分辨一般搜尋結果與贊助廣告的差異,因此,對於這樣的行為要被認定為有混淆誤認之餘而構成侵權,商標權人在美國恐怕還有一段辛苦的路要走。

美國法院推翻過去電子郵件監視案件之判決立場

  美國上訴法院於八月於判決中指出,電子郵件服務提供者未經使用者同意對於其傳送、接收之電子郵件加以監視,應為犯罪行為,即使服務提供者僅利用使用者經由其伺服器傳送郵件時的自動暫存過程進行監視,亦構成未經使用者同意的「攔截」 (intercept) 行為,違反監聽法 (Wiretap Act) ,而構成犯罪,推翻該國法院過去所建立「電子郵件服務提供者未經使用者同意監視使用者電子郵件通訊,不屬違反監聽法之犯罪行為」的立場。   被上訴人 Bradford C. Councilman 是從事珍貴與絕版書籍網路建擋列表服務之 Interloc Inc. 的副總裁,該公司給與其顧客含有 "interloc.com" 網域名稱之電子郵件地址作為服務的一部份,並且提供如同電子郵件服務提供者之服務行為,本案起因於 1998 年 Bradford 指示該公司雇員透過修改郵件接收程序之方式,攔截並拷貝所有服務使用者與其競爭對手亞馬遜網路書店 (Amazon.com) 間的電子郵件通訊,亦即,所有來自 Amazon.com 的信件到達伺服器時,由於程式的運作,該信件於寄至使用者信箱前會先行複製,由 Interloc 公司員工加以閱讀。   本上訴法院之判決,乃針對電子郵件的傳送是否屬於監聽法中所謂的電子通訊 (electronic communication) 以及該公司之行為是否構成「攔截」皆作成肯定之解釋,對於電子郵件使用者隱私權之保護有指標性的影響。

日本政府擬修法全面禁止濫發商業電子郵件

  為解決日益嚴重的騷擾郵件問題,日本總務省於今(2008)年2月29日向國會提出「特定電子郵件送信適當化法修正案(特定電子メール送信適正化法改正案)」,將全面禁止未經收件人事前同意而擅自寄發宣傳廣告郵件,並將海外寄送之騷擾郵件列入適用範圍。   依據現行法之規定,未取得收件人同意寄送廣告或宣傳之郵件時,必須在主旨上標明「未經同意廣告」,並負有標示寄件人名稱、電話號碼之義務。如收件人發出拒絕收件之通知時,即禁止再傳送相關郵件;違反者將處以一年以下拘役或100萬日圓以下罰金。然而,一旦收件人回覆拒絕收件,將使業者察知該郵件帳號為有效帳號;故收件人對騷擾郵件大多不予理會,但如收件人未回覆拒絕收件之訊息時,該騷擾郵件仍得合法寄送。此外,依據調查,目前騷擾郵件中,有九成的電腦郵件及半數的行動電話簡訊,均是從海外所發出,而迴避了現行法之規範。   因此,本次修正草案明定全面禁止未經同意擅自傳送商業電子郵件至他人電腦或行動電話;即使取得收信同意,如中途拒絕時,其後即禁止再傳送郵件。此外,草案並課以郵件中應明示寄件者姓名、名稱及電子郵件地址,並要求須保存如何取得收件者同意之相關記錄。現行法不適用之海外寄送之騷擾電子郵件,也將與日本國內電子郵件受到相同規範。如偽裝電子郵件地址而傳送郵件時,或經總務省要求改善而未加以改善時,將處以最高3000萬日圓罰金。本修正法案預定於2008年中施行。

TOP