美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/28)
引註此篇文章
你可能還會想看
區塊鏈電子存證法律效力於中國大陸首獲認可

  中國大陸於2017年8月在杭州設立網路法院(Internet court),專責處理網路購物、線上著作侵權等涉及網路爭議之案件。該法院網站設有「線上訴訟平台」,當事人在該平台使用手機號碼註冊帳號後,可遞交起訴狀和相應的證據材料,勾選所需依據的法律條文,系統將自動讀取該當事人之相關身分資訊、線上交易過程及各類表單資料。   近日該網路法院針對一線上著作權侵權案件,於審判過程中採用區塊鏈電子數據作為證據,等同認可區塊鏈電子存證之法律效力。由於區塊鏈作為去中心化的數據庫,每筆網路交易訊息皆同步於整個區塊鏈網路,因此區塊鏈有著難以竄改、刪除的特性。杭州網路法院將從第三方存證平台的資格、侵權網頁取證技術可信度及區塊鏈電子數據保存完整性進行審查,對本案電子數據之證據效力作出認定。   杭州網路法院認為,對於採用區塊鏈等技術進行存證之電子數據,應秉承開放、中立的態度進行個案分析認定,不得因為區塊鏈等技術本身屬於新型且複雜之技術而排斥或提高其認定標準。本案認可區塊鏈技術存證之法律效力,將對區塊鏈未來應用發展有很大的影響,隨著技術發展逐步成熟,產業應用的實際效果也愈發顯著。

加拿大修正專利法,於2019年正式生效

  2018年12月1日,加拿大智慧財產局公告了新專利法,並立2018年12月1日起至31日為公衆諮詢期,該法於2019年正式生效。   本次專利法修改多屬鬆綁權利人之期日限制,包括: 恢復優先權主張:在新專利法上路後,在非故意錯過了12個月的優先權期限的情況下,可允許將優先權期限延長至14個月; 更容易取得申請日:針對直接申請加拿大專利而非透過專利合作條約(Patent Cooperation Treaty,PCT)的申請案,即使尚未繳納申請費,或是相關申請文件非英文和法文,一樣可以取得申請日; 允許補交在主張優先權申請遺漏的內容; 獲核准通知後提出修改作業的程序順暢化; 採用電子送件,排序列表不會被徵收超頁費; 對特定的錯誤有更明確的修正截止日:移除因「行政作業」上疏失而提出修正請求的規定,在其他規定上增加了明確的截止日; 採PCT途徑進入國家階段已經不再有42個月的期限; 維持費用制度較為複雜,錯過實質審查期限影響也較嚴重; 如果已遞交之申請案並非英文或法文版本,那未來修改申請案必須要能自合理的從原本外語版本中合理推論而出; 需提出優先權證明文件:申請人必須向加拿大專利局遞交每一件先前申請的優先權證明文件,特殊情況下才能豁免提交; 部分申請期限變短:新專利制度縮短申請人部分申請程序及時間,例如申請實體審查期限從申請日起5年內降為4年等。

美國參議員提出「消費者網路視訊選擇法」草案

  越來越多消費者由網際網路觀賞視訊內容,保護新興視訊業者之市場競爭力也越加重要。美國參議員John D. Rockefeller於2013年11月發佈「消費者網路視訊選擇法(Consumer Choice in Online Video Act)」草案,塑造一個以消費者需求為中心的視訊市場,提供完全的單頻單賣(a la carte),使消費者有權力選擇想看的節目、決定想看的時間、挑選收看的方式,並且只為真正收看的內容付費。   此外,本法案亦規範網路服務業者必須提供消費者更完整精確的帳單資訊,以增進消費者權益。在促進市場競爭的目的下,本法案也賦予新興視訊產業基本的保護,防止既有業者之反競爭行為,使市場能有效競爭,帶給消費者更多利益。   該法案的主要規範內容簡介如下: ‧管制既有之有線電視、衛星電視與大型媒體公司對網路視訊服務業者的反競爭行為。 ‧提供網路視訊服務業者合理的取得各種節目內容之能力,使他們能提供給消費者更多節目與服務的選擇。 ‧管制寬頻服務業者不得降低其市場競爭者之網路傳輸品質,以保護網路視訊業者接觸消費者、提供服務的管道。 ‧提供消費者更為透明與容易理解的帳單資訊。消費者在申請網路服務時,將能得到更為清晰易懂的服務契約與條款的資訊。 ‧指示聯邦通信委員會持續監督寬頻服務之資費條件,確保這些資費條件不被用於反市場競爭行為。   隨著寬頻服務的普及,網際網路能夠提供更多元的內容,一方面消費者能夠有更多的選擇,確保市場持續有效競爭是非常重要的,本法案對我國而言亦有相當參考價值。

Google Android作業系統在歐盟被控違反競爭法

  Google最近因他的Android作業系統,遭到其競爭對手向歐盟競爭法主管機關檢舉違反競爭法。以FairSearch.org為代表、Nokia、Microsoft及Oracle在內的Google競爭對手指控,Google企圖利用他的Android系統作為”特落伊之馬”(Trojanisches Pferd),以獲得行動業務的獨占地位並據以控制使用者資料。這是因為Google要求智慧型手機和平板電腦的製造商若要使用一些受歡迎的Google應用程式,如Google Maps或YouTube時,必須連同一系列其他的Google應用程式,一起放在這類行動設備的桌面上明顯位置。這項要求被競爭對手認為已影響到其他App提供者,且讓Google擁有隨時透過製造商銷售出的智慧型手機,掌控大量的用戶資料的能力。   此外,FairSearch.org也主張,因Google以不符成本的方式推廣他的Android作業系統,此舉讓其他作業系統的提供者難以回收投資。目前Google的Android作業系統已經在智慧型手機服務市場擁有獨占地位--其市場佔有率約為70%;在平版電腦的服務市場上,Android作業系統的佔有率也在增加之中。因此,歐盟執委會應對Google這些在行動市場上的不當行為展開嚴格調查,以避免歐洲的消費者因Google濫用市場的行為而受到損害。事實上FairSearch.org已經不是第一次指控Google違反競爭法,在此之前,FairSearch.org就曾向歐盟檢舉Google的搜尋引擎業務違反歐盟競爭法,其被指控就其搜尋引擎的搜尋結果,涉嫌對自己提供的服務提供優惠的差別待遇。歐盟在2010年11月正式對此展開調查,該案調查現已近尾聲,歐盟對此的立場傾向要求Google在他的搜尋結果應清楚地說明哪些是屬於Google集團的服務以作為標示。至於最新有關Android作業系統的指控,歐盟已表明會以放大鏡檢視,但歐盟是否會正式調查或將兩案合併審理,尚不清楚,Google也還未針對有關Android作業系統的指控做出回應。

TOP