美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/03)
引註此篇文章
你可能還會想看
防範網路釣魚──事後追究有其侷限,多管齊下始屬正途

美國眾議院通過專利改革法案,引發各界關注

  美國眾議院在今年9月7日,表決通過「2007年專利改革法案(The Patent Reform Act of 2007)」,由於該法案中有部分內容,如:申請優先制度與賠償數額的計算標準等內容,預計將影響美國專利制度發展與未來法院關於專利訴訟案件的進行,因此引發各界專注。   此次眾議院通過的「2007年專利改革法案」重點在於修改專利案件中關於侵權賠償的計算標準,將以該專利對整體產品的貢獻度為主,做出適當的賠償數額。另外還有限制上訴地點的提出等,而且其中影響最大的改採「申請優先制度」(First-to-File System)。   目前美國專利制度採行是所謂的「發明優先制度」(First-to-Invent System),但未來依據「2007年專利改革法案」的內容,將轉變為世界各國採行的「申請優先制度」,故被稱為是美國專利制度50年來最重大的變革。   本項法案的通過,各界正反面的意見都有,支持的人說這項法案的內容可以遏止專利訴訟的濫用,使企業間的經濟活動得以正常發展。但是反對的人認為,限制賠償數額、上訴地點等,將使利用專利為惡的人更形囂張,削弱專利保護的機制,反而會阻礙美國甚至是世界各國的專利制度發展。

印第安那州對違反個資外洩通報義務之保險公司提起訴訟

  印第安那州首席檢察官Greg Zoeller對Wellpoint保險公司提起訴訟標的金額30萬美元之損害賠償訴訟,主張該公司因遲延向首席檢察署及超過32,000萬因個人資料外洩影響所及之客戶通報個資外洩事件,而違反印第安那州通報法〈Indiana notification laws〉中通報及揭露規定〈Chapter 3. Disclosure and Notification Requirements及Chapter 3. Disclosure and Notification Requirements〉,依法各得請求15萬美元罰金,此為印第安那州提起之首件違反通報義務之訴訟。   前述法令於2009年7月生效,新法規定個人資料擁有者〈database owners〉負有「通報義務」,其於個資外洩事件發生後,必須在「合理期間」〈within a reasonable period of time〉內,對「潛在受影響之個人」〈both the individuals potentially affected by a data breach〉,以及檢察署通報,惟經調查,該公司未於合理時間內通報前述應通報之對象。   經查該公司於今〈2010〉年2、3月間即發現客戶個資外洩,卻6月18日始通知客戶,檢察署展開調查後認定其遲延通報無正當理由,故代表印地安那州向其提起民事賠償。   前述所指外洩之個人資料包括:提出投保申請者之個人資料內容,諸如「社會安全碼」〈social security number〉、「財務資訊」〈financial information〉、「健康記錄」〈health records〉,因該保險公司網頁之照管者〈siteminder〉未能實行安全防護,使盜竊身分之人〈identity thief〉得以改變統一資源定址器〈URL〉而窺見申請者的個人資訊。   除印第安那州客戶外,該保險公司因客戶個資外洩亦使其他州投保申請者資訊曝露,包括:美國加州、科羅拉多、康乃迪克、肯特基、密蘇里、內華達、新罕布夏、俄亥俄及威思康辛等九個州,約有47萬個客戶可能因此受影響。

美國參議員提案修改股票選擇權(stock option)租稅處理優惠

  美國參議員Carl Levin最近提出一項名為「終止公司股票選擇權租稅優惠法」(Ending Corporate Tax Favors for Stock Options Act, S. 2116,以下簡稱:股票選擇權租稅優惠終止法)的草案,主要目的是希望改變公司對於股票選擇權費用化的租稅處理(tax treatment of corporate stock option deductions)。   就租稅意義而言,公司發給員工(包括高階經理人及一般員工)的股票選擇權為薪資的一種,而根據美國內地稅法規定,目前公司在申報股票選擇權的薪資支出(compensation expense)減項時,可以申報的費用比公司帳簿上所登載的更高。由於此一稅法上獨厚股票選擇權的處理,使得近年來許多美國企業支付給主要高階經理人的薪資,有一大部分是股票選擇權,此現象在科技產業亦甚為顯著,其結果造成公司高階經理人與一般員工的薪資差距越益擴大。   「股票選擇權租稅優惠終止法」要求公司於薪資支出項下申報的股票選擇權費用,必須與公司帳簿所記載的數目一致,同時,股票選擇權也應與其他類別的公司薪資費用一樣,同樣受到1百萬美元的費用上限之申報限制,至於股票選擇權申報費用的時點,則不須要等到選擇權行使(exercise)的年度。

TOP