美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/23)
引註此篇文章
你可能還會想看
美國專利標示不實之罰金計算

  美國聯邦巡迴上訴法院在2009年底於The Forest Group Inc. v. Bon Tool Co. 一案中將美國專利法35 U.S.C. § 292中關於不實專利標示(false patent marking)的懲罰金計算方式認定為罰金之計算是以每一個標示錯誤專利資訊的產品為基礎。美國專利法35 U.S.C. § 292中要求法院對專利資訊標示不實或錯誤之產品或包裝處以最高美金$500的罰金。在此案之前,許多地方法院將35 U.S.C. § 292解釋為罰金之計算是以每一次被告”決定”將產品標示不實專利資訊為基礎 (single penalty for each “decision” to falsely mark products),不論此決定是包含一個或一整批產品。在本案中,聯邦巡迴上訴法院同意地方法院的看法認定被告Forest Group意圖藉不實專利標示企圖欺騙大眾但撤銷地方法院將罰金定為$500之判定,而將目前專利法35 U.S.C. § 292 解釋為罰金是以”每一個”標示錯誤專利資訊的產品為基礎 (penalty for false marking on a per article basis)。   為了防範日後因此案罰金計算方式而造成所謂”標示流氓”(marking trolls) 之興起,聯邦法院於其判決中特別說明其解釋並非要求法院必須將每一標示錯誤專利資訊的產品處以$500美元的罰金。因法條中之罰金是以美金$500為上限,法院有權利權衡各案例背景決定罰款金額。例如,針對大量製造但價錢低廉的產品, 法院可對每一個產品處以極少的罰金。   The Forest Group 一案是美國聯邦巡迴上訴法院第一次針對不實專利標示之罰金提出解釋,直得關注其後續引發反應。廠商也應重新檢視其產品專利標示是否有不實或錯誤之狀況以避免被控標示不實專利資訊而被處以罰款。

加拿大提供App開發供應商指導方針解決因隱私保護所引發之問題。

  App已成為多數人每日不可或缺之夥伴,其應用層面廣及食、衣、住、行、育、樂等生活領域;不過用戶可能多未意識到,在App程式的下載及安裝過程中,開發供應商會記錄或接觸使用者手機中如電話簿、照片、影音檔案、簡訊、密碼記錄等其他資訊之可能。根據華爾街日報報導,56%的應用程式在用戶不知情的情況下,手機ID會發送給廠商;47%的應用程式會透露用戶的所處位置,使得個人隱私蕩然無存。   加拿大當地的隱私法規要求企業在追求創新及企業精神時必須將隱私保護納入考量;而在行動裝置應用環境中,無論是開發商、服務供應商、應用平台或是廣告商,只要有接觸用戶個人資訊之可能,就有遵守法規之義務。但考量App這樣一個嶄新又快速發展的科技生態,在實踐隱私保護精神之初可能會面臨到新的衝擊與挑戰。因此,加拿大隱私權主管機關(Office of the Privacy Commissioner of Canada,簡稱OPC)乃會同加拿大境內的阿爾伯特及不列顛哥倫比亞兩省各自之地方主管機關(其分別為Office of the Information & Privacy Commissioner of Alberta及Office of the Information & Privacy Commissioner for British Columbia)撰寫指導文件,希望能提供當地App開發供應商建議方案。   該項建議方案促使行動軟體開發供應商在設計與開發App應用程式時必須顧及使用者隱私之保護,並提供協助方式與預防原則,提高使用者隱私受保護之程度;除必須使用清晰且易懂之方式告知用戶的個人資料將進行何種用途外,在使用者下載前亦應告知被蒐集之資料類別及原因、資料儲存位置或地點、資料分享之可能及其原因、資料保存之期限、及其他可能影響用戶隱私之事件;倘若廠商必須變更隱私政策與規定,則應使用明確易懂之方式事先通知所有使用者了解進行何項變更,以強化用戶隱私與個人資料保護意識。

簡析歐盟「能源效率指令」-- 以建築能源效率為核心

荷蘭音樂檔案交換案判決ISP業者勝訴

荷蘭娛樂產業權利維護協會 (The Dutch Protection Rights Entertainment Industry Netherlands, BREIN) 起訴 5 家 ISP 業者遭致敗訴判決,起訴原因是該 5 家 ISP 業者拒絕交出 42 名疑似利用其網路進行非法歌曲檔案交換的使用者名單。 BREIN 只能追蹤到上述嫌疑犯的 IP 位址。   法院判決認為 BREIN 針對個人蒐證部份犯有重大錯誤。 BREIN 乃委由美國 Media Sentry 就網路上侵害著作權的公開論壇 (Popular Online Forum) 及 P2P 服務進行監測,並追蹤未經授權的線上散佈。但荷蘭法院認為, Media Sentry 僅檢測 Kazza 的共享檔案夾,但這些檔案夾中亦會包括個人使用檔案,因此,原告所提出檔案證據並不足以證明被告將有侵權之虞的歌曲檔案上傳。   當然,本案並非代表荷蘭 ISP 業者的勝利,法院指出, ISP 業者仍有可能依法律要求而交出其網路使用者個人資料。

TOP