美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/03)
引註此篇文章
你可能還會想看
新加坡修正通過電子交易法

  新加坡於2010年5月19日修正通過電子交易法,並於7月1日正式施行。此次新修正之「電子交易法」,是依據新加坡資通訊發展局(Infocomm Development Authority,IDA)及司法部於2004到2005年間推行之公眾意見諮詢,進行法條之全面翻修。作為電子交易法制之先驅國家,新加坡於此次修法中納入聯合國「跨國契約中使用電子通訊公約」(United Nations Convention on the Use of Electronic Communications in International Contracts)之相關規定,此一公約旨在促進全球之電子通訊及交易以相同之法律模式加以運作。     該法之修正係為因應新加坡電子商務之日趨成長以及國民對電子化政府之需求,以建立新加坡成為全球可信賴之資通訊中心。此次修正重點如下: 一、參照聯合國「跨國契約中使用電子通訊公約」之規定,調整電子簽章之要件以及對於收發電子文件時間與地點之認定。納入以自動處理訊息系統做為契約訂立之方式,以電子文件作為正本以取代實體書面之正本文件,並就電子交易中要約之引誘以及電子通訊中發生錯誤時之解決方式加以規定,使新加坡之法律制度能與國際電子商務法律制度接軌。 二、促進民眾及企業與政府機關進行互動時,更有效率地使用電子文件相關服務,以加強電子化政府服務之應用。如提供綜合性電子表格,讓使用者僅需填寫一次相關資訊,即能利用不同種類的電子化政府服務。 三、對憑證管理中心之規範採用技術中立的認證架構,未來憑證管理中心不一定要使用公開金鑰基礎建設(Public Key Infrastructure,PKI)之相關技術作為提供驗證服務之方式,相對地,在其他技術逐漸開發之狀況下,也可採用其他技術提供驗證服務,如生物鑑識技術。當然,主管機關仍會以相同標準對採用不同驗證技術之憑證管理中心進行監督,以確保憑證服務之安全性及有效性。 。

歐盟資料治理規則提出資料利他主義制度以利於公益目的之利用

  歐盟於2022年5月30日正式簽署通過「資料治理規則」,同時引入(EU)2018/1724修正案(REGULATION (EU) 2022/868 OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on European data governance and amending Regulation (EU) 2018/1724),針對資料中介組織及資料利他主義組織業務啟動、營運等註冊程序進行補充。   資料治理規則也通稱為資料治理法(Data Governance Act, DGA)。DGA以建立一個可信賴的資料流通環境,達成資料的可利用性,以促進資料可用於各項研究以及創新的商品和服務為目標。   DGA中,特別引人注意的是第四章「資料利他主義」(Data altruism)的提出。依據資料治理規則第二條,所謂的資料利他主義係指資料主體基於自願且無償的情況下,同意他人得處理或利用其所持有的個人資料;或資料持有者在不尋求補償的情況下允許他人得利用其所有的非個人資料(non-personal data)。而這些資料利用的目的是以實現公共利益為目標,例如醫療保健、解決氣候變化、改善交通、促進公部門統計資料的產製與應用、改善公共服務、制定公共政策,或是科學研究等。   為利於資料利他主義的落實,歐盟希望有明確的的制度設計,藉以促成更多資料主體或資料持有人,在有足夠信任的基礎下,願意將資料無償提供並進行公益目的之利用,進而實現改善生活的目標。 因此,DGA中提出以下作法: 制訂「歐洲資料利他主義同意書」(European data altruism consent form):該法授權歐盟執委會應在諮詢過歐盟資料保護委員會(European Data Protection Board)以及考慮過DGA新設之歐盟資料創新委員會(European Data Innovation Board)的意見後,制定統一的「歐洲資料利他主義同意書表格」。以此增加資料主體對於資料授權的信任,提高資料主體同意將資料釋出與流通再利用之意願,並為授權或撤銷同意建立法遵明確性。 資料利他主義組織(data altruism organisations)管理機制: (1) 資料利他主義組織採自願註冊制度,而非許可制。在資料利他主義於符合形式登記要件後,並符合非營利、透明性以及滿足保障民眾權利等要求後,於其所屬會員國中註冊以成為公認(recognised)的資料利他主義組織。採自願註冊而非許可制的目的,是希望先以管制密度較低的方式,鼓勵更多組織投入資料利他主義的推動。 (2) 給予已註冊之資料利他主義組織識別標誌:透過相關的認可機制並授予識別標誌,藉此提高資料利他主義組織的可辨識度與信賴度,讓民眾在選擇合作的組織時有所依循。 (3) 透明度要求:為了增加資料主體或資料持有者對該組織的信任度,歐盟也將對資料利他主義組織進行一定程度的監督管理,例如年報編列與管理、是否以清晰易懂方式通知資料主體或資料持有者其資料被利用的目的、需保留資料利用之所有紀錄等。此外,也需要遵守DGA授權歐盟執委會未來訂定的相關補充規範。   整體而言,歐盟將資料利他主義的公益精神經由法制化的方式納入歐洲資料治理規則,透過歐洲資料利他主義同意書以及資料利他主義的相關管理規範,降低溝通成本以及建立信任基礎,以增加資料釋出的可能性,進而提升資料被利用的程度,最終達成改善人類福祉的目標。

英國資訊專員辦公室對連鎖藥局違反GDPR存放敏感個資作成裁罰首例

  英國資訊專員辦公室(Information Commissioner's Office, ICO)於2019年12月20日發布首宗依據歐盟一般資料保護規則(General Data Protection Regulation, GDPR)之裁罰。   本案源於英國藥物及保健產品管理局(Medicines and Healthcare products Regulatory Agency, MHRA)接獲投訴前往倫敦當地一家名為Doorstep Dispensaree Ltd之連鎖藥局進行藥品違規調查,卻意外發現其後院存放大量敏感個資文件,約五十萬個文件檔案皆未做任何資料檔案保護措施,上面更記載名字、地址、出生日期、NHS號碼、醫療資料及處方籤等患者之個人資料,旋即通報英國資訊專員辦公室展開調查。最終英國資訊專員辦公室以該藥局違反歐盟一般資料保護規則(General Data Protection Regulation, GDPR)第5條1項第f款、第24條第1項及第32條,裁罰275,000英鎊。其裁罰理由如下: 一、隱私政策並不符合要求,如未述明蒐集個人資料之類別,未訂定個資保存期限,當事人告知聲明不完備,無當事人權利行使等。 二、無適當安全維護措施 三、涉及敏感性個資,違法情狀嚴重 四、未積極配合調查 五、影響層面甚深,導致該藥局配合之上百家療養院,近千名當事人個資受損害。   此為英國資訊專員辦公室首宗依據歐盟一般資料保護規則確定裁罰之案例且涉及敏感性個資,有其指標性。除此之外,英國航空與萬豪酒店之個資外洩案亦欲依GDPR進行裁罰,實值持續關注後續發展。

WHO發布《2019‑nCoV戰略準備和應對方案》呼籲全球加速研發創新以對抗疫情

  2020年2月3日,世界衛生組織(World Health Organization, WHO)發布《2019新型冠狀病毒戰略準備和應對方案》(2019 Novel Coronavirus: Strategic Preparedness and Response Plan),呼籲全球合作以加速研發創新,對抗新型冠狀病毒(2019 novel coronavirus, 2019-nCoV)。WHO提出的戰略目標包含六大項:限制人與人間的傳播防止疫情擴散、盡速發現並隔離以便提供患者最佳照護、查明並減少動物來源的傳播、加速診斷治療和疫苗開發、傳達重要且正確的風險與事件資訊、透過合作夥伴關係減少疫情對社會經濟影響。而WHO設立的戰略目標,可以透過以下方式實現:(1)加速建立國際協調方案,透過現有機制及合作夥伴關係提升防疫戰略、技術及業務支持。(2)擴大各國家的災難準備與緊急應變行動方案,包括加強準備、迅速發現、診斷並進行治療;在可行的情況下發現並追蹤感染者;強化醫療機構中的感染預防及控制;實施旅行者的健康管理措施;提升人民對疫情風險認識、減少社區交流風險等。(3)加速對2019‑nCoV的研究及創新,優先推動快速篩檢追蹤與擴大研發創新規模、開發候選療法、疫苗及診斷方法,確保醫療資源的公平可用性。藉由防疫標準化流程與知識平台的建立,促進並匯集學界合作的研究成果。   另外,WHO在本戰略中明列出八大衡量指標,用以評估各國因應2019-nCoV的計畫準備與成效,以便WHO能與政府合作,共同改善全球防疫系統。該八大指標分別為:流行病學症狀分析與疫情規模判斷能力、戰略準備及預算管理計畫、防疫物資供應程度、研究開發與臨床實驗比例、國家公共衛生系統疫情準備能力、建構檢驗與快篩的即時通報系統、完善診斷流程與安全隔離措施、疫情報告與資訊分享機制等。

TOP