美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/05/27)
引註此篇文章
你可能還會想看
愛爾蘭ISP業者被控侵犯著作權

  愛爾蘭最大的ISP業者Ericom因其使用者利用Ericom提供之網路服務傳輸音樂檔案,而遭EMI、Sony BMG、Universal及Warner提起訴訟,控告其涉嫌侵害著作權,要求Ericom應過濾其內容可能涉及侵害著作權之檔案。對此,Ericom向愛爾蘭高等法院表示,Ericom在法律上並無義務監督在其網路上所承載的檔案內容。   愛爾蘭數位權利壓力團體「愛爾蘭數位權利」(Digital Rights Ireland,簡稱DRI)聲稱,上述音樂出版業者對於Ericom的指控及要求於法無據,因為ISP業者不過是資料來源的媒介,並無法律義務對於網路上使用者的行為負責;歐盟也無法律特別要求業者應監督其所提供網路服務傳遞的資訊內容。DRI亦表示,若立法要求業者應監督傳輸之檔案,除將侵犯網路使用者的隱私權外,更意味著要求使用者付費讓業者監督其使用網路之行為,但目前過濾篩選技術仍不夠完善,反而會影響合法使用網路服務之用戶。   雖然如此,ISP業者仍面臨了越來越多的國際壓力,要求應即時阻攔使用者非法分享之檔案。如2008年夏季,法國將提出一套測試系統以協助ISP業者封鎖涉及侵權之資訊;比利時法院於2007年判決要求某個ISP業者應過濾其傳輸之資訊;日本ISP業者之代表組織亦強調,若發現使用者使用軟體違法分享音樂及遊戲檔案,將即時切斷網路服務,以防止使用者透過網路分享檔案侵害著作權。對於違法分享檔案之行為,若英國網路服務業者與音樂工業之意見仍未能達成一致,英國政府將立法要求,ISP業者應對違法分享檔案之使用者發出警告,而使用者仍堅持從事該違法行為,則其所使用之網路服務將會中斷。   目前,對於使用者利用ISP業者所提供之服務從事侵害著作權之行為,該業者是否應為使用者之違法行為負責已成為各國專家廣泛討論之議題,未來有關該議題之立法仍有待持續關注。

澳洲網路安全專員啟動「社群媒體年齡限制專區」保障未滿16歲青少年的數位安全

澳洲網路安全專員(eSafety Commissioner)於2025年10月啟動「社群媒體年齡限制專區」(Social Media Age Restrictions Hub),以落實2024年11月通過的線上安全法(Online Safety Act 2021)修正案。該次修正納入「社群媒體最低年齡」(Social Media Minimum Age, SMMA)框架之規定,以全面保障澳洲未滿16 歲的兒童及青少年。為落實SMMA,透過延緩取得帳號方式,而非全面禁止使用,以減輕青少年因登入帳號面臨的壓力及風險,從而維護其身心健康與福祉。 2025年12月10日受年齡限制的社群媒體平台必須採取合理措施,防止16歲以下的青少年建立或保留帳戶。eSafety 針對合理措施細節發布SMMA監管指引,並強調平台的合理措施不得僅依賴使用者自我申報年齡或出生日期,亦即要求業者透過嚴格的年齡驗證機制,限制特定年齡層的使用權限。eSafety調查顯示,儘管存在年齡限制,96%的10至15歲兒少使用過社群媒體,此現象凸顯強化業者責任的重要性。 為能更完整保護兒少隱私,線上安全法修正案另一重點在於授權澳洲資訊專員辦公室(Office of the Australian Information Commissioner)制定兒童線上隱私準則(Children's Online Privacy Code),確立以兒童最佳利益為核心的隱私保護標準,並規範線上服務應如何遵循澳洲隱私原則,該準則預計於2026年12月生效。此外,eSafety亦提供針對家長與青少年準備指南(Get-ready guide),協助其適應數位時代下的兒少保護新規定。

美國21世紀醫療法最終規則下之資訊封鎖條文生效,患者健康資料進用權利獲保障

  美國國家衛生資訊科技協調辦公室(The Office of the National Coordination for Health Information Technology, ONC)於2020年5月公告的「資訊封鎖最終規則(Information Blocking Final Rule)」,於2021年4月5日正式生效。   ONC依21世紀醫療法(21st Century Cure Act)授權,制定有「21世紀醫療法:協同操作性、資訊封鎖與ONC健康IT認證計畫」(21st Century Cures Act: Interoperability, Information Blocking, and the ONC Health IT Certification Program)最終規則,包含各面向關於新興醫療IT技術之規範,其中特別針對資訊封鎖的相關條文,又稱為「資訊封鎖最終規則」。   21世紀醫療法為了確保病患資料近用權利,在法條中明定禁止資訊封鎖行為。「資訊封鎖」,根據資訊封鎖最終規則的定義,是指健康照護業者或健康資訊技術廠商,包括受認證的健康資訊技術(health IT)、健康資料交換 (health information exchange)或健康資料網絡(health information network),在欠缺法律授權或非屬美國公共衛生服務部(Health and Human Service, HHS)認定合理且必要的情況下,所為之干擾、防止或嚴重阻礙電子健康資料(Electronic Health Information, EHI)獲取、交換及使用行為。但以下八種情況,不適用資訊封鎖最終規則:預防傷害(Preventing Harm)、隱私(Privacy)、安全(Security)、不可行性(Infeasibility) 健康IT性能(Health IT Performance)、內容與方式(Content and Manner)、費用(Fees)、授權(Licensing)。   21世紀醫療法在資訊封鎖章節中規定,資訊封鎖相關條文在資訊封鎖例外類型被定義出來後,始生效力。換言之,在資訊封鎖最終規則生效後,病患將有權依法近用其電子健康資料,資料持有者原則上不得拒絕。值得注意的是,資訊封鎖最終規則生效後至2022年10月6日止,適用資訊封鎖條文的電子健康資料範圍,係以美國協同操作核心資料(United States Core Data for Interoperability, USCDI)中所定義之電子健康資料為準。USCDI,是由ONC主導建立的一套資料標準格式,以統一健康資料交換格式,促進資料流通。2022年10月6日起,資訊封鎖最終規則所指的電子健康資料範圍將不僅只局限於USCDI標準所定義之電子健康資料,將擴及健康保險流通與責任法(Health Insurance Portability and Accountability Act, HIPAA)所定義的所有電子健康資料。

歐盟生醫研究積極籌組歐盟研究基礎設施聯盟(ERIC)

  歐盟自2009年6月通過並於同年8月生效之「第723/2009號歐盟研究基礎設施聯盟法律架構規則」(COUNCIL REGULATION (EC) No 723/2009 of 25 June 2009 on the Community legal framework for a European Research Infrastructure Consortium (ERIC),簡稱第723/2009號規則),其乃希望能促進各會員國間各自分散的研究基礎設施(Research Infrastructures,簡稱RIs)之資源凝聚及共享,讓原本僅為設施設備的RIs整合起來,透過由3個以上歐盟會員國作為某特定ERIC成員之方式,依第723/2009號規則向歐盟執委會提出ERIC設立申請,經執委會同意後,ERIC即可取得獨立法律地位及法律人格,以自己名義獲得、享有或放棄動產、不動產及智慧財產,以及締結契約及作為訴訟當事人,並得豁免無須被課徵加值稅(value added tax)和貨物稅(excise duty)等稅賦。歐盟創設ERIC法律架構之目的,是希望能透過國際合作、彙集國際資源,在歐盟建立起頂尖研發環境,吸引跨國研發活動集中與進駐,利用規模化的大型研究基礎設施導引出世界級研發。   截至目前,由奧地利、比利時、捷克、德國、荷蘭等國作為成員及瑞士作為觀察員所建立之「歐盟健康、老化及退休調查」(The Survey of Health, Ageing and Retirement in Europe,簡稱SHARE),乃是歐盟首次提出申請且正式設立之ERIC。SHARE-ERIC乃一大型的人口老化多國研究資料庫,並已收錄45,000筆以上年齡50歲以上個人之健康、社經地位及社會家庭網絡之跨領域及跨國籍資料,SHARE-ERIC之資料分析除將有助歐盟國家就老化社會之福利系統為規劃,更預期將成為推動其活動及健康老化歐盟創新伙伴試行計畫之重要基石。   除此之外,自2008年起由歐盟撥款500萬歐元籌備成立之「生物銀行及生物分子資源研究基礎機構」(Biobanking and Biomolecular Resources Research Infrastructure,簡稱BBMRI),從2008年至今(2011)年1月底3年籌備期間,已募得30個以上國家之53個會員聯盟以及280個聯繫組織(大部分為生物銀行),預計將建立成為最大的泛歐生物銀行,病患及歐盟人口之樣本與資料之介面,以及頂尖生醫研究之介面,且為了要BBMRI-ERIC,BBMRI指導委員會業已擬定「BBMRI-ERIC備忘錄」提供予有興趣之會員國家簽署,希望能在今年底前成立BBMRI-ERIC。

TOP