美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/02)
引註此篇文章
你可能還會想看
歐盟EDPB認為防範Cookie疲勞應確保資訊透明及簡化

歐盟資料保護委員會(European Data Protection Board, EDPB)於2023年12月13日回覆歐盟執行委員會(European Commission, EC)有關Cookie協議原則草案(Cookie Draft Pledge Principles)之諮詢。該草案旨在處理「Cookie疲勞」(Cookie fatigue)所造成的隱私權保護不周全之處。 在電子通訊隱私指令(ePrivacy Directive)以及GDPR規範下,由於現行同意機制複雜,造成用戶對Cookie感到疲勞,進而放棄主張隱私偏好。 為了避免「Cookie疲勞」,EDPB提出以下原則和建議,大致可以分為三點: 一、簡化Cookie不必要的資訊 1.基本運作所需之Cookie(essential cookies)無需用戶同意,故不必呈現於同意選項,以減少用戶需閱讀和理解的資訊。 2.關於接受或拒絕Cookie追蹤的後果,應以簡潔、清楚、易於選擇的方式呈現。 3.一旦用戶拒絕Cookie追蹤,一年內不得再次要求同意。 二、確保資訊透明 1.若網站或應用程式的內容涉及廣告時,應在用戶首次訪問時進行說明。 2.不僅是同意追蹤的Cookie,用於選擇廣告模式的Cookie,仍需單獨同意。 三、維持有效同意 1.應同時顯示「接受」和「拒絕」按鈕,提供用戶拒絕Cookie追蹤的選項。 2.在提供Cookie追蹤選項時,除了接受全部的廣告追蹤或付費服務外,應提供用戶另一種較不侵犯隱私的廣告形式。 3.鼓勵應用程式提前記錄用戶的Cookie偏好,但強調在用戶表達同意時必須謹慎處理,預先勾選的「同意」不構成有效同意。 EC表示,該草案目的在於簡化用戶對Cookie和個人化廣告選擇的管理,雖然為了避免Cookie疲勞而簡化資訊,仍應確保用戶對於同意Cookie追蹤,是自願、具體、知情且明確的同意。將於後續參考EDPB之建議,並與利害關係人進行討論後,制定相關法規。

歐盟發佈Amazon違反反托拉斯法之初步調查結果,並將對其電商業務展開第二輪調查

  歐盟執委會於2020年11月10日對Amazon發佈反托拉斯調查之初步調查結果,針對其2019年7月之首次調查提出調查意見書(Statement of Objections, SO),認定Amazon使用大量非公開賣家資料,減少自身作為零售商之競爭風險,相關可能違反歐盟運作條約(TFEU)第102條禁止濫用市場主導地位。   歐盟於2019年7月17日對Amazon展開首次反托拉斯調查。Amazon作為平台,具有雙重身分,第一個身分是作為零售商,在網站上銷售商品;第二個身分是作為平台商,提供第三方賣家銷售商品的市場。因此歐盟認為Amazon在平台上收集價格或活動統計資料,將調查Amazon和第三方賣家的標準協議中,是否允許Amazon分析賣家的買賣統計資料?以及第三方賣家使用「黃金購物車」(Buy Box)的機制為何?   歐盟執委會調查說明,Amazon作為平台,可以大量使用第三方賣家資料,例如訂購及發貨數量、賣家收入、報價次數、物流資料、賣家表現評價、消費者索賠資訊等。然而相關統計數字及資料進入Amazon業務自動化系統,使Amazon零售業務可以大量使用上述非公開資料,以調整自身產品零售報價和業務決策,降低自身作為零售商的市場競爭風險。   此外,歐盟執委會認為,Amazon的「黃金購物車」和「Prime label」機制,使平台上的第三方賣家必須選擇使用Amazon物流、倉儲和售後服務(Fulfillment by Amazon, FBA),才能取得平台的「黃金購物車」和「Prime label」標章,才可能增加產品搜尋曝光度、交易成功率,進而提高銷售量(據統計,Amazon平台超過八成之交易是透過黃金購物車完成)。因此導致消費者大多選擇購買曝光度高、也就是使用Amazon物流的賣家,形成賣家之間的不公平競爭。歐盟執委會後續將啟動第二輪調查,且未言明結束調查時間。

Google關鍵字廣告服務,遭澳洲政府起訴

  澳洲「競爭和消費者委員會」(Australian Competition and Consumer Commission;以下簡稱ACCC)在今年7月對Google及其廣告主Trading Post Australia提起訴訟,指控Google及Trading Post使所用的關鍵字廣告系統不實誤導網路使用者,構成了欺詐性的商業行為。   Trading Post為澳洲當地知名的汽車經銷商,在2005年時,Trading Post向Google購買了名為Kloster Ford和Charlestown Toyota的關鍵字廣告;然而,Kloster Ford和Charlestown Toyota正是Trading Post的競爭對手,當網路使用者在Google的搜尋引擎中鍵入Kloster Ford或Charlestown Toyota文字時,搜尋結果頁面即自動導向Trading Post的網站。   ACCC認定Trading Post此種利用競爭對手名稱設定為自身廣告關鍵字之行為,已違反澳洲在1974年頒布的「商業行為法」(Trade Practices Act 1974)第52條及第53條d款規定;ACCC同時認為,Google並未善盡努力在消費者鍵入關鍵字進行搜尋時,將付費廣告鏈結(sponsored links)從基本的搜尋結果頁面中將加區隔,亦有違該法第52條之規定。   在ACCC對Google提出控訴之前,Google事實上在各國早已面臨多起類似的訴訟;其中,去年由法國知名品牌Louis Vuitton提起的訴訟中,Google即遭到敗訴。

歐盟RELIEF計畫於今(2016)年11月展開前商業化採購之市場公開徵詢

  有鑑於許多歐盟國家為日漸高漲的健康照護成本所困,歐盟於Horizon 2020政策下陸續推動會員國合作以更有效益的創新採購方式進行健康照護計畫的推展,以降低健康照護預算的壓力,RELIEF計畫即屬其一。歐盟於2016年2月啟動RELIEF計畫,聯合義大利、西班牙、瑞典三國,目的在發展創新ICT解決方案以協助慢性病患透過自我管理方式舒緩慢性疼痛、能夠持續獨立生活。欲採購的ICT創新服務為目前尚不存在於市場上、仍需經研發之解決方案,實為針對慢性疼痛自我管理解決方案的「研發服務」,該計畫係採「前商業化採購(Pre-Commercial Procurement, PCP)」方式進行跨國公告招標。目前RELIEF計畫正在進行PCP準備階段之公開市場徵詢,除了透過2個月(今年11、12月)的公開線上問卷調查業者意見,另將以workshop形式舉辦三場公開市場徵詢會議。   RELIEF計畫另一重要目標就是透過此計畫以建立完整PCP流程,讓未來參與相關計畫的公部門能夠熟悉並妥善運用PCP流程及工具 。「前商業化採購」為歐盟廣泛創新戰略中所指出能協助公部門採購「研發服務」的特殊採購程序,以滿足尚未存在市場上、仍需經研發的技術性創新需求,此程序不包含對研發成果的商業化採購,亦不受政府採購法之規範,能夠從需求面刺激廠商創新研發,讓研發從一開始即以機關需求為核心。   RELIEF計畫劃分為PCP之準備階段以及執行階段。於準備階段會進行PCP招標文件準備、採購團隊的需求及現有技術分析、公開市場徵詢(Open Market Consultation, OMC);由於採購機關對其需求尚無具體的規格描述,必須經廣泛的市場意見徵詢與溝通以進一步定義,正在進行中的OMC將聚集採購團隊、潛在投標者(例如對健康照護、數位照護、病患賦權與互動性有鑽研之ICT業者)、終端使用者等,以廣蒐相關利害關係團體意見並進行充分互動溝通,作為執行階段的重要參考基礎。   PCP正式公告後的執行階段即區分為階段A「解決方案設計(Solution design)」(計半年)、階段B「原型開發(Prototype development)」(計半年)、階段C「商業化前開發:場域測試(Pre-commercial development: field test)」(計一年)。各階段將設定參與廠商應達成目標,以篩選出較符合需求者始得進入下一階段,以維持廠商間良性競爭,於階段C最後決標予研發成果最符合計畫需求之廠商(可能1家以上)。   歐盟目前的創新推動策略上PCP屬尚未被充分運用的工具,從該計畫的規劃可見準備階段對後續PCP執行階段的重要性,透過其示範可供政策規劃者為借鏡,運用創新採購驅動產業創新發展以更有效益解決社會與政府需求。

TOP