美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/03/19)
引註此篇文章
你可能還會想看
淺談我國經濟部能源局建築能源效率管制措施

淺談我國經濟部能源局建築能源效率管制措施 科技法律研究所 2013年3月25日 壹、事件摘要   行政院2012年9月份核定「經濟動能推升方案」,擘畫台灣2030年經濟藍圖。在該方案中,乃明示能源永續發展的重要性。經濟部能源局於2013年3月份公告修正「指定能源用戶應遵行之節約能源規定」,針對22,349家空調設備用電大之觀光旅館、百貨公司、零售式量販店、連鎖超級市場、連鎖便利商店、連鎖化妝品零售店、連鎖電器零售店及銀行、證券商、郵局、大眾運輸場站及轉運站等合計11類業者,實施「冷氣不外洩」、「禁用白熾燈泡」及「室內冷氣溫度限值」規定,預估每年可節省2,158萬度電。   經濟部能源局表示,11類服務業100年總用電量約71億度,其中空調用電量約占41%。觀鄰近中國大陸、南韓、日本政府均已針對營業場所訂有夏季室內空調溫度,並由公部門帶頭示範。台北市政府自2011年起亦開始推動「營業及辦公場所室內冷氣平均溫度須保持在攝氏二十六度以上」規定,實施至今有效促使約700家能源用戶(契約容量超過300kW)之空調均溫維持於二十六度,實施結果由99年不合格率32.3%,至101年不合格率降低為4.9%,顯示執行該規定有效可行。 貳、重點說明   經濟部能源局新修正公告之「指定能源用戶應遵行之節約能源規定」,乃著眼於建築物內部耗能之管制,而該管制措施乃近年來歐、美等先進國家亟力促進推動的建築能源效率(energy efficiency)議題。 參、事件評析   據統計,建築物耗能占人類經濟活動總碳排放量40%,而台灣地區舊建築物約莫占整體建築物97%,如何有效提升舊建築物本身之能源效率為重要課題。查內政部建築研究所之相關研究,建築物節能主要含括三個面向 - 外殼節能、空調節能及照明節能,因建築外殼節能為內政部營建署之管轄範疇,故經濟部能源局僅就建築物之空調節能及照明節能進行管制,本文將以美國聯邦能源部(Department of Energy, DOE)相關之法制政策為比較探討。   美國聯邦政府於2011年2月份正式啟動「更佳建築倡議」(Better Building Initiative),於2012年12月份能源部(Department of Energy, DOE)發布之進度報告(Progress Report)指出,目前建築能源效率存有若干投資障礙,第一,尚缺少能源效率投資成本節省之實證數據;第二,尚缺少潛在市場和技術解決方案之相關資訊;第三,能源效率作為商業最佳實踐尚未普遍被接受。基此,能源部將致力於促進能源效率投資並強化聯邦公部門示範作用等手段。   在促進能源效率投資上,因市場尚缺乏相關數據資訊,難就能源效率之市場價值進行驗證;將研議相關機制,作為未來融資和建築物改善的基礎。另在聯邦公部門強化示範作用上,將透過聯邦能源管理計劃(Federal Energy Management Program, FEMP)和節能績效契約(Energy Savings Performance Contract, ESPC),持續強化能源技術服務公司(Energy Service Companies, ESCO)進行聯邦建築物節能效益之提升和擔保。   此外,於該倡議旗下之「更佳建築挑戰」(Better Building Challenge)乃鼓勵民間部門之參與。以美國百貨業龍頭梅西百貨(Macy)為例,其承諾將透過能源資訊系統(EMS)之使用、觀察及分析,找出佔地一億七千九百萬平方呎的商業樓地板面積之關鍵能源機會。照明方面,該公司也以超過一百萬盞LED燈之替換與重點照明,在過去三年內減少了百分之七十的照明能源消耗。   綜上觀察,我國能源局新修正「指定能源用戶應遵行之節約能源規定」下「禁用白熾燈泡」規定,乃禁止十一類業者使用二十五瓦特以上之白熾燈泡於一般照明用途,近似於美國梅西百貨於「更佳建築挑戰」下所承諾之LED重點照明之實踐。此外,借鏡美國經驗,我國宜研議建立起台灣建築能源效率數據資訊之系統資料庫,助於未來舊建築改善市場之發展。

FCC公佈第三次美國寬頻測量報告

  延續過去兩年針對全國寬頻網路服務進行檢視,FCC在2013年2月公布第三次「美國寬頻測量報告」(Measuring Broadband America)。這份報告有別於過去,將受測技術從DSL、有線電視與光纖,涵蓋至衛星寬頻,使資訊更加多元。此外,網路服務供應商(Internet Service Provider,ISP)在今年尖峰時段(工作日晚間7點至9點)提供寬頻實際速度與網速的契合率達97%,而較2011、2012年進步,因此,這份報告的另一個重點,便是提出寬頻速度與廣告相符的三大關鍵:   1.ISP業者盡力改善網路效能(Network Performance),而非調降牌告價(Speed Tiers )。   2.民眾接納更快速的網路意願,更甚過往。FCC指出,消費者訂閱網速的層級,逐漸從每秒14.3Mbps ,發展至15.6 Mbps。至於,使用網速低於1Mbps、或是1Mbps到3Mbps的民眾,近年也逐步採用更高速的網路。   3.衛星寬頻的進步:雖然,衛星技術在傳輸上仍有延遲的缺陷,但是,有近90%的民眾於尖峰時段,得到超過業者寬頻廣告速度的140%(業者宣稱具有12Mbps),使消費者感受不出網路尖峰期。   為使2015年實現50Mbps寬頻網路具有1億家戶可連結,美國逐步發展國家寬頻計畫(National Broadband Plan,NBP)。FCC避免寬頻廣告速度與實際速度不符影響NBP發展,未來將要求ISP業者對於網路牌告負起責任(Accountability),藉此增加市場競爭性與提高資訊透明度。以「美國寬頻測量報告」為例,藉由委員會、產業與其他利益相關人合作的方式,促進資訊的透明,使消費者在取得訊息後,有能力做出正確的決定,便是一種提高透明度的方式。   雖然,FCC認為寬頻網路進步與民眾採納較高速的網路,對於市場發展是一項利多,但部分輿論卻認為這與2011年12月31日FCC網路接取報告(Internet Access Report)結論相距甚遠。根據報告顯示,美國有高達42%的民眾下載速度不到3 Mbps、上傳速度不到769 kbps,而這與「美國寬頻測量報告」結果,確實大相逕庭。無論如何,可以窺見FCC視民眾使用意願與網路基礎建設同等重要,因此,如何增加消費者選擇較高速的網路,將是市場未來發展的關鍵。

淺析英國建築能源效率政策—Green Deal之融資運作政策研究

全球Open Data成功及挑戰之關鍵報告

  根據全球資訊網基金會(World Wide Web Foundation)及英國開放資料協會(Open Data Institute)指出,全球77個國家正進行Open Data政府開放資料政策,但實際運作上,各國政府提供公眾近用之資料集佔不到全世界政府資料的10%,呈現各國Open Data政策實行還有很大進步空間。   全球資訊網基金會與英國開放資料協會所合作的網絡平台-政府開放資料研究網絡(Open Data Research Network),針對各國政府開放資料執行狀況進行評比並提出Open Data Barometer研究報告。此報告指出,英國政府開放資料執行及成效排名第一,其次排名陸續為美國、瑞典、紐西蘭、丹麥、挪威。除此之外,專以倡導開放知識、資料、內容的國際非政府組織,開放知識基金會(Open Knowledge Foundation),則提出基於Open Data可用性及近用性進行70個國家的排名,英國仍是第一名,其次為美國、丹麥、挪威、荷蘭。從上述兩項研究報告中,英國在Open Data政策落實的成效受到高度肯定,而歐美地區仍在Open Data政策實行上領先世界其他地區的國家。   Open Data Barometer研究報告指出,目前各國政府傾向不提供具潛在爭議性的政府資料,但此類資料往往具再利用價值,例如政府財政預算及交易資料、公司登記、土地登記等相關資料。全球資訊網創始人Berners Lee表示,政府及企業不應考量提供資料集而無法收取費用,或有意掩蓋政治敏感之資料來保護政治利益,而對於公布會造就人民生活的重大進步但具爭議性之資料集,感到卻步。   目前多數國家開放資料之機器可讀性資料與資料集之免費授權(Open License)皆少於7%,報告中說明全球資料集實際可用性仍偏低,亦發現各國提供資料之收費不僅沒有效率,資料再利用授權關係也不明確,使得企業及使用者處在法律不確定之風險中。   全球面對開放資料的進展雖已有初步成效,但成功經驗仍集中在歐美國家,世界上其他國家在開放資料的可用性及近用性,仍與歐美國家有顯著差距,為能促進全球人民生活福祉及活絡商機,各國政府應更積極地執行開放資料政策,並持續改進。

TOP