美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/03/26)
引註此篇文章
你可能還會想看
歐盟議會要求禁止將複製動物作為食品

  伴隨著歐洲食品安全局公開一項經高度謹慎評估關於複製動物在食品安全、動物健康和環境等方面關聯性之科學意見後;歐洲議會隨即於2008年9月3日邀集委員會召開討論會議,並於該會議中遞交出有關於禁止將複製動物作為食品之建議案。透過表決,在622票贊成、25票棄權與32票反對之壓倒性決議下,議會通過了該項建議案。   該項禁令建議案要求歐盟境內各會員國應禁止:(1)以複製動物作為食物之來源、(2)為糧食供應目的而進行畜養之複製動物或其繁殖之子代、(3)於市場上販售經由複製動物或其經繁殖之子代所衍生之食用肉品與乳製品;以及(4)禁止以食用為目的自境外進口複製動物與其經繁殖之子代(包括精子或卵子細胞)等行為。   而EFSA也發現:「不太可能達成全面性食品安全之評估工作」,故對於缺乏可靠數據資料而需進行評估之主體而言,在進行風險評估時,其仍將會不斷地被不確定性問題所困擾;同時,EFSA在該報告中還強調:透過比對複製動物與經傳統育種繁衍之動物後,其也將面臨「於動物健康及福利方面等重要爭議問題」。另外,歐洲議會成員指出:將透過歐盟農場動物保護指令中,有關禁止任何可能引起痛苦或傷害之自然或人為育種繁殖過程之規定,作為該項禁令之法律授權依據。   截至目前為止,尚未有任何由複製動物所衍生之產品在歐洲或者世界其它地方被銷售;不過,由於美國食品藥物管理局(FDA)早在2008(今)年1月份時即做出結論,認為:由複製牛、豬、山羊與其子代所產生之肉品與牛奶,其安全性與食用從傳統育種動物所衍生之食品並無二致。因此,專家們咸信,此類產品將會於2010年時正式進入市場販售;而在歐洲方面則更進一步認為,日後在處理複製動物食用之問題上,應要兼顧到動物福利之保護與獲得廣大消費者之信賴。

美國總統歐巴馬宣布增加強化美國網路安全預算經費

  為強化並有效因應網路安全相關議題,美國總統歐巴馬日前於4月10日提出在2014財政年度(於2013年10月開始起算)增加強化網路安全經費之建議,期待透過藉由加強並建置相關網路安全機制的方式,有效解決目前美國所面臨來自中國、伊朗、俄國、以及其他國家之的網路安全威脅;同時,其亦希望藉此厚植並改善美國政府,以及私人企業的電腦網絡防禦能力。   本次由美國總統歐巴馬所提出的國家網路安全策略主要可區分為二部分:1. 加強美國網路事件(cyber incidents)的彈性度,以及2. 減少網路威脅事件。首先針對加強美國網路事件彈性度的部份,主要會透過a. 強化美國數位基礎建設,進而能有效抵禦滲透和干擾,b. 改善美國對於複雜和敏捷的網路威脅防禦能力,以及c. 培養針對不同類型的網路事件,皆能快速應變並恢復的能力,這三個方法來加以落實。而就減少網路威脅事件的部份,則計畫以透過a. 與美國友邦結盟的方式,共同研議國際網路規範,b. 強化網路犯罪的法律執行能力,和c. 遏止潛在對手就現有之美國網路漏洞採取不當行動,三個策略模式的實施來加以實踐。然而除了上述的兩個策略及其子項的具體落實外,美國政府亦強調串連各政府部門,以及私人企業團體間之合作重要性,以及建立一個能夠使得網路維護人員及其他相關人員,得以快速取得相關網路安全資訊的便捷管道亦為重要。   隨著全球資通訊網路交流互動以及依賴程度日益增長,如何有效兼顧個人網路安全隱私及使用自由,並同時確保網路資訊流通的安全性,乃為目前強加網路安全的重要關注焦點。本次美國總統歐巴馬所提出的網路安全推動策略走向,及其如何加以落實,實值得持續關注。

美國最高法院明確放寬專利權耗盡原則之適用範圍

  美國最高法院於2017年5月30日針對Impression Products v. Lexmark International作出最終裁決,說明當專利權人銷售專利產品時,無論在美國境內或境外,專利權人不能再以美國專利法來限制該專利產品,一經銷售後該產品專利權已經耗盡。   本案起因為美國印表機研發製造大廠Lexmark推出兩項碳粉匣方案:原價碳粉匣,無任何轉售限制;以及優惠碳粉匣,並附帶「一次性使用」(single use)及「不得轉售」(no resale)限制條款,消費者不得自行填充再利用、再轉售或轉讓給原廠以外的第三方。本案專利權人Lexmark控告同業Impression侵害其權利(違反一次性使用及不得轉售),被告Impression則主張兩項碳粉匣產品的專利權在美國境內的首次銷售後就已耗盡了。該案爭點包含:(一)專利產品在境外首次授權或銷售,是否導致專利權耗盡;(二)專利權人訂立售後限制條款,可否用以追究當事人違反限制條款責任?   地院引述最高法院過去兩個判例(Quanta案及Kirtsaeng案),裁定Lexmark專利產品因首次授權銷售情形而權利耗盡。原告Lexmark提出上訴,CAFC則認為專利產品在境外銷售情形,不會導致專利權人在境內專利權耗盡,且在首次銷售時給的授權,已經合法限制再銷售或再使用,故Impression仍構成專利侵權。   最終,最高法院推翻CAFC見解,認為無論是專利權人直接銷售,或是對專利產品加諸任何限制,專利權人決定銷售產品時,該產品相關的專利權就會耗盡。另外最高法院亦指出,當專利權人透過契約與購買者約定,限制其使用或轉售的權利,其在契約法上或許有效,但在專利侵權訴訟中則沒有用。本案後,最高法院確立採國際耗盡原則,說明專利權人在全球任何地方,產品經銷售後即權利耗盡,無論專利權人是否有任何售後限制。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」

澎湖發展風力發電 催生大規模離岸風場

  「能源」將是本世紀最受注目的議題之一 。為了有效規劃能源配置,台電擬定風力發電十年計畫,規畫在十年內建造30萬瓩的風力發電容量,其中在風車的故鄉—澎湖,計畫催生231部風力發電風車,並將興建台澎海底電纜傳輸電力。未來,澎湖將成為台灣首座大規模的「離岸風場」。   目前我國政府正大力發展再生能源,其中台電計畫在西部沿海大量興建風力發電廠,另外,在離島的澎湖也將大量興建風力電廠。風是澎湖獨特的天然資產,目前台電在澎湖白沙鄉中屯已經建有8部風車,未來將繼續在澎湖設置231部風車。   在荒漠或海上興建風電場,是世界新趨勢,英國 2003年第一個離岸風場開始營運,下一世代新的離岸風電場總容量更將高達120萬瓩,德國兩個離岸風場容量高達30萬瓩,風場發出來的電將傳輸到歐洲中央電網。這些離岸風場不光是建在小島上,還包括以鋼或木頭架在淺海中的風車。

TOP