美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/10)
引註此篇文章
你可能還會想看
美國專利商標局宣布快軌上訴試驗計畫

  美國專利商標局(The United States Patent and Trademark Office, USPTO)於今年7月1日發布新聞稿,即專利審判及上訴委員會(Patent Trial and Appeal Board, PTAB)開始加速處理單方上訴的計畫。該計畫名為「快軌上訴試驗計畫(Fast-Track Appeals Pilot Program)」並於今年7月2日正式啟動。   根據該計畫,專利審判及上訴委員會上訴裁決的目標時間預計為該上訴被賦予快軌(即批准加速審查)之日起六個月內,此與美國專利商標局之期望相符。蓋目前單方面上訴的裁決時間平均約14個月,因此,對於申請該計畫的人來說,該計畫平均應將上訴程序縮短約8個月。惟申請該計畫所需費用為400美元,且被批准的申請案會被限制在每季125件,會計年度最多500件,預計施行一年。   美國商務部負責智慧財產權事務副部長兼USPTO局長Andrei Iancu表示:「這是USPTO史上首次,申請人將能夠加快專利審查和單方上訴的速度,從而能較典型申請案約一半的時間內,就其最重要的發明做出決定。」。PTAB首席法官Scott Boalick亦表示:「近年來,我們取得了長足的進步,將上訴待決時間從2015年的平均30個月減少到目前的平均14個月。很高興PTAB現在能夠為申請人提供更快的途徑,從而使發明人和企業能夠更快地將其專利發明商業化。」   值得一提的是,我國智慧財產局亦有發明專利加速審查(Accelerated Examination Program, AEP)及商標加速審查機制。而AEP更早於民國98年1月1日起試辦實施,依據申請事由之不同,智財局將在申請人齊備相關文件後,於6個月內或9個月內發出審查結果通知。

外籍專業人士來台法規將放寬

  經建會最近針對歐洲商會所提出之「 2005 到 2006 建議書」與該商會進行協調,歐洲商會表達希望政府針對跨國外商公司所聘僱之外籍專業人士,與因跨國企業內部調動來台之中國大陸專業人士,以及隨行來台之眷屬在台居留等相關規定,予以鬆綁。   為將國際人力資源引進台灣,以加速經濟的國際化與自由化,經建會宣布將進一步放寬有關外籍專業人士在台居留與聘僱許可的限制,並將簡化申請手續之處理原則。有關外籍專業人士聘僱許可之展延申請,原規定應於聘僱許可有效期限屆滿前 60 天提出展延,將放寬為前 4 個月提出即可;在居留證展延方面,也將由原本有效期限屆滿前 15 日,放寬為前 4 個月即可提出展延申請,使外籍專業人士規劃在台長期居留時更為便利。   至於歐洲商會提出延長中國大陸人士來台從事商務活動所核發之入出境許可證效期及展延後效期,陸委會將於近期內再召開協調會進行研議;其餘有關外籍專業人士大陸籍配偶「多次入出境證」之核發,以及開放大陸籍員工或隨行來台大陸籍配偶之父母能夠短期來台探親等建議,都將朝放?的方向規劃。另由於部分外商公司所聘僱大陸籍員工之子女目前無法在台取得學籍,經外僑商會反映後,政府表示將於近期內討論,以協助他們的未成年子女能夠取得學籍並在台就讀。

分子奈米技術獲重大突破

  加拿大分子奈米技術研究有重大突破,亞伯達大學科學家、艾明頓國家奈米技術研究所的 Bob Wolkow 及其同事經過多年研究,終於開發出分子電晶體。這一科研成果可能會研究報告在最新一期「自然」( Nature )雜誌上發表。   Bob Wolkow 日前接受採訪時指出,目前普通的電晶體中,需要上百萬個電子才能使電流轉換方向,但此次技術突破使得單一電子便能轉換該電流方向,以致可以大幅節約電能。過去曾有研究人員聲稱發現分子的導電性,但均沒有科學證據支持。他和他的同事此次使用掃描穿隧顯微鏡,確認可將直徑約為十億分之一米的分子轉換為電晶體。   此項進展可能是電子工業自五○年代電晶體革命以來的最大突破。多倫多大學的奈米技術專家魯達 Harry Ruda 指出,權威的「自然」雜誌稿件審核過程十分嚴格, Bob Wolkow 的研究成果能夠發表意義重大,必然會引起國人對奈米研究的廣泛注意,對相關領域科學家爭取研究資金很有幫助。   此外 Bob Wolkow 表示,他和他的同事已經著手設計有示範意義的單分子晶體電器,預計在 5 至 10 年內可出成果。他指出,這一示範電器不但可為開拓奈米電腦技術做出貢獻,還有可能為減低電腦晶片的生產成本鋪平道路。

APPLE以違反DMCA法案追訴Psystar

  根據美國北加州聯邦地方法院之資料公佈,APPLE已於上週對“Mac Clone”(克隆機)廠商PSYSTAR追加控訴,指控PSYSTAR侵犯了APPLE的著作權和商標權,同時,亦違反了美國1998年通過之數位千禧年著作權法(DMCA - Digital Millennium Copyright Act)的規定。APPLE表示,尚有其他廠商涉及本案,但APPLE仍未公佈其他涉案廠商名單。   PSYSTAR總部位於美國佛羅里達州,今年4月其推出了安裝APPLE Leopard OS X作業系統的低價個人電腦。此“Mac Clone”(克隆機)標準版售價為399美元,高階版售價999為美元。繼今年7月APPLE對PSYSTAR提起法律訴訟後,11月26日又針對PSYSTAR推出的“Mac Clone”(克隆機)追訴其侵犯了APPLE著作權和商標權。   今年8月份,PSYSTAR曾反控APPLE,宣稱APPLE把Mac機種之硬體和Mac OS X作業系統實行捆綁銷售(Tying),已明顯涉及不公平競爭,並違反美國反壟斷法相應條款。APPLE於9月份已要求法院認定PSYSTAR該項反訴無效。該起訴訟的主審法官威廉•阿爾薩普(William Alsup)於11月18日已作出裁決,認定PSYSTAR對APPLE的反訴無效。   APPLE的律師表示,該公司已握有充足之證據,因此決定對PSYSTAR提出其違反DMCA法案的追加指控。但APPLE的律師沒有對此證據加以具體說明,僅表示該項新指控與PSYSTAR的產品和市場行銷活動有關。   按照原定訴訟程序,APPLE起訴PSYSTAR的訴訟預計將於2009年11月09日開庭審理,PSYSTAR和APPLE雙方必須於2009年08月20日之前向法院提交一份描述兩造觀點和權利的說明。

TOP