美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/12/11)
引註此篇文章
你可能還會想看
Google新版桌面搜尋工具引發隱私權顧慮

  Google在2006年2月11日推出最新版的桌面搜尋工具Google Desktop 3,它的最新功能可以讓用戶同時搜尋多台電腦的資料。當啟用這項功能後,它會將電腦裡的文件和文字檔案(如Word、Excel)內容予以複製上傳到Google的伺服器上。當用戶在一台電腦搜尋資料時,也會在其他台安裝此工具的電腦自動開始搜尋。Google 表示,目前已經有很多人同時使用數台電腦,這個新功能可以讓使用者的生活更為便利。   但是倡導網路隱私權的團體Electronic Frontier基金會卻表示憂慮。由於新功能可能會讓駭客更容易盜取用戶個人資料,用戶的個人隱私將面臨更大的威脅。該基金會律師Fred von Lohmann認為,使用者應重視個人資料被放在Google伺服器上可能產生的問題,這比便利性更為重要。因為使用時若未花時間處理功能選項和設定問題,它將可能導致個人資料諸如納稅、醫藥和財物紀錄,以及其他文字檔案等資料外洩。

iTrip 在英國即將合法

  在喜愛使用民用電台的狂熱份子和那些想在汽車音響使用iPod的民眾的推波助瀾下,英國電訊局Ofcom計畫在2006年秋天鬆綁其對低功率FM傳輸器的管制。 在英國,利用像iTrip這樣調頻傳輸的小裝置,插在iPod、MP3 player、汽車音響或者其他無線電接收設備上來收聽FM廣播是不合法的。為了廣播系統不被干擾,英國1949年的無線電信法(UK Wireless Telegraphy Act of 1949)規定,唯有拿到FM廣播頻率執照者才有權使用該頻寬。不過,這項對低功率FM傳輸器的管制即將解除。 1949年的無線電信法是過時的。英國電訊局發現,只有極少數未經英國政府許可執照的廣播電台因違法被起訴,因為低功率的傳輸器會干擾廣播系統的可能性極低,當初制定該法的目的幾乎不會被影響。廣大消費者希望能透過車上立體音響來使用iPod聽音樂的需求也遽增,這都是促使Ofcom計畫開放原先限制的理由。 一份Ofcom的聲明指出了其鬆綁的目的:「任何降低法律負擔的目的,都是為了鼓勵創新廣播技術和應用發展。其中一個方式就是開放收聽廣播的設備的使用,解除有使用頻譜需求而需要申請執照的限制。」

世界五大專利局針對新興科技與AI技術組成聯合工作組以提高專利審查效率

  由世界五大專利局,韓國智慧財產局(KIPO)、美國專利商標局(USPTO)、歐洲專利局(EPO)、中國國家知識產權局(SIPO)與日本專利局(JPO)所組成的IP5組織於2019年6月13日在韓國仁川召開會議。   IP5的五個專利局涵蓋了全球85%的專利申請量,各國代表在會議中同意將持續透過相互調和專利審查程序以達到更有效率的全球專利系統,其中包括:新興科技的專利分類、全球專利檔案(Global Dossier)服務的持續改善、加強五大專利局間的工作分享以及調和專利審查實務與程序。在專利審查實務與程序的調和上,IP5同意針對以下項目進行調和:發明專利的統一性、引證的先前技術、專利說明書是否充分揭露的判斷,這些項目的調和目的在於減輕申請人的負擔並增加專利審查工作效率。   會議中五大專利局也同意成立新興科技與AI技術的聯合工作組以因應全球技術的發展,透過聯合工作組協調對於AI專利的審查標準,以及如何將AI技術運用於專利管理事務中。   預期透過IP5的五大專利局相互調和,將可使專利審查更有效率、審查標準趨於一致且專利資訊和數據可更容易獲取,有助於企業組織在國外的專利申請布局。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

精品珠寶業者攻防戰-卡地亞控訴蒂芙尼竊取營業秘密

  今(2022)年2月28日卡地亞(Cartier)控訴精品珠寶領域的競爭對手蒂芙尼(Tiffany & Co.),聲稱其在卡地亞前員工的幫助下,竊取獨家商品的營業秘密。   歷峰北美公司(Richemont North America Inc.)旗下的卡地亞今年2月28日於美國紐約州法院起訴蒂芙尼和卡地亞前襄理(Junior Manager)梅根瑪莉諾(Megan Marino),控訴瑪莉諾於跳槽前下載卡地亞的高級珠寶業務機密資訊, 並於去年11月加入蒂芙尼後將資訊傳送給新同事。蒂芙尼發言人發出否認聲明,卡地亞的指控毫無根據。   根據訴訟聲明,蒂芙尼聘請瑪莉諾負責包括單價高達1000萬美元(約新台幣2.8億)的高級珠寶系列,蒂芙尼法律部門從卡地亞獲得通報後,於今年2月份解僱瑪莉諾,但卡地亞聲稱,蒂芙尼的高階主管已經獲得大量的卡地亞機密和營業秘密資訊。   這並非卡地亞第一次指控跳槽至蒂芙尼的前員工試圖竊取營業機密。2014年,卡地亞起訴一名前廣告主管,據稱其試圖讓她的前助理隨身攜帶機密資訊一同加入蒂芙尼,該訴訟於次年和解。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

TOP