美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/05/03)
引註此篇文章
你可能還會想看
日本新型態旅宿模式下誕生的民泊新法

  隨著以網路平台經營仲介事業的Airbnb服務開始流行,鎖定國外觀光客的個人住宅和投資型不動產出租產生一種新型態的商機,加上近年旅日遊客增加及2020東京奧運即將來臨,日本政府預期將會有短暫性遊客人數激增。為解決訪日旅客居住設施問題以及特定期間過後旅館閒置造成之資源浪費或倒產問題,日本將在明年(2018)六月施行住宅宿泊事業法(民泊新法)採取鬆綁民宿短期經營之法規限制。該法變革重點包含: 行政程序:原先依據旅館業法採取許可制,民泊新法施行後為申報制。 營業日數:層級化區分旅館與民泊限制年營業180日。 宿泊日數:解除住宿日限制(例如大阪民泊條例須三天兩夜以上)。 建物用途:原本必須為許可旅館,施行後住宅、公寓及招待所皆可。 營業地區:限制在住居專用地營業。   本法施行後將可明顯區分旅館業與民泊業強化管理,並且呼應日本政府的經濟振興計畫,帶動兼業、副業及提供自營作業者從事經濟活動的管道。另外,因新法施行後合法民泊增加產生的新型態商機成為吸引大型平台或企業投入政府經濟再興計畫之誘因,進而提供協助個人民泊經營者申報、環境改善、及代理管理等業務,有利於政府推動相關社會安全網建置。

德國慕尼黑地方法院日前認定特斯拉關於「Autopilot」等銷售(廣告)標示將誤導消費者

  自特斯拉(Tesla)推行Autopilot(此於特斯拉之繁體中文官網譯作自動輔助駕駛)以降,其原先宣稱可免手動(Hands free),但經美國國家公路交通安全管理局(National Highway Traffic Safety Administration,NHTSA)指摘特斯拉前述宣稱可能使駕駛人注意力渙散而發生事故,似乎影響近年來特斯拉對於其自動輔助駕駛系統之論調,而改要求駕駛人即便開啟該系統仍須將手放置於方向盤上。除了前揭特斯拉於車輛銷售(廣告)資訊所生的爭議外,日前2020年7月間德國慕尼黑第一地方法院(Landgericht München I)之合議庭的判決,認定特斯拉於其車輛(Model 3)之銷售(廣告)標示資訊的整體,以及原告競爭中心(Wettbewerbszentrale)所分別主張之內容,均屬不正當競爭防制法(Gesetz gegen den unlauteren Wettbewerb,UWG)第5條第1項第2句第1款之誤導性商業行為(Irreführende geschäftliche Handlungen,或譯作引人錯誤之交易行為)。   本件之爭點核心在於特斯拉現行車輛既有配備之Autopilot系統,以及消費者可自行選購之Volles Potenzial für autonomes Fahren(德文直譯:具備完全自動駕駛潛力,而特斯拉之繁體中文官網譯作全自動輔助駕駛)系統等用詞,因其等涉及車輛功能與設備之決定性概念和資訊,則與現行「車輛駕駛輔助系統」(Fahrassistenzsystem)存有落差,進而導致消費者理解與實際情況不一致之情形。   法院認定理由在於不論特斯拉之Autopilot或Volles Potenzial für autonomes Fahren等系統,均無法達到毋須人為介入行駛的情境,即便其於官網上有另行標註目前該等系統功能有限,仍須駕駛人主動監控所有行駛環境等,但因該等內容說明不夠透明與清晰,而仍無法排除其等資訊具有誤導性,故特斯拉使用Autopilot等詞以及其他暗示車輛技術上能完全自主(vollkommen autonom)等用語,將引起消費者錯誤認知其可在德國的道路上運行完全自主之自動駕駛系統(註:此部分似係指SAE標準等級5之自動駕駛系統,然德國道路交通法目前僅開放運行等級4以下之自駕系統)。不過該判決結果仍可上訴。

Youtube測試影片下載服務,並採創用CC授權模式

  Youtub宣佈開始測試影片下載服務,未來將朝向提供使用者免費或付費下載Youtube網站上之影片。同時免費提供下載的影片,創作者可選擇五種創用CC(Creative Commons)的授權模式;另一方面,影片所有人可自訂下載影片所應支付的費用,使用者則透過Google 體系的Google Checkout 付費。Youtube在其發表的聲明中指出,因為許多影片創作者希望影片能夠更廣為流傳,因此推出影片下載服務,影片所有人可以選擇影片的創用CC授權模式,使影片下載者在授權範圍內利用所下載的影片內容,促進影片內容的流通。   目前供下載的影片格式為MP4,屬於可普遍流傳播放的格式,可下載的影片在左下角有download連結。在實際應用上,Youtube目前正與Stanford、Duke、UC Berkeley、UCLA等大學透過該站測試免費下載學校報告、研究、演講,使學生或教授在課堂上可以離線使用與教學相關的影片。另外YouTube在My Video工具列中開發”My Purchases”頁面,讓使用者能追蹤他們所下載或想下載的影片。

紐西蘭通過「危害性數位通訊規制法」,對網路霸凌行為進行管制

  紐西蘭於2015年7月通過了「危害性數位通訊規制法」(Harmful Digital Communications Act)。有鑑於網路霸凌現象日益嚴重,甚至影響紐西蘭人民生命及身體安全,故而修訂法律規範之。 重點摘錄: 一、目的:減輕數據通訊對個人造成之傷害,並提供有害數據通訊之受害者提供補救的快速和有效的手段。 二、方法:   (一) 創建新的民事執行制度,以迅速有效地處理有害的數據通訊內容。   (二) 創建新的刑事犯罪,以應對最嚴重的有害的數據通訊行為。   (三) 修正現行法規,以釐清數據通訊和技術的發展適用範圍。 三、內容:   (一) 授權法院得要求網路通訊協定地址提供者(Internet Protocol Address Provider (IPAP))提交匿名之通訊傳播者資訊。   (二) 經受害學生同意後,其所屬學校之負責人得代表進行訴訟程序。   (三) 法院得依據「威脅將造成損害」(threats to cause harm)標準發布命令。   (四) 若不遵守法院命令將有刑事責任。   (五) 行為人經確定判決後,可處2年以下有期徒刑。   (六) 網路內容所有者(online content host)應設置聯絡機制。供使用者聯絡回報,並課予收到申訴時48小時內通知內容作者、申訴人以及取下霸凌內容之責任。   惟法律之修訂,亦引起相關批評,因「有害的」(harmful)之定義不明,而以刑事規制之,恐有侵害言論自由之疑慮。

TOP