美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw//article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/10)
引註此篇文章
你可能還會想看
美國聯邦通訊委員會新通過的隱私規範

  這是客戶的資訊,該資訊如何被使用應為客戶的選擇。」於此一理念下,美國聯邦通訊委員會(Federal Communication Commission,FCC)於2016年10月27日通過了寬頻客戶隱私規定(Broadband Consumer Privacy Rules),該規定要求寬頻網路服務提供者(broadband Internet Service Providers,ISPs)應保護其客戶之隱私,該新通過的隱私規範非禁止使用及分享客戶的資訊,而係給予客戶有更多的選擇去決定自身的資訊該如何被分享及使用。以下簡介規範內容: 一、規範對象:寬頻網路服務提供者及其他電信營運商,例如Comcast、Verizon、AT&T等。規範對象未包含聯邦貿易委員會(Federal Trade Commission,FTC)所管轄的隱私保護措施下的網站或其他邊緣服務商(edge service),例如Google、Facebook、Amazon等。亦未規範寬頻網路服務提供者營運的社交媒體網站或政府監管、加密,執法等問題。 二、 主要規範內容:將ISP所蒐集得使用及分享的資訊分為三類,建立客戶同意要件,分類如下。 (一)敏感性資訊須事前取得客戶肯定地選擇同意加入(opt-in),才得為使用及分享。敏感性資訊包含精確的地理位置、金融資訊、健康資訊、孩童資訊、社會安全碼、網站瀏覽紀錄、app使用紀錄及通訊內容。 (二)非敏感性資訊,例如電子郵件地址或服務層資訊,得使用及分享,惟當客戶選擇退出(opt-out)則不得使用及分享。 (三)同意要件之例外。除了在建立客戶與ISP關係外,針對特定目的將會被推定為已取得客戶同意,包含寬頻服務之提供或針對服 三、 其他重要規範內容:清楚告知客戶收集的資訊、將如何使用、向誰分享;實施合理的資料安全準則;保密性違反之通知。   然而針對FCC是否具有相關管制權限,質疑聲浪仍存於本次規範之通過。亦有認為該規範與FTC的管制同時運行將形成疊床架屋,造成社會大眾之混淆。並且該規範未能真實反映網路生態,未將網路公司或社交網站公司列入管制對象,無法真正保護客戶隱私。

美國聯邦通訊委員會暫停去年10月27日通過的寬頻客戶隱私規定

  原預計於2017年3月2日生效實行的美國聯邦通訊委員會(Federal Communication Commission,FCC)的寬頻客戶隱私規定(Broadband Consumer Privacy Rules),委員會於2017年3月1日宣布暫停該規範效力,並與聯邦貿易委員會(Federal Trade Commission,FTC)發表共同聲明。   為保障資料安全(data security),聯邦通訊委員會於2016年10月27日,以寬頻網路服務提供者(broadband Internet Service Providers,ISPs)及其他電信營運商為規範對象,要求須給予客戶有更多選擇去決定自身資料如何被分享和使用,除將ISP所蒐集得使用及分享的資料分為三類,建立客戶同意要件,尚設立新的提醒要件及保密性違反之通知等。該新的隱私規範試圖與聯邦貿易委員會的規範做區隔,除管制對象不同,管制架構上,聯邦貿易委員會要求業者在蒐集及利用個人資訊時,須符合公平資訊實施原則(Fair Information Practice Principles,FIPPs)之準則(guidelines):通知(notice)、選擇(choice)、讀取(access)、安全(security)。   通過之際產生的爭議,包含聯邦通訊委員會有無管制權限,及實行後可能與聯邦貿易委員會管制架構並行而造成疊床架屋、混淆大眾等的問題;此外,聯邦通訊委員會收到眾多請願,要求重新考慮該規範之實行。請願理由在於該規範之實行將會造成寬頻網路服務提供者及其他電信營運商為了要遵循規範將承受巨大的成本與負擔,並且這些成本與負擔與公眾利益相違背,將會造成不可回復的損害。   在接受請願討論後,聯邦貿易委員會做出暫停實施的決定,認為有關保護資料安全的規範要件需要重新思考,其理由在於:(1)消費者若受到兩種不同的隱私管制方式,會破壞消費者對於線上隱私安全一致性的期待;(2)不應使寬頻網路服務提供者及其他電信營運商遭受重大且不必要的遵循成本。   聯邦通訊委員會也與聯邦貿易委員會共同發表聲明,其聲明提及:聯邦通訊委員會與聯邦貿易委員會皆有責保護美國消費者的線上隱私,然而最好的管制方法,應該是透過一個全面性且一致性的架構。資訊隱私之保護不應當有因管制對象不同而有差別性,況且其中差異僅有專業人士才能辨別出,就消費者保護來說,並行兩道不同管制只會造成混淆,毫無益處。這也是為何當聯邦通訊委員會片面剝奪聯邦貿易委員會的管制權限而引發批評聲浪。對於寬頻提供者應保護隱私與資料安全之要求,應回歸至聯邦貿易委員會,由於國家對網際網路空間的管制,上網行為應該要適用一樣的規則,並且受到同樣的專責機關管制。除此之外,聯邦通訊委員會與聯邦貿易委員將共同合作致力於協調對寬頻提供者的隱私規範,該規範將會同所有與數位經濟相關的公司遵循的標準。線上世界技術中立(technology-neutral)的隱私框架之一致性,方能對消費者帶來最佳利益。   本次聯邦通訊委員會迅速暫停實施的隱私規範,顯現出美國對於保障隱私管制的重視性極高,美國針對網路生態中的不同公司,寬頻網路服務提供者及其他電信營運商,例如Comcast、Verizon、AT&T等;網站或其他邊緣服務商(edge service),例如Google、Facebook、Amazon等,將會有何種一致性的資料安全規範,值得持續關注。

歐盟部長理事會通過開放GSM頻段供3G寬頻技術使用

  歐盟部長理事會(Council of Ministers)已跟隨歐洲議會腳步,通過對「GSM 指令」(Global System for Mobile Communications Directive)進行修改的提案,准許電信營運商在900 MHz頻段上提供UMTS服務(3G通訊技術之一,可向下相容GSM與GPRS),例如WCDMA通訊架構可於900 MHz上運用。這項決議仍須經過歐盟各會員國國會和監督機構認可,預計2009年10月開始實施。   原先指令在1987年所提出,將900 MHz和1800 MHz頻段劃歸GSM手機專用,此作法有效促進GSM產業的蓬勃發展。修改該指令的提案,則是允許讓900 MHz頻段在繼續供GSM服務使用的同時,也開放給行動上網等更高速的泛歐洲通訊服務。預估將能大幅降低電信營運商網路建制成本,可減少大約16億歐元的支出。   據歐盟電信委員會Viviane Reding委員表示,GSM Directive的修訂,將為行動通訊業者解除限制,並因此能在GSM頻段上建置更先進的技術,以提供高速行動寬頻服務;她預期這將有效促進歐洲的無線經濟(wireless economy),並催生「數位歐洲」(Digital Europe)的誕生。相關發展值得台灣電信通訊產業注意。

Google預期推出智慧金融卡

  科技巨頭Google目前預計依循Apple Card模式,與花旗銀行、Stanford Federal Credit Union合作開發「Google Card」智慧簽帳金融卡。   雖目前尚未正式發行,但根據TechCrunch報導指出,使用者在連結銀行帳戶後,可向Google Card轉入資金或從卡中轉出資金,消費時會直接從個人連結的銀行帳戶扣款。此外,Google Card將連接到具有新功能的Google應用程式,讓使用者得以輕鬆監管消費狀況、確認餘額或鎖定帳戶。   這對於Google來說,為非常重要的一步,因Google本身掌握巨量資料,因此透過Google Card,Google有機會獲得新的收入和消費數據,其將向消費店家酌收交易手續費,再與銀行拆分;此外,Google Card的隱私權政策中,可能利用用戶消費的交易數據,以改善投放商品廣告的衡量標準,若Google可以其金融商品推動銷售,將使更多的品牌願意購買Google廣告。   長期影響來看,Google Card可為Google提供銀行業務,包括股票經紀業務、財務建議或AI會計、保險、借貸諮詢,而因Google掌握大量數據,將可能使Google比傳統金融機構更能準確的管理金融風險,透過應用程式、廣告、搜尋和Android系統,Google和消費者之間建立深厚關聯,為推廣和提供金融服務建立一個充足的背景。隨著武漢肺炎疫情的漸緩,高利潤的金融商品也將幫助 Google 開發有效的收入機會並藉此提升股價。

TOP