美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/01/14)
引註此篇文章
你可能還會想看
美國聯邦貿易委員會推動「不留痕」機制,使消費者可選擇不在網路上留下個人資訊

  美國聯邦貿易委員會(Federal Trade Commission ,FTC)最近開始推動一套「不留痕」(do-not-track)機制,旨在防止網站蒐集未經使用者授權之個人資料。 FTC所出具的報告,旨在幫助政策制訂者和立法者形塑隱私規則,同時要求網站揭露更多其所蒐集之資料的相關事項,諸如蒐集的資料種類、如何使用該資料、以及保存期間。該報告並建議企業提供使用者更多拒絕被蒐集資料的退出選擇方案。     FTC主席Jon Leibowitz在最近的記者會中指出,目前有許多尚未受到網路隱私規範之行銷方式,普遍受到廣告商、社群網站或是搜尋引擎運用。FTC當局的建議由五人所組成的委員會無異議通過,由於網路廣告商、媒體經營者以及零售商所建立的新的行銷模式均建基於個人資料的使用上,因此此建議亦同時考量到該等業者之利益平衡,至2011年1月31日前持續蒐集業者之意見。Leibowitz表示,FTC希望確保新興成長的資訊市場是建立在促進隱私、透明、商業革新和消費者選擇的框架上,而這也是多數美國民眾所希望的。」     此一「不留痕」機制是參照FTC另外一套受歡迎的「勿來電」機制,也就是將電話號碼註冊在一特定的名單上,以防止電話推銷員來電,不過實際上的運作模式仍略有差異。相較於將姓名註冊在一份中央管控的名單,此一機制則是透過網頁瀏覽器的工具,傳送不願被追蹤或接受特定廣告的訊息,Google、Microsoft和 Mozilla都已測試過此套技術。     在此一報告提出後不久,麻州參議員John F. Kerry表明他將會推動一部隱私權相關法律,使FTC有更多規則制訂權以實現其報告所提建議。因為作為相關主管機關,FTC制訂規則的權利其實很有限。

美國傳播通訊委員會將推動新的「網路開放」(Open internet)指導原則

  美國聯邦通訊委員會(FCC)主席Genachowski於2009年9月21日表示,FCC將提出新的網路開放指導原則,要求包括無線網路服務提供商在內的業者,維持網路中立,不得因傳送或下載資訊種類之差異而進行流量差別管理。此提案若經同意,預計將能有效避免如AT&T、Verizon與Comcast等大公司故意阻斷或是降低特定消耗大量頻寬網頁流量,或對不同用戶收取差異價格的情況。   現行的網路開放原則係於2005年提出,僅要求網路營運商不得阻斷(stop)使用者接取合法的網路內容、應用與服務,或抵制(prevent)不讓使用者以無害的設備,如智慧手機,連線接取相關服務。 FCC預計在現行的指導原則上加入兩條新的原則,以更確保網路的開放與中立性。此兩條新的原則包含對寬頻網路服務提供業者不得歧視的網路內容與應用規範之種類,以及對網路服務提供業者透明化其網路管理作法之要求等。   FCC主席表示,雖然這樣的提案肯定會遭受到電信業者的反對,但FCC仍應積極維護網路公開與自由。

英、美唱片業者控告YouTube-mp3.org侵權

  2016年9月國際唱片業協會(International Federation of the Phonographic Industry,簡稱IFPI)、美國唱片產業協(Recording Industry Association of America,簡稱RIAA)及英國唱片產業協會(British Phonographic Industry,簡稱BPI)對全球最大的串流音樂翻錄網站「YouTube-mp3.org」展開法律行動,指控該網站違反YouTube的服務準則,且侵害音樂著作權。目前該案件由美國加州聯邦法院審理。   「YouTube-mp3.org」將串流音樂變成可供下載的音樂檔案,使用者只需在該網站(YouTube-mp3.org)複製貼上原YouTube的音樂影片網址,即能將其轉為MP3檔案下載使用。RIAA表示運營商透過該網站已經獲利數百萬美元的廣告收入,卻未支付任何金錢報酬給音樂家或著作權權利持有人,因此控告YouTube-mp3. org及該站負責人Philip Matesanz侵害著作權。BPI則表示,使用者得透過各種串流服務存取合法音樂,若對此非法轉載音樂的業者或行為不提出法律行動,將會影響合法的音樂串流服務。   另一方面,德國聯邦部門(German Federal Ministry ) 早在2011年時曾認定,從Youtube網站複製下載音樂為非商業之私人行為合法。而電子前線基金會(Electronic Frontier Foundation,簡稱EFF)對於英美唱片業協會要求法院消除此類型網站一事持否定看法,認為法律不應賦予著作權人或商標所有人修訂刪除網站的權力。

菲律賓最高法院延長網路犯罪法適用限制之時間

  菲律賓最高法院於2013年2月5日延長了之前(2012年10月9日)對於網路犯罪防制法(Cybercrime Prevention Act of 2012),所做出的120日暫時限制適用令(Temporary Restraining Order),表示此一法令暫時尚無法正式施行。對此,菲國參議員多表示贊成,而對於該法主要的批評包括過度侵害言論自由、違反程序正義、比例原則以及一事不兩罰原則,並可能導致「寒蟬效應」,先前聲請停止該法施行的相關人士則認為該法過於模糊且規範範圍過廣。   該法之具體適用爭議如:(1)ISP業者僅因刊登誹謗性言論,即可能遭致處罰。(2)該法12條授權主管機關可即時蒐集利用電腦系統之特定通訊資料。(3)網路使用者可能被認定為網路犯罪之幫助或教唆者而被處罰。(4)政府可能依據此法蒐集網路使用者之各種資料。   不過,菲國檢察總長Francis Jardeleza 對此則表示,此法雖有缺陷,但亦尚未至完全可廢止之程度。另外,尚有菲律賓全國記者聯盟(National Union of Journalists of the Philippines, NUJP)與菲律賓網路自由聯盟(Philippine Internet Freedom Alliance, PIFA)對此限制適用令表示支持,並認為對於法令與自由衝突爭議正方興未艾。

TOP