美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/12/01)
引註此篇文章
你可能還會想看
日本發布2020年統合創新戰略,聚焦疫後科研與創新政策

  日本內閣府在2020年7月17日發布「2020年統合創新戰略(統合イノベーション戦略2020,下稱創新戰略2020)」政策文件。創新戰略為內閣府轄下綜合科學技術與創新會議(総合科学技術・イノベーション会議)依據日本科學技術基本計畫,自2018年起固定於每年度發布。其目的係自全球性的觀點出發,提出含括科研創新之基礎研究至應用端的整體性策略。本年度創新戰略著眼於COVID-19疫情流行與世界各地大規模災害頻仍下,日本科研與創新政策所面臨的課題以及應採取的對策,並擴大科研領域,納入人文社會科學。   創新戰略2020指出,因COVID-19疫情影響,醫療體系、社經生活與研發活動皆受到程度不等的衝擊,包含零接觸經濟興起、社交方式改變與實體研究室關閉等。與此同時,美中科技對抗、GAFA數位壟斷爭議、極端氣候與天然災害等國內外情勢變遷快速。在此背景下,日本的首要課題為建構不間斷且強韌的醫療、教育、公共事業等社會服務體系,維繫國內外社會的鏈結。為此,應透過加速數位化,促成創新活動,同時強化研發能量,實現以人為本的「Society5.0」之社會。 基此,創新戰略2020提出了以下四項具體對策: (1)建立足以應對疫情困境、具韌性的社會經濟體系:在公衛醫療體系,進行疫苗與醫療儀器之研發,並運用數位科技傳遞訊息;因應科研創新與產學合作受疫情影響停擺,給予及時資助,如培育年輕創業者、提供推動引導研發補助(開発研究促進助成金,通稱Gap Fund)等;推動教育、研究、物流等各領域的數位化,同時自經濟安全保障的觀點,強化供應鏈韌性。 (2)創新創造:透過官民合作,實踐智慧城市的構想;同時持續推動「STI for SDGs路線圖(STI for SDGsロードマップ)」政策;藉由實踐研究誠信(研究インテグリティ),加強與國際網路合作;另一方面,應發展post 5G與Beyond 5G等前瞻數位基礎技術,並持續建置各領域的資料流通基礎設施。 (3)強化科研與創新之研究能量:建立能充分吸引年輕人才挑戰、進行創新研發的研究環境,同時成立基金以建構世界級的研究基礎設施;以充分活用大學研發成果為目標,檢討智財制度發展的願景;結合人文社會科學領域研究,並活用射月型研發(ムーンショット型研究開発)制度,發展社會問題解決方案。 (4)重要科技發展項目:於基礎技術層次,包含AI、生化科技、量子技術、材料等,對此應優先投入研發、培育相關人才;於應用科學層次,則包含防災、防疫、資安、能源、健康醫療、航太、糧食、農漁產業等。

從廣播電視節目概念之數位質變思考我國廣電法制之規範客體

數位著作權侵權監控公司Rightscorp, Inc.之爭議

  Rightscorp, Inc.成立於2011年,總部位於美國洛杉磯,該公司與網際網路服務提供者合作(Internet Service Provider, ISP),監控以P2P方式所進行之非法下載行為,並依數位千禧年著作權法(Digital Millennium Copyright Act)之規定,代理權利人與當事人和解(下載一非法檔案的和解金額是20美元)或透過訴訟以保護權利人之智慧財產權,近年越來越多大學甚至是華納兄弟(Warner Bros.)、唱片公司BMG使用Rightscorp這樣第三方公司的服務來監控非法網路活動。   年初(2015)在喬治亞州(City of Monroe, Georgia),該公司因未得消費者同意以電話留言或者發送簡訊、email的方式威嚇消費者達成非法著作權下載之和解,被控訴違反「電話消費者保護法」(Telephone Consumer Protection Act),原告Brown和Ben Jenkin主張針對每一筆非法之通訊連絡請求損害賠償,總額估算可能會超過千元美元。   去年(2014),Rightscorp在加州聯邦法院(California federal court)面臨之集體訴訟仍在進行中,原告方指出Rightscorp並未提供非法下載之債務有效證明且濫用美國千禧年著作權法(DMCA)的通知機制,控訴該公司違反「電話消費者保護法」(TCPA)、「公平債務催收行為法案」(Fair Debt Collection Practice Act )和「濫用訴訟權利」(Abuse of Process)。   Rightscorp的商業模式,對權利人來說,確實可以有效追蹤侵權行為人,某種程度上可適當地遏止非法下載行為,但手段上也影響到當事人的權利,妥適性有待商榷。惟可預見的是,後續判決結果將可能影響類似公司在防範網路非法下載時的相關反制措施。

紐約市議員向議會提出禁止行動裝置相關業者共享客戶位置資訊的法案

  紐約市議員Justin Brannan於2019年7月23日向紐約市議會提交一項內容為禁止電信公司和手機應用程式開發商與第三方共享客戶位置資訊(location data)的法案(Int 1632-2019, Prohibition on sharing location data with third parties.)。   該法案原則上,禁止電信公司和手機應用程式開發商與第三方(例如:行銷人員)共享客戶的位置資訊,主要原因在於一般客戶並不清楚自己的位置資訊被共享給第三人,且對於第三人取得其位置資訊後的利用行為存有疑慮。又,位置資訊應屬個人隱私的一部分,故未取得客戶本人同意,即共享其位置資訊無疑是對客戶個人隱私的侵犯。如公司違反法案規定,執法機關對該公司之罰款,以「行為次數」作為計算單位,每次課予1,000美元,惟就同一名受害者,如一天內有數個違法行為,則當天罰款上限為10,000美元。同時,該法案賦予位置資訊被違法共享的當事人,得就其權利被侵害之事實,向法院提訴訟,以為救濟。   不過,該法案並非「絕對」禁止位置資訊的共享,如屬下列情形,例外可共享: 為配合執法機關執行法定職務之所需,如:法律調查等程序,而提供客戶之位置資訊。 為911緊急服務之所需提供,或為免除本人之生命或財產上之急迫危險,提供其位置資訊。 聯邦法律、州法或地方法明文要求應提供。 客戶授權電信公司或手機應用程式開發商得與第三方共享其位置資訊。   這部法案主要目的在於,保障行動裝置使用者的位置資訊,不會在當事人不知情的情形下被提供給第三方。雖然目前該法案尚在審議中,但未來如果通過,紐約市將成為禁止出售個人行動裝置位置資訊的先鋒,同時其執行結果勢必也將成為關注焦點。

TOP