美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/06/14)
引註此篇文章
你可能還會想看
美國著作權局發布「具AI產出之著作註冊指引」,關鍵在人類智慧貢獻程度

美國著作權局(US Copyright Office,USCO)於2023年3月16日頒布「具AI產出之著作註冊指引」(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence),本指引之發布係由於近年美國著作權局時常收到人工智慧著作之註冊申請案,對於此類著作是否可以成功註冊,過去未有較明確之判斷準則,如此恐造成美國著作權體制之紊亂,著作權局遂發布本指引,以作為民眾申請註冊之著作包含利用AI創作內容時之指導依據。 本指引首先認定「著作人」之概念須為人類,此部分與美國憲法、美國著作權法及美國最高法院判例見解相同。 接著,本指引並描述到欲申請之著作,除前開之著作人須為人類外,人類須於該著作中傳達其原始精神理念(own original mental conception),不得為單純之透過機械運作所產生。惟此並非代表人類完全不得運用AI輔助創作,係取決於人類對該創作之創造性控制程度及該創作實際形成(Actually Formed)作者之傳統元素含量。 最後,本指引提出申請人於提出具AI產出著作時應提交之表格為標準表格(Standard Application),在創作者欄位中具體闡述人類作為作者之具體貢獻身份,且不能將AI列為作者或共同作者。至於在本指引發布前已提出之申請案,該指引提到申請人可以透過補充說明之方式,通知著作權局其著作中涉及AI產出部分,並就該部分聲明不專用,以符合新指引所要求之「揭露」。 綜觀以言,可以認定本指引之提出可作為著作人申請註冊時之遵循依據,初步解決過去未有AI著作申請註冊參考依據之弊病,然尚有許多細節待補充,且甚仰賴個案之判斷,惟本文認為未來隨AI科技之發展及廣泛利用,關「人類智慧」於著作貢獻程度更明確、更為具體之判斷標準勢必將應運而生,值得持續關注。

歐盟提出雲端服務層級標準化指導原則

  2014年6月26日歐盟執委會提出電信網路層級服務協議標準化指導原則(Cloud Service Level Agreement Standardisation Guidelines)。網路服務提供業者通常會與消費者簽訂契約,內容約定有服務之等級,稱之為電信服務層級契約(SLAs),在雲端運算服務中,通常橫跨不同的管轄領域,適用的法律要件亦產生變化,而在雲端部分所儲存的個人資料保護部分尤其重要。不同的雲端服務與模式所需要的協議約定亦不同,這些都增加訂定的複雜性。   指導原則之提出將幫助專業的雲端服務業者在契約訂定時應該注意的內容,其中主要相關項目包括: 1.雲端服務的可利用性與真實性 2.從雲端服務提供業者中可取得服務的品質 3.安全層級 4.在雲端中如何妥善管理資料   指導原則首先明定原則,以做為雲端運算服務契約之參考。並同時針對不同的名詞定義解是,亦針對不同的契約與法律議題說明,包括業者在依據所訂定的契約中處理個人資料時,應符合歐盟資料保護之規範。   在指導原則提出之後,執委會將與雲端使用者,特別是一些小型企業進行檢視,後續並朝向通過國際ISO之認證。

從「數位休閒娛樂產業」之法制需求談我國娛樂業法制規範之可能性

英國設立綠色財政委員會,檢討未來稅制綠化的方向

  英國為了達到稅制綠化的目標,特別在2007年底設置了一個集合產官學背景人員及消費者與環保組織代表組成的稅制檢討委員會-綠色財政委員會(Green Fiscal Commission, GFC)。GFC定位為獨立的組織,其任務是在未來的一年半期間,針對英國如要導入綠色稅與環境稅的稅制變革(green taxes and environmental tax reform, ETR),檢視完成其所涉及的相關議題,特別是導入困難之處何在,以期將過往對財貨“good“(例如勞動活動所產生的所得或收入)課稅的精神,規劃轉向為對環境有害的結果“bad“(如環境損害)予以課稅,GFC預計在2009年4月提出正式的報告,而報告探討的重點將會集中在以下三大部分:   - 有關環境稅如何執行與操作之資訊與證據   - 有關社會大眾與利害關係人對於環境稅所持態度之資訊與證據   - 針對研究報告內容對外進行適當的溝通   英國欲進行綠色稅制改革,主要是基於歲收中和(revenue neutral)的考量,意指對財貨的租稅減免(tax cuts on ‘goods’)短缺,應透過對有害活動課稅所增加的稅收,予以平衡。英國政府希望可以藉由GFC的研究成果,成果進行綠色稅制改革,讓英國的稅收來源在2020年可以達到至少有20%是源自於綠色稅。

TOP