美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/10)
引註此篇文章
你可能還會想看
法國《數位服務稅法》(Digital Services Tax Act)

  法國國民議會於2019年7月11日通過《數位服務稅法》(Digital Services Tax Act),並於當月24日由總統簽署,翌日生效。《數位服務稅法》將對境外數位服務業者的數位服務營收(Digital Turnover)課徵3%稅金。所謂「數位服務業者」包含媒介服務業者(Intermediary Services)或在數位介面提供精準行銷服務(Targeted Advertising)者;而「數位服務營收」包含廣告營收、平台佣金、轉售個人資料之所得。   跨境電商影響傳統商業模式並衍生稅收課徵的難題,經濟合作暨發展組織(Organization of Economic Cooperation and Development, OECD)於2015年提出稅基侵蝕及利潤移轉方案(Base Erosion and Profit Shifting, BEPS),行動方案之一即是數位時代的稅徵議題(Tax Challenges Arising from Digitalisation),並於2019年10月9日亦向公眾徵詢數位稅之意見。而歐盟亦從2017年即開始研擬是否對於數位服務課稅,然而尚無共識。   法國率先提出《數位服務稅法》,被外界解讀為抗衡美國科技巨擘Google、Apple、Facebook、Amazon而設,取四巨擘的字首稱之GAFA稅(GAFA Tax)。對此,法國官方澄清,境外數位服務業巨頭比歐洲中小企業少付了14%稅金,對法國造成實質的負面影響。而受《數位服務稅法》影響的團體是在前一個會計年度,全球數位服務營收超過7500萬歐元或在法國數位服務營收超過250萬歐元的公司,受影響者估計超過30間,雖然也會影響Google等美國科技業巨擘,但並非針對性,亦非為對抗美國而設的專法。然而,法國《數位服務稅法》仍引起美國官方的反彈並啟動「301條款調查」(Section 301 Investigation),該調查報告指控法國的數位稅具貿易歧視之虞。美、法雙方代表於2020年1月28日就數位稅進行對話,美國承諾不會對法國進行關稅報復,法國表示對於數位稅的推行不會退讓。

綠色經濟草案(Green New Deal Resolution)簡介

一、立法背景   由於美國國家海洋暨大氣總署(National Oceanic and Atmospheric Administration,縮寫NOAA)於2018年間發布關於氣候變遷將導致經濟發展受到影響之相關報告,同時間,美國最高法院拒絕駁回2015年由21位民眾及美國Our Children’s Trust(非政府組織)對聯邦政府所提起之訴訟,主張美國政府並未循正當法律程序,即鼓勵對環境保護傷害甚鉅之石化能源開發。因此聯合國人權暨環境特別報告(UN Special Rapporteur on human rights and the environment)呼籲各國盡快針對環境變遷採取相關行動,美國國會議員Ed Markey及Alexandria Ocasio-Cortez遂基於上述情事於2019年2月7偕同提出綠色經濟草案(下稱本草案)。 二、草案簡介   所謂綠色經濟,是因應全球經濟危機、氣候變遷、石油資源枯竭而提出,其內容包括金融及租稅政策的重建以及再生能源的運用,初始概念於2007年由一位記者刊載於時代雜誌與紐約時報,後相關倡議人士遂依此成立非政府組織The Green New Deal Group,並於2008年廣泛發行相關刊物。 三、草案內容   本草案賦予政府五大義務:溫室氣體零排放、創造百萬高薪工作機會、投資基礎設施及工業、永續環境(諸如確保空氣、水質、氣候、食品之安全、韌性社區之推動)、反壓迫等,且內容上更將前開義務再行細分為14項目標計畫,並訂定10年執行期間。   上揭14項目標計畫的內容大致可分為五類,分別為:提升基礎設施以因應各種氣候變遷所造成之災害、將政府所需能源全數轉換為零碳排放、提升電力及能源效率、消除製造業與農業所造成之汙染與溫室氣體的排放,另外亦全面將大眾運輸設施改建為高速及零碳排放系統。   為達成前述14項目標,本草案一共訂定15項須政府配合之細項,方向上包括:給予社區、組織、機關、地方政府及各法人相關協助、提供適切之訓練課程及高等教育、針對新興科技之研究與開發進行投資、提高家庭所得及保障各級勞工組織工會之權利、提供全民高品質之健康照護。

諾基亞採用蘋果開放軟體

  手機大廠諾基亞( Nokia )將在下一代智慧手機的瀏覽器中,採用蘋果電腦的開放原始碼軟體。其預定在今年六月推出 Series 60 智慧手機軟體包,其中的瀏覽器將整合數個同於蘋果 Safari 網路瀏覽器的開放原始碼科技– WebCore 和 JavaScriptCore 。 Safari 是以開放原始碼 K Desk Environment 之 Konquerer 瀏覽器的 KHTML 與 KJS 為基礎。   諾基亞表示,採用開放碼軟體後,將更方便開發商修改定作其新瀏覽器,並將提供新的使用者功能。諾基亞並且表示,未來仍將與蘋果電腦合作開放原始碼軟體,並積極投入開放原始碼社群。諾基亞對開放原始碼的興趣,在瀏覽器部門特別明顯。兩年前,該公司投資 Mozilla 基金會的 Minimo 計劃,創造一種根據 Mozilla Gecko 翻譯引擎的電話瀏覽器。 Minimo 團隊準備在今夏推出針對微軟 Windows CE 作業系統的 0.1 版瀏覽器。

2016年生物支付技術將可能取代傳統支付型態

  根據美國公共電視台在2016年1月6日的新聞,指出生物支付將可能成為新興支付工具。生物支付之定義為利用生物辨識(biometric)技術驗證個人生物特徵,諸如:指紋、虹膜等進行支付。採用生物支付技術,未來將無須使用信用卡或行動裝置,僅需要個人生物特徵之辨識即可完成交易。此轉變將使未來交易更加快速、便利,但同時,生物支付的安全性卻也不無疑義。   即便生物辨識屬於高層級的資訊安全保護機制,但水能載舟,亦能覆舟。生物辨識利用生物不可變之特性進行身分識別,涉及高度個人隱私,為妥善保護個人資訊安全,需訂立生物辨識相關規範加以管制,否則將衍生許多法律問題。   例如:在2015年6月,美國線上出版商Shutterfly公司被控訴違法蒐集個人資料。原告稱其並非Shutterfly公司之註冊使用者,也從未同意其生物辨識資訊被該公司蒐集,但其面紋(Face print)卻被上傳至該公司網站,並標註姓名,儲存在自動針對相片標記臉部辨識系統之資料庫。 依據BIPA針對生物辨識定義及蒐集規範: 1.第10條: 生物辨識之態樣,包含視網膜、虹膜掃描、指紋或是手部、臉部外觀之掃描,但不包括簽名、照片、用於科學檢測之人體樣本、頭髮顏色等。 2.第15條(a): 規定公司蒐集個人生物特徵資訊應有相關規範供公眾查閱,並應提供生物辨識資訊之保管及銷毀日期及相關資訊。 3.第15條(b)(1): 蒐集生物辨識資訊應告知當事人。   Shutterfly公司提出要求法院不受理之抗辯,主張BIPA規定之臉部外觀,其文意解釋應為物理上個人親自接受掃描所得之資訊,並非原告所主張以照片辨識之臉部外觀,但法院認為Shutterfly之主張並不合理,因此同意受理此案。   觀察該案可發現,儘管生物辨識提高資訊安全之保護,但相關法規範解釋仍待實務完備。另一方面,生物特徵資訊極易被他人蒐集,因此,如何建置蒐集個人辨識資訊及完善相關措施,也是推行生物支付措施所需突破的關口。

TOP