美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/01/31)
引註此篇文章
你可能還會想看
中國大陸網路安全法於6月1日正式施行

  中國大陸網路安全法於去(2016)年11月通過,於今(2017)年6月1日正式施行,該法主要係為了保障網路安全,維護網路空間主權與國家安全、社會公共利益,保護公民、法人和其他組織的合法權益,為第一個國家層級處理網路安全問題的法律,旨在確保維護網路空間的國家主權、保護使用者個資、防範網路攻擊及網路詐騙。   中國大陸網路安全法共七章79條,包括第一章總則、第二章網路安全支持與促進、第三章網路運行安全、第四章網路訊息安全、第五章監測預警與應急處置、第六章法律責任、第七章附則。其規範重點之一為關鍵資訊基礎設施正式納入網路安全保護範圍內,關鍵資訊基礎設施之定義不僅包括電力、運輸和金融等傳統關鍵行業,還包括法律規定涉及民生的其他基礎設施,表示任何關鍵資訊基礎設施相關廠商、供應商等外國公司,以及擁有大量中國大陸訊息的廠商,都有可能成為中國大陸網路安全法監管、執法調查、強制執行的主要對象。   中國大陸網路安全法亦要求關鍵資訊基礎設施相關廠商將個資與重要數據資料在地化,或是將這些數據資料傳輸至國外前,必須經過相關的監管機構進行自我安全評估或先加以批准。

日本政府決定採用共通編號制的三個方案,也會顧及消費稅的逆進性

  日本政府於6月29日召開關於賦予國民每一個人一個編號以便掌握每個人所得的「共通編號制度」的檢討會,會中決定將以利用於納稅與社會保障給付為軸心,朝引進制度推動的三種選擇方案。會中也討論到利用於減緩使低收入群負擔愈加沈重的消費稅的「逆進性」上。目前提出相關方案也有緩和參議院改選中有關增稅批評的目的。 從之後的1個月內會開始募集國民的意見後,到年底會將三種方案綜合為一案,以明年的一般國會會期中提出相關法案的方向推動。   有關共通編號制度,當然被指出會有個人資訊外洩與侵害隱私權的憂慮。菅直人首相在檢討會中提到「希望是立於國民本位制度上的來思考,也必須得到國民大眾的瞭解」。在檢討會中承認僅供稅務使用的A案、用於稅務與社會保障的B案及用於大範圍的行政領域上的C案,使用範圍各自不同的三種方案。   也出現希望所賦予的新編號能與目前正在使用中的「住民票號」能夠接軌的想法。利用編號制度正確掌握國民的所得情形,進而在增加消費稅之時,就有可能適切地對低收入群進行減稅與用現金補助。   消費稅是對包含生活必需品等大範圍的物品及服務課稅,所以愈是對將收入用於消費的比例龐大的低收入群會對增稅的負擔愈感沈重。 對減緩此一逆進性的有效制度,就是對有繳納的所得稅給予減稅,沒繳納所得稅的給予現金補助的「附給付的稅額扣減」。充分利用編號制度,將可補足反映所得所能退補的金額。

中華人民共和國發布「電子認證服務管理辦法」

 中華人民共和國於今年(2005年)2月18日頒布「電子認證服務管理辦法」,該辦法乃是繼2004年8月頒布「中華人民共和國電子簽名法」後,針對電子認證服務產業所為之規範,目的在於使主管機關(中華人民共和國資訊產業部)對於憑證機構與電子認證服務之實施得有一明確之監督管理辦法(第4條),將於今年(2005年)4月1日正式施行。該辦法對於憑證機構之核可、電子認證服務之提供、暫停與終止、憑證應記載事項、憑證機構之審查義務、主管機關之監督管理辦法,以及相關罰責均予以明定。並於該法第41條設有過渡條款,明定憑證機構必須於今年(2005年)9月30日前取得電子認證服務許可,於今年(2005年)10月1日起,未取得許可者不得繼續從事電子認證服務,是以不採自願認可制。

日本總務省展現電信產業改革決心,提出「電信創生計畫」

  日本總務省於2014年10月31日公布了「電信創生計畫(モバイル創生プラン)宣示其對電信產業改革之決心。鑒於智慧型手機已成為日本國民生活中不可或缺的一環,加上以智慧型手機為行動中心,另結合可攜式裝置、機器間通信(Machine to Machine, M2M)及智慧聯網(Internet of Things, IoT)技術之普及,電信產業將會廣泛地影響社會整體之經濟活動,因此總務省喊出了「更自由、更貼近、更快速、更便利」的政策口號。   首先在自由化的部分,總務省於本月宣布了自明年2015年5月開始,日本將全面解除「SIM卡解鎖限制」,未來電信用戶將可以自由地帶機或攜碼,移轉到通信費率更適合自己的電信業者,並同時展開「SIM卡解鎖指南」(SIMロック解除に関するガイドライン)改正案之意見募集。未來,電信業者有義務為提出需求的消費者進行解鎖,此外,若無任何理由予以回絕,將會受「電氣通信事業法」下授權之業務改善命令之約束。然而,對於消費者而言,若有尚未履行完畢之契約,亦應於繳交違約金後,才得以進行解鎖。   第二,為了使消費者能夠安心、安全地使用智慧型手機,日本政府開始積極推動虛擬行動網路(Mobile Virtual Network Operator, MVNO)之服務。所謂的MVNO係指通訊網路與服務分離之概念,業者本身無須擁有通訊網路,但須申請經營執照,並可向其他傳統電信業者(Mobile Network Operator, MNO)租用系統,經營自有品牌之行動通訊業務。因此日本政府為了盡快推行MVNO之服務,已開始與相關業者做系統整備之促進協議。   第三,為了使電信網路之傳輸更快速,除了持續推行3.5G網路外,自2016年將開始進行4G之商業化。最後在便利化之方面,鑒於未來之電信產業將會涵蓋更多樣化的服務,如自動更新導航地圖、提供居家安全服務等,因此日本政府認為,應透過法規制度之改善,給予電信業者於提供服務時,更友善之環境。除了已在近期開始促進,MVNO業者利用MNO業者之資訊管理資料庫協議外。並預計在下期國會提出之「電氣通信事業法」草案進行以下變更:(1)鬆綁對電信業者之規定,例如從促使業者跨界合作之角度,鬆綁不公平競爭之處理;(2)進一步推動電信業者(包括MNO跟MVNO等)費率之調降。   總務省預測,在整體政策同時推動之下,2016年相較2013年底,將增加約兩倍之MVNO契約(從670萬份倍增到1500萬份);而2016年,相關電信產業之規模將比現行之34.3兆日圓增至45兆日圓。

TOP