美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/11/23)
引註此篇文章
你可能還會想看
RFID應用發展與相關法制座談會紀實

歐盟生醫研究積極籌組歐盟研究基礎設施聯盟(ERIC)

  歐盟自2009年6月通過並於同年8月生效之「第723/2009號歐盟研究基礎設施聯盟法律架構規則」(COUNCIL REGULATION (EC) No 723/2009 of 25 June 2009 on the Community legal framework for a European Research Infrastructure Consortium (ERIC),簡稱第723/2009號規則),其乃希望能促進各會員國間各自分散的研究基礎設施(Research Infrastructures,簡稱RIs)之資源凝聚及共享,讓原本僅為設施設備的RIs整合起來,透過由3個以上歐盟會員國作為某特定ERIC成員之方式,依第723/2009號規則向歐盟執委會提出ERIC設立申請,經執委會同意後,ERIC即可取得獨立法律地位及法律人格,以自己名義獲得、享有或放棄動產、不動產及智慧財產,以及締結契約及作為訴訟當事人,並得豁免無須被課徵加值稅(value added tax)和貨物稅(excise duty)等稅賦。歐盟創設ERIC法律架構之目的,是希望能透過國際合作、彙集國際資源,在歐盟建立起頂尖研發環境,吸引跨國研發活動集中與進駐,利用規模化的大型研究基礎設施導引出世界級研發。   截至目前,由奧地利、比利時、捷克、德國、荷蘭等國作為成員及瑞士作為觀察員所建立之「歐盟健康、老化及退休調查」(The Survey of Health, Ageing and Retirement in Europe,簡稱SHARE),乃是歐盟首次提出申請且正式設立之ERIC。SHARE-ERIC乃一大型的人口老化多國研究資料庫,並已收錄45,000筆以上年齡50歲以上個人之健康、社經地位及社會家庭網絡之跨領域及跨國籍資料,SHARE-ERIC之資料分析除將有助歐盟國家就老化社會之福利系統為規劃,更預期將成為推動其活動及健康老化歐盟創新伙伴試行計畫之重要基石。   除此之外,自2008年起由歐盟撥款500萬歐元籌備成立之「生物銀行及生物分子資源研究基礎機構」(Biobanking and Biomolecular Resources Research Infrastructure,簡稱BBMRI),從2008年至今(2011)年1月底3年籌備期間,已募得30個以上國家之53個會員聯盟以及280個聯繫組織(大部分為生物銀行),預計將建立成為最大的泛歐生物銀行,病患及歐盟人口之樣本與資料之介面,以及頂尖生醫研究之介面,且為了要BBMRI-ERIC,BBMRI指導委員會業已擬定「BBMRI-ERIC備忘錄」提供予有興趣之會員國家簽署,希望能在今年底前成立BBMRI-ERIC。

FCC通過命令以促進飛機上網路服務

  為促進電信市場競爭與服務之普及,在2012年12月28日美國公佈FCC12-161命令,而透過該項命令,預計未來不論機組人員、亦或是旅客於商業客機、自用客機內,使用網路服務的比例將會提升。FCC認為此舉不僅可滿足消費者對無所不在(Ubiquitous)網路的需求外,亦可促後使經濟成長與創造就業機會。   其實,早於2001年,美國政府就透過同步軌道的方式(Geostationary-Orbit)開放網路服務,但在設置上必須設置多個地球站(earth station),而FCC所命名的Earth Stations Aboard Aircraft(ESAA),則延續過去設置於車輛、船舶之技術,在飛機外部安裝接收器,以和衛星固定業務(fixed satellite service)作為骨幹,使乘客手機透過例如Wifi技術取得網路服務;至於,在頻段的使用上,相較過去以非有害干擾為前提,ESAA則有明確之規定:下傳(downlink)頻率之選擇是依循車輛、船舶執行相同服務的規定、並考量將經過不同國域與領海,故選擇該10.95-11.2 GHz、11.45-11.7 GHz與11.7-12.2 GHz,以符合美國、國際頻譜配置;上傳(uplink)的頻率則是基於不受雙向干擾之情況下,選擇14.0-14.5 GHz頻段。   現階段,FCC為積極促進該業務發展,不僅允許航空公司與寬頻業者皆可提供服務外,亦建立一套管制架構,以保護飛航網路不受干擾、確保地面無線電服務能正常運作,並且,為減少行政資源與促進服務普及,FCC簡化業者申請流程,最多僅需原來時間的一半。雖然, FCC針對技術、執照的發放有詳細的規範,但尚未對旅客使用VOIP服務(Eg:Line、Skype)做任何規範,而這是FCC未來推廣該服務之隱憂。儘管如此,該服務推展確實可便利遊走各國間之旅客,但對於想在飛機上享受片刻寧靜的人而言,能普及使用Wifi可真是喜憂參半的消息。

日本政府公布「日本再興戰略2016 (草案) 」,並以實現第四次工業革命為主軸

  日本首相官邸之「日本經濟再生本部」於2016年5月19日召開第27次「產業競爭力會議」,並於該會議上提出「日本再興戰略2016(草案)」進行討論。再興戰略以實現「第四次工業革命」為主軸,透過活用IoT、巨量資料、人工智慧(AI)、機器人等技術,目標在2020年創造出30兆日圓的市場附加價值。為了推動相關政策,今年夏天將會成立具備統整指揮機能之「第四次工業革命官民會議」,該會議下並設置「人工智慧技術戰略會議」、「第四次工業革命 人才育成推動會議(暫定名稱)」,以及「機器人革命實現會議」。   「日本再興戰略2016(草案)」,特別對於製造業相關之議題提出討論。再興戰略指出,日本相較他國,雖然在網路空間的「虛擬資料(バーチャルデータ)」平台方面發展較晚,然而在健康資料、交通資料、工廠設備運轉等「即時資料(リアルデータ)」領域有潛在的優勢,因此為了讓日本的企業超越目前的框架,將以建構取得「即時資料」之平台為目標。綜整「日本再興戰略2016(草案)」具體重要政策方面如述,包括: (1)日本政府認為,第四次工業革命普及的關鍵,在於根據中小企業的現場需求,導入IT及機器人等技術,因此將請機器人專家支援,在兩年內將技術導入1萬家以上的企業。 (2)人工智慧的研發係屬第四次工業革命的基礎技術,因此要建構提供AI軟體模組工具,以及推動標準化的完善環境,並於今年內提出研發及產業化的具體施政內容,並留意開發人工智慧的透明性、控制可能性等原則及國際動向。 (3)關於產業活用區塊鏈技術(Block chain)、整備制度促進資料流通等議題,預計於今年秋天提出對應方針。 (4)於「機器人革命倡議協議會」檢討製造業之商業模式改革、與德國共同提案國際標準化及先進案例。 (5)於2020年以前,運用傳感器蒐集資料,創造50件以上,工廠和總公司間,企業和企業間等超越組織框架的先進案例,並提出國際標準。 (6)進行智慧工廠實證,建構具備AI技術的自動化模組以及智慧的產業保全。此外,為超越既有企業間的框架,將於機器設備進行資料共有及活用的實證,並根據實證結果修正相關制度。 (7)整備促進資料利用的環境,特別著重能夠蒐集、分析的資料平台,形成健全的資料流通市場。因此,為釐清彼此的權利義務關係,今年內個人資料保護委員會將提出相關交易指針。 (8)強化智財紛爭處理系統,將徵詢產業界的意見,於今年提出法制改革的結論。 (9)強化中小企業的智財戰略以及必要審查體制,協助其申請及活用專利權,預計明年度開始擴大支援業務,負責機關為獨立行政法人工業所有權資料‧研修館(INPIT)。

TOP