美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/01/07)
引註此篇文章
你可能還會想看
主權專利基金近期發展-由法、韓、日三國說起

  主權專利基金(Sovereign Patent Fund,以下稱SPF)是一個由國家政府設立的投資型基金(含民間/企業資金投入),目的在於取得專利資產,進行全球專利布局,以提升國家經濟利益。目前,全球3大具領導地位的SPF實體為:法國France Brevets (以下稱FB)、韓國Intellectual Discovery (以下稱ID),及日本IP Bridge (以下稱IPB)。   今年5月,加拿大Digital Entrepreneurship & Economic Performance Centre針對FB、ID,及IPB的發展發佈了一份報告,「Mobilizing National Innovation Assets: Understanding the Role of Sovereign Patent Funds」,分析了3家SPF所擁有的專利資產以及專利佈局趨勢,主要有以下重點: 一、 3家SPF之專利資產多為美國專利,分別佔IPB 92%、ID 82%、FB 48%。 二、 FB的專利讓與案件數量最少,顯示法國傾向以授權方式營運。 三、 IPB在專利組合上最大貢獻者為Panasonic及其關係企業,83%專利組合是來自Panasonic;FB最大貢獻者是Nemoptic;ID是Electronics & Telecommunications Research Institute 。 四、 從科技發展的角度觀察,3家SPF的專利布局重心在國際專利分類(Intellectual Patent Classification,IPC)中的電學(electricity)和物理(physics);FB、IPB著重電器通信技術(electric communication techniques),ID著重基本電器元件(basic electric elements)。   整體而言,3家SPF從以往專注於取得專利資產、吸引投資,到近期開始利用侵權訴訟與授權獲得經濟回饋,SPF模式已越受全球關注。除了加拿大政府的智庫DEEP建議其政府應設置SPF以拓展智慧財產權政策外,印度也將SPF納為智財政策討論重點,韓國也將再設立一個由國內開發銀行全力資助的SPF。   根據上述SPFs的觀察,對於我國而言,無論是創智智權管理顧問公司,或其他型態之智財投資基金,都必須先選定專利布局的核心對象,才能有效取得、收購國內、外相關專利資產,以全球性的智財戰略帶動國家發展。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

英國實行個人健康和社會照護資訊連結服務(care.data)

  隨著英國國家健康服務(National Health Service, NHS)的改革,英國於去(2012)年3月27日通過衛生和社會照護法(The Health and Social Care Act 2012)。當中一項主要的變革即是成立衛生與社會照護資訊中心(The Health and Social Care Information Centre, HSCIC)作為醫療健康資料的專責機構。而這樣的變革,也影響過去病歷資料的蒐集、分享和分析方式。依據衛生和社會照護法的規定,HSCIC若受到衛生部長(Secretary of State for Health)指示、或來自照護品質委員會(Care Quality Commission, CQC)、英國國家健康與臨床卓越研究院(National Institute for Health and Clinical Excellence, NICE)、醫院監管機構Monitor的命令要求時,在這類特定情況之下,可以無需尋求病患同意,而從家庭醫師(GP Practice)處獲得病患的個人機密資料(Personal Confidential Data, PCD)。   今(2013)年3月獲NHS授權, 由HSCIC於6月開始執行的care.data服務,即是依據前述立法所擬定之方案。care.data藉由定期蒐集醫療照護過程中的相關資料,對病患於國內所為的各項健康和社會照護資訊(例如病患的住院、門診、意外事故和緊急救護記錄)進行具延續性之連結。以提供即時、正確的NHS治療和照護資訊給民眾、門診醫師和相關部門之官員,進而達到care.data所設定的六項目標,支援病患進行治療的選擇、加強顧客服務、促進資訊透明性、優化成果產出、增加問責性,並驅動經濟成長。   然而,由於care.data是以英國民眾就醫行為中,屬於基礎醫療的家庭醫師(General Practitioner, GP)系統為基礎,所提取的資料包括家族歷史、接種疫苗、醫師診斷、轉診記錄、生理指標,以及所有NHS處方。其次,care.data在進行初級和次級資料連結時,將會透過NHS號碼、生日、性別和郵遞區號,這四項可識別資料的比對。因此雖然care.data在涉及敏感性資料時會加以排除,但此項服務仍引起社會上相當大的爭議。包括部分醫師、隱私專家和的社會團體皆提出質疑,質疑care.data是否有充分告知病人、HSCIC所宣稱的匿名性是否足夠、此項服務對醫病關係的衝擊、該服務所宣稱的資料分享退出機制(opt-out)並未妥善等。   care.data是NHS所推出的創新資料現代化服務,但同時也涉及病患隱私權保護之議題。反觀我國近來所推動的醫療健康資訊加值再利用政策,英國的案例值得我們持續觀察其發展。

歐盟啟動2030年提升建築能源效率合作創新研究

  為有效達成「歐洲2020策略」以及「歐洲2050減碳」等政策目標,由歐盟所補助設立的歐洲建築科技平台(European Construction Technology Platform, ECTP) 其下能源效率建築協會(Energy Efficient Buildings Association, E2BA),於今年度 (2012) 7月份正式對外發布首份創新研究報告「前瞻建築能源效率之研究–創新及公私部門合作」(Energy-efficient Buildings PPP beyond 2013)。該研究報告開宗明義指出,將規劃於2030年透過創新模式,及公私部門合作之落實,建立一個創新高科技能源效率產業,達到建築物碳中和(Carbon Neutral)、提昇產業技術、創造新工作機會以及落實智慧城市計畫等目標。   本研究報告係從「市場」(Market)的角度出發,嘗試提出具可行性之商業模型(Business model),供決策者參考。有鑒於建築產業在能源消耗及碳排放量占有很大的比例,該報告即指出對於既有建築物翻新與整修之急迫性,也認為應該透過政府部門介入,推動相關措施,並導引民間持續落實。其次,於產業評估效益方面,該報告明確指出,透過提昇建築能源效率,將創造許多新的就業機會,帶動地方經濟發展。綜上,歸納二點供參考,第一,為達成長期能源效率提升之目標,公部門將寄出管制手段並設置公共基金(Public funding),以防止產業市場失靈,有其必要性;第二,產業等實務運用契約型態將歷經質變,長期性的節能績效保證契約(Long-term energy performance guaranteed contract)將被越來越常被引用。   適逢歐洲議會通過能源效率指令(Energy Efficiency Directive),指令中第四條係針對公有建築物翻新之規範條款,對此歐盟會員國已陸續檢討各自國內推動現況,但目前各國仍面對許多問題及挑戰,例如既有建築物翻新整修,一直無法有效提昇件數,以及投入資金過於龐大等等因素,除非政府展現積極介入的決心,支持及並投入資金協助推動,否則成效仍可能維持停滯不前的困,相關趨勢發展值得後續觀察。

美國財政部制裁向俄羅斯運送伊朗製無人機之空運業者及製造商

  美國財政部外國資產管制辦公室(Office of Foreign Assets Control,簡稱OFAC)根據《防止大規模殺傷性武器擴散與恐怖主義》(Preventing Weapons of Mass Destruction Proliferation and Terrorism, 50 U.S. Code Ch. 43)聯邦法律之授權、第13382號總統行政命令(Executive Order,下稱行政命令)以及第14024號行政命令,於2022年9月8日將向俄羅斯運送伊朗製無人機(Unmanned Aerial Vehicles,簡稱UAVs)之空運業者納入制裁清單;另將3家公司與1位參與無人機及其零組件研究、開發、生產與採購之個人納入制裁清單,避免非來自伊朗及俄羅斯之實體支持伊朗製無人機之研發,或向俄羅斯出售任何用於對付烏克蘭的軍事裝備。   此次列於清單中之空運業者Safiran Airport Services,總部位於伊朗德黑蘭,其將伊朗製無人機、人員和相關設備從伊朗運送到俄羅斯。根據情報顯示,俄羅斯軍隊打算將伊朗製無人機與俄羅斯無人機運用在對烏克蘭的戰爭中,故OFAC依據第14024號行政命令,將該空運業者納入制裁清單。另針對無人機製造商,以Paravar Pars為例,其參與伊朗Shahed-171無人機研發和生產,故OFAC依據第13382號行政命令,將其列入制裁清單。   上述空運業者及製造商在遭受制裁後,可能會受到的影響包括: (1)在美國或由美國籍公民或企業所有或控制的所有財產和財產利益皆被凍結;禁止與美國籍公民或企業交易;或禁止與在美國境內被制裁對象的任何財產或利益交易(如金流過境美國的交易);與前述列為清單對象進行交易之人,亦可能會被列為清單對象。 (2)任何外國金融機構故意與前述列為清單制裁對象,促成重大交易或提供重要金融服務,都可能受美國相應的制裁或對「支付過渡帳戶」(payable-through account)的制裁。而此「制裁」不限於凍結帳戶,參考OFAC官網中的第36則FAQ之說明(https://home.treasury.gov/policy-issues/financial-sanctions/faqs/topic/1601),某些案例中之交易應該被禁止,但該交易沒有可凍結的利益時(如該帳戶已為制裁清單所列對象或已被凍結的個人或政府),OFAC會以「要求美國金融機構拒絕非制裁以外的第三國企業間的交易」或以「透過禁令使美國金融機構拒絕處理該交易且退回款項予匯款人,除非有得到事前個別授權」等方式處理。

TOP