美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/02)
引註此篇文章
你可能還會想看
美國資訊安全分析新挑戰:巨量資料(Big Data)之應用

  在2013年的國際資訊安全會議(RSA Conference)上,資安專家紛紛表示,將Big Data技術應用於資訊安全分析的項目上,確實可以幫助企業建立更佳的情勢判斷能力,但在實際執行過程中是一大挑戰。   資安廠商如RSA和賽門鐵克公司,在會議上表示目前的策略是透過新的數據匯集、比對和分析協助企業篩選、過濾結構化和未結構化資料的威脅指標,這是傳統的特徵偵測(signature-based)安全工具無法做到的。   不像傳統的安全手段著重於阻斷攻擊,新的技術強調偵測並立即回應違犯行為,也就是提前遏止任何違犯行為,協助企業作全面性的偵測而不擔心有所遺漏。   由於越來越多的美國政府機關和民間企業遭受到針對性和持續性的攻擊,巨量資料技術的應用需求激增。企業內部都累積著大量的數據和多元的數據種類,而需要動新技術來保護這些數據資料免於惡意人士或對手的竊取或其他侵害行為。企業應該要因應實際面臨的威脅和所獲悉的威脅情報來建立安全模型,取代部署特定產品和外圍系統的防禦。   美國無論是政府機關或民間企業都被捲入了不對稱戰爭-對手是武器精良、準備充分並有嚴密組織的網路敵人。   「駭客只需要攻擊成功一次,但我們必須每次都是成功的」賽門鐵克的總裁deSouza表示。「因此與其專注的在阻擋所有威脅,更好的辦法是使用巨量資料技術偵測侵入行為並消解之」。而在會議中資安專家都肯認至少從理論上來說,以巨量資料技術強化資訊安全是很好的想法。   不過另有其他的說法,金融服務企業LSQ的首席安全及法務主管皮爾遜認為,許多人的電腦紀錄檔和所有的電子裝置都早就被侵入滲透了,這才是問題所在。他表示,目前現存的SIEM(安全性資訊及事件管理)工具可以讓企業聚集來自許多個安全設備的巨量登錄數據整合在同一系統內,但真正的問題是,SIEM工具必須要有能力分析數據並找出關聯性,如此才能偵測到駭客入侵的前兆證據和真實的入侵行為,這和彙整數據是不同的兩件事。許多企業所面臨的問題不是缺乏數據資料,而是要如何為資訊安全的目的建立關聯規則和應用方式,以有效率的方式找出有用的巨量數據並進行分析,和留下可供進行訴訟使用的證據。

加州新修正法規要求公司董事會必須包括女性

  加利福尼亞州(下簡稱加州)州長Jerry Brown於2018年9月30日簽署了一項新法案,規定在加州註冊成立的上市公司以及總部位於加州並在美國證交所上市的外國公司(如德拉瓦州公司),都必須在2019年底之前,於其董事會安排至少一位女性擔任董事,否則將面臨處罰;而此項新規定,亦使加州成為美國第一個要求上市公司將女性納入董事會的州。   此項規定並規定,在2021年年底前,若董事會的規模為6名以上,至少需有3名女性董事,若董事會的規模為5名成員,則至少需有2名女性董事,若董事會規模為4名以下董事,則至少需有1名女性董事。違反此項規定,將受到以下處罰:(1)首次違反處以10萬美元的罰款;(2)再度違反處以30萬美元的罰款,隨後再處以每次違反的罰款。   根據統計,日前在美國3000家最大的上市公司的董事會組成中,女性僅占其中18%,於2017年,更有624家上市公司的董事會中根本沒有女性。該法案表明,促進公司董事會性別平等不僅可以改善所有女性的職場機會,同時還能提高生產力,其依據是瑞士信貸(Credit Suisse)於2014年所作出的一項研究,該研究發現,擁有全男性董事會的公司,其平均股本回報率(Return on Equity, ROE)為10.1%,而擁有至少一名女性董事的公司,其平均股本回報率為12.2%。   根據彭博社(Bloomberg)於2019年的一項新分析,此項變革可為女性提供692個席次,並足以導致美國公司董事會整體性別平衡產生顯著的變化。此外,新紐澤西州(New Jersey)和馬薩諸塞州(Massachusetts)亦在考慮進行類似的立法,其他州也通過了不具拘束力的準則。根據統計,若其他州採用和加州相同立法,羅素3000(Russell 3000)中的公司需要在幾年內為女性開放3732個董事會席次,全國董事會的女性人數將增加近75%。   縱使該法案的反對者認為,這將增加企業改善種族和民族多樣性的難度,並質疑法案的適法性,然該法案的提出者仍認為,此一措施對於提升女性的代表權是必要的,相信當董事會組成多元化,女性的聲音能被聽到時,對整體勞動力的改善會是更好的。

英國發布「科學技術框架」2024最新施政進度,積極推動創新技術發展

英國科技創新部(Department for Science, Innovation & Technology, DSIT)於2024年2月9日發布「科學技術框架」(Science and Technology Framework)最新施政進度,相關重點如下: (1)此框架旨在強化國家科技競爭力,聚焦五項關鍵技術領域:人工智慧、工程生物學、未來通訊、半導體和量子技術。 (2)擬實現十項關鍵措施:辨識關鍵技術、對國內外展示英國科技實力,吸引優秀人才及投資、促進公私部門投資新興科技、發揮英國多樣化技能、技術和創業人才優勢、為新創產業提供資金補助、促進公部門採購轉型、戰略性參與國際事務提升話語權、建立數位基礎設施優化研發環境、制定創新法規與全球標準、鼓勵公共部門建立支持創新文化,改善服務等。 (3)提出五大戰略領域發展策略,並由「英國研究創新(UK Research and Innovation, UKRI)資金」鉅額資助,並吸引私部門企業、慈善單位共同投資。 (4)提出「支持創新技術監管建議」(Recommendations from the Pro-innovation Regulation of Technologies Review):由政府首席科學顧問群對跨領域前沿技術、先進製造、創意產業、生命科學、數位技術及綠色產業等領域提出監管建議。 (5)推動「退休基金改革措施」(Mansion House Reforms):於2023年7月10日提出,政府支持運用退休金投資創新企業,除可提高退休金持有人之收益外,亦增加新創資金流動性,並促其於英國設立公司及上市。

經濟合作與發展組織發布《促進AI可歸責性:在生命週期中治理與管理風險以實現可信賴的AI》

經濟合作與發展組織(Organisation for Economic Co-operation and Development, OECD)於2023年2月23日發布《促進AI可歸責性:在生命週期中治理與管理風險以實現可信賴的AI》(Advancing accountability in AI: Governing and managing risks throughout the lifecycle for trustworthy AI)。本報告整合ISO 31000:2018風險管理框架(risk-management framework)、美國國家標準暨技術研究院(National Institute of Standards and Technology, NIST)人工智慧風險管理框架(Artificial Intelligence Risk Management Framework, AI RMF)與OECD負責任商業行為之盡職調查指南(OECD Due Diligence Guidance for Responsible Business Conduct)等文件,將AI風險管理分為「界定、評估、處理、治理」四個階段: 1.界定:範圍、背景、參與者和風險準則(Define: Scope, context, actors and criteria)。AI風險會因不同使用情境及環境而有差異,第一步應先界定AI系統生命週期中每個階段涉及之範圍、參與者與利害關係人,並就各角色適用適當的風險評估準則。 2.評估:識別並量測AI風險(Assess: Identify and measure AI risks)。透過識別與分析個人、整體及社會層面的問題,評估潛在風險與發生程度,並根據各項基本價值原則及評估標準進行風險量測。 3.處理:預防、減輕或停止AI風險(Treat: Prevent, mitigate, or cease AI risks)。風險處理考慮每個潛在風險的影響,並大致分為與流程相關(Process-related)及技術(Technical)之兩大處理策略。前者要求AI參與者建立系統設計開發之相關管理程序,後者則與系統技術規格相關,處理此類風險可能需重新訓練或重新評估AI模型。 4.治理:監控、紀錄、溝通、諮詢與融入(Govern: Monitor, document, communicate, consult and embed)。透過在組織中導入培養風險管理的文化,並持續監控、審查管理流程、溝通與諮詢,以及保存相關紀錄,以進行治理。治理之重要性在於能為AI風險管理流程進行外在監督,並能夠更廣泛地在不同類型的組織中建立相應機制。

TOP