美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/06)
引註此篇文章
你可能還會想看
美國證券交易委員會發布指引要求公司進一步揭露加密資產之潛在影響

美國證券交易委員會(United States Securities and Exchange Commission,下稱SEC)於2022年12月8日發布「致公司有關近期加密資產市場發展之樣本函(Sample Letter to Companies Regarding Recent Developments in Crypto Asset Markets)」指引文件(下稱本指引),指導公司應針對自身業務涉及近期加密資產市場動盪事件(如虛擬貨幣交易所破產等),進行直接或間接影響之風險揭露,以符合聯邦證券法規之資訊揭露(如風險及風險暴露等)義務。SEC轄下之企業金融處(Division of Corporation Finance,以下簡稱金融處)認為公司應向投資者提供具體且量身訂製之市場動盪事件報告、揭露公司在動盪事件中之狀況以及可能對投資者造成之影響。爰此,本負有常態報告義務的公司應據此考量現有的揭露內容是否須進行更新。 金融處說明,為加強並監督公司對資訊揭露要求之遵守狀況,爰依據1933年證券法(Securities Act of 1933)及1934年證券交易法(Securities Exchange Act of 1934)內涵,要求公司亦須針對應作出聲明的實際狀況,進一步揭露相關重大訊息,且不得進行誤導。本指引所要求公司明確揭露加密資產市場發展的重大影響,包括公司對競爭對手及其他市場參與者之風險暴露;與公司流動資金及獲取融資能力相關的風險;及與加密資產市場法律程序、調查或監管影響相關的風險等。 值得注意的是,本指引並未列出公司應考量問題的詳細清單,個別公司應視自身情況評估已存在之風險,或是否可能受到潛在風險事項的影響。由於公司所揭露之文件事前通常不會經過金融處審查,因此金融處也敦促各公司應自主依循本指引進行相關文件準備。

歐盟針對單一專利制度達成協議

  歷經多年的討論與僵持後,歐盟各國領袖於2012年6月29日宣布同意建立歐盟單一專利制度,並決定將單一專利法院分別設置於巴黎、倫敦與慕尼黑三個城市。   專利法院的設置地點一直為建立歐盟單一專利制度的最後爭議點,包括英國、德國與法國一直積極爭取單一專利法院設立在他們國家,最後於6月29日終於達成妥協,將單一專利法院分成三個地點:第一審法院中央部門之主要位置將設立於法國巴黎,而法院的第一任院長也將會由法國人擔任,英國倫敦及德國慕尼黑也將分別設立部門,以因應專利訴訟案件的特殊性質,英國倫敦將負責處理跟化學藥學生命科學相關之專利案件,德國慕尼黑則負責處理跟機械工程相關之專利案件。而歐盟單一專利的核發將由歐洲專利局(European Patent Office)負責。   單一專利制度協議僅有25個歐盟國家同意,西班牙及義大利目前選擇不加入,原因是這兩個國家不滿西班牙文及義大利文都沒有被納入為單一專利制度之官方語言,只有法文、德文及英文被訂為單一專利制度之官方語言,西班牙及義大利認為這樣的安排將為位於法國德國及英國的企業帶來不公平的優勢。   此項協議現在將進入歐盟議會進行表決,預計於2014年就可以開始核發歐盟單一專利。

英國提出產品安全及電信基礎設施法案

  英國政府於2021年11月24日,提出產品安全及電信基礎設施法案(Product Security and Telecommunications Infrastructure Bill,PSTI法案),要求物聯網供應商、提供網際網路連線服務之公司或其他數位科技產品之製造商、進口商,及經銷商符合新網路安全標準,並對未遵守規範者處以巨額罰款。   PSTI法案之通過將保護消費者免受資安攻擊,並使政府得以引入更加嚴格的安全標準。該法案之內容包含,禁止數位科技產品之業者使用單一且通用之預設密碼,產品之預設密碼都必須有所不同;供應商應具備漏洞揭露政策,並應向客戶公開公司正採取何種防禦作為,處理該安全漏洞;應公開相關聯繫資訊或建立聯繫平台,使安全研究人員或其他人發現產品缺陷及錯誤時,方便與其聯繫;另外,針對不符合要求之產品或服務,政府亦將有權阻止其於英國境內銷售。   在電信基礎設施改革方面,將促進營運商與電信託管設備之土地所有權人進行更快速有效之談判,減少相關冗長的法律爭訟事件,例如,要求電信營運商透過訴訟外紛爭解決機制(Alternative Dispute Resolution,ADR)解決紛爭,無須訴諸法院。亦加快續約之談判流程,讓根據舊有協議安裝基礎設施之營運商,得以按照類似條款進行續約,英國政府希望透過這些措施使95%國土擁有4G網路覆蓋,至2027年大多數人口能使用5G網路。   PSTI法案生效後,英國政府將指定監管機構,其有權限針對違反規範之企業處以最高1000萬英鎊罰鍰,或以其在全球之營業總額的4%作為罰款。

中國大陸政府補助科技計畫之智慧財產權相關規範

  中國大陸為鼓勵科技研發與創新,陸續訂有《科學技術進步法》(最近一次修正為2007年12月29日,自2008年7月1日施行,以下簡稱科技進步法)及《促進科技成果轉化法》(原為1996年5月15日訂定,最近一次修正已於2015年10月1日起施行),並分別規範智慧財產權相關內容。   其中,關於中國大陸政府補助科技計畫產出之智慧財產權,依科技進步法第20條第1項規定,凡政府補助之科技計畫研發成果,其產出之發明專利權、電腦軟體著作權、積體電路布局權及植物品種權,除涉及國家安全、國家利益或重大社會公共利益者外,由該科技計畫項目承擔者(參照科技進步法第5條第2項規定,可能為組織或個人)依法取得。   而相關科研工作者依前述規定取得成果後,如欲進行運用或轉化,依《促進科技成果轉化法》第2條規定:「本法所稱科技成果轉化,是指為提高生產力水平而對科技成果所進行的後續試驗、開發、應用、推廣直至形成新技術、新工藝、新材料、新產品,發展新產業等活動」,需依該法相關規範辦理,如第12條可透過政府資源、融資、創投等支持科研成果轉化,且其運用方式如第19或45條具相當彈性,並可讓執行人員獲得一定的收入。

TOP