美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/12/11)
引註此篇文章
你可能還會想看
聯合國潔淨能源部長會議(CEM)宣示加強國際潔淨能源發展合作及工作任務

  隸屬於聯合國之下的潔淨能源部長會議(Clean Energy Ministerial, CEM)於2012年4月25-26日於英國倫敦舉行第三次會議,共有來自23國家的代表以及私人代表參與,針對潔淨能源的議題予以討論,探討如何加強各國政府間的合作,以推動公部門與私人對於潔淨能源發展的參與。此一會議中承諾支持由聯合國秘書長倡議的「全面永續能源(Sustainable Energy for All, SE4ALL)」所設定的2030永續能源目標,承諾改善能源效率、提升再生能源、及確保能源利用。相關內容包括: 1.提高能源效率   有16位參與CEM的政府代表亦參與「超高效的設備和器具部署計畫(Super-efficient Equipment and Appliance Deployment , SEAD)」,承諾將推動能源效率,以幫助消費者和企業獲得節能器具和設備。此一努力將能使消費者在未來二十年節省超過一兆美元,並且估計自2012年至2030年能減少110億公噸的二氧化碳排放。具體措施包括推出全球效率獎章的競賽(Global Efficiency Medal competition)、藉由公私合作來推廣高效能產品、加速照明設備在全球市場的轉型、建立全球通用的產品識別系統等。 2. 促進再生能源及其他低碳能源的發展   例如英國宣布投入六千萬英鎊的資金於碳捕獲(carbon capture)與儲能技術的發展。此外,丹麥,德國和西班牙發布了一個全球性的再生資源地圖,標示世界各地的太陽能和風能能源的潛力,並基於能源價格、財務成本及獎勵計劃,來評估不同國家對這些資源開發的成本效益。 3.確保能源的利用   例如義大利和美國宣布發展印度的照明計畫,將在2015年底提供200萬人現代照明服務。又,在非洲照明方案,已經提供250萬人民離網照明裝置(off-grid lighting devices)。這些計畫均附屬於「全球照明和能源利用合作組織(Global Lighting and Energy Access Partnership, Global LEAP)」,該組織宣布將對於缺乏現代能源選擇的消費者,推動低成本且確保品質的解決方案。 4. 更多跨領域舉措   包括有11個國家同意支持由澳洲和美國為首的聯合國能源計畫;氣候工作基金會(ClimateWorks Foundation)提供三年1百萬美元的技術諮詢報告於「潔淨能源解決方案中心(Clean Energy Solutions Center)」;美國與麻省理工學院(Massachusetts Institute of Technology, MIT)合作的潔淨能源計畫(Clean Energy program)中「教育與授權參與(Clean Energy Education & Empowerment Initiative, C3E)」的部分,由20多名專業婦女同胞擔任「潔淨能源大使(C3E Ambassadors)」,獎勵其在潔淨能源領域的成就等。

美國寬頻業者推動網路傳輸流量上限管理方案

  有鑑於網路使用人口中,不同使用者族群所消耗的傳輸量比例相差懸殊,美國寬頻業者於近來積極推動網路傳輸流量上限管理計畫,且繼Comcast與Time Warner等業者的初步嘗試後,美國最重要的網路服務提供者—AT&T,也宣布將開始進行客戶網路流量管理計畫。   這項嘗試計畫將以限制新的DSL用戶為起點,其所規定的每月下載與上傳流量上限,係依據客戶申請的寬頻方案有所不同,分別被限制在20G至150G (gigabytes)不定。超過的部分則將持續向使用者警告兩個月後,依每超過1G加收一美元的費用,向使用者收費。   至於提出此項管理方案的理由,據AT&T發言人表示,是因為網路頻寬的使用分佈過於不平均,高達46%的頻寬是5%的使用者在使用,而21%的頻寬更是只為極少數的1%用戶所使用,顯然太過集中。根據AT&T的傳輸上限規定,購買傳輸速度3M (megabits)的寬頻使用者,日後每月的傳輸量上限是60G,這大約等於是下載30部DVD畫質電影的傳輸量。   不過,也有分析師指出,現階段欲全面滿足使用者的頻寬需求,對網路服務提供者而言尚非極大的財務負擔,且管制流量上限的作法,可能對既有以「吃到飽」費率方案為基礎,所發展出來的網路應用服務模式,造成極大的衝擊,此亦也可能引發後續有關網路中立性的政策辯論。

何謂「證券型代幣發行(STO)」?

  運用區塊鏈技術發行加密貨幣(Cryptocurrency,又稱虛擬貨幣)進行募資,為當前熱門的新創募資手段之一,此種募資方式稱為首次代幣發行(Initial Coin Offering,ICO)。由於ICO過去並未受到監管,其發行也僅有發行人所撰寫的白皮書(Whitepaper)可供參考,投資人與發行人間有相當大的資訊落差,也因此導致以ICO為名的詐騙案件層出不窮。   對此各國監管機關紛紛對ICO進行分類與監管,美國證券交易委員會(SEC)即將加密貨幣區分為效用型代幣(Utility Token)與證券型代幣(Security Token),並將後者納入監管。SEC採用1946年美國聯邦最高法院在SEC v. W.J. Howey Co.案判決中所適用的標準(Howey Test),若「投資人基於對合理報酬的預期,對特定事業進行金錢的投資,且該獲利來自於他方的努力」,即屬於證券型代幣而需要受到監管。   SEC據此對涉及詐欺的ICO案件嚴格執法,並積極輔導非屬詐欺案件依法辦理註冊發行程序。證券型代幣發行(Security Token Offering,STO)即為配合SEC監管規範下,為消除過去對於ICO募資疑慮所產生的法遵解套辦法。對此我國金管會亦積極評估是否將STO的標準引進我國,惟因我國對有價證券之定義與要件,與SEC所採之Howey Test有所不同,而尚在研議當中。

世界智慧財產權組織(WIPO)發布《2021年全球創新指數報告》

  世界智慧財產權組織(WIPO)於2021年9月20日發布了第14版的《全球創新指數報告》(Global Innovation Index, GII),本報告以81項指標對全球132個經濟體的創新生態系進行評鑑,前十名分別為瑞士、瑞典、美國、英國、韓國、荷蘭、芬蘭、新加坡、丹麥、德國,亞洲表現最好的是韓國。   本報告指出,在COVID-19疫情期間,世界各國政府和企業對創新的投資並未減少,且健康相關產業、綠色相關產業、數位科技相關產業最受到矚目。   此外,今年的報告中新增了一個專章「全球創新追蹤」(global innovation tracker),其中針對科學與創新投資(science and innovation investments)這一組指標進一步的分析發現,2020年全球在科學出版數量增加了7.6%、在研發支出增加了8.5%、在創業投資增加了5.8%、在國際專利申請數量增加了3.5%。與2019年相比,國際專利申請數量以中國大陸增加16%最多,美國、韓國的申請數量也都穩定成長,但日本與多數歐洲國家的申請數量皆屬下降;而專利申請的技術領域以醫療技術、製藥技術、生物技術為主。整體而言,雖然疫情為全球經濟帶來嚴峻挑戰,但各國對於科學與創新的投資經費仍持續增加。

TOP