美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=65&tp=1 (最後瀏覽日:2026/06/02)
引註此篇文章
你可能還會想看
WIPO發布《世界智慧財產權指標》,2021年全球智慧財產權申請數量仍持續增加

  世界智慧財產權組織(WIPO)於2022年11月21日發布了《2022年世界智慧財產權指標(World Intellectual Property Indicator, WIPI)》。WIPO以全球150個國家智慧財產主管機關的統計資料、產業的市場調查資料作為分析標的,針對全球專利權(含新型專利)、商標權、工業設計、植物品種權、地理標示、創意經濟(出版業)的整體發展狀況進行調查。   根據2022年的分析結果顯示,與過往經濟衰退期間的歷史經驗不同,在COVID-19疫情期間,2021年全球智慧財產權的申請數量持續增加。如:   1、「專利」的申請量增加了3.6%。   2、「商標」的申請量(含指定類別)增加了5.5%。   3、「工業設計」的申請量增加了9.2%。   4、「植物品種」的申請量增加了12%。   以商標為例,2021年全球共提交了約1390萬件商標申請,申請量從金融海嘯後(2009年)至今連續12年成長。其中,亞洲商標主管機關受理的商標申請量占全球的69.7%,較2011年時的44.7%有顯著成長;受理商標申請的前五名國家分別為:   1、中國國家知識產權局(CNIPA):約950萬件。   2、美國專利商標局(USPTO):約90萬件。   3、歐盟智慧財產局(EUIPO):約50萬件。   4、印度專利、設計及商標管理局(CGPDTM):約49萬件。   5、英國智慧財產局(UK IPO):約45萬件。   此外,指標針對「非母國申請案(Non-resident trademark applications)」的產業別進行分析,分析結果顯示2021年各國商標申請人至外國市場尋求商標保護的前十大產業分別為:   1、研究與技術:20%   2、健康醫事:13.8%   3、服裝配件:12.8%   4、休閒教育:10.5%   5、居家設備:9.7%   6、農業產品與服務:9.6%   7、商業金融:9.5%   8、運輸機械:6%   9、營建:5.2%   10、化學:2.8%   再者,指標中分析上述產業在各國商標申請案件中的占比,可作為我國企業全球布局的參考:   1、研究和技術產業:歐盟21.3%、英國20.4%、日本18.7%、美國17.7%。   2、農業產品與服務產業:中國25.2%、韓國18.4%、俄羅斯14.2%、印度15.1%、土耳其14.8%。   3、健康醫事產業:印度23.1%、日本13.9%、中國11.3%;   4、商業金融產業:巴西26.3%、土耳其23.3%。   WIPO從2009年至今每年發布《世界智慧財產權指標》給各國政府參考,期待各國政府持續建構更完善的智慧財產制度,協助個人、企業保護其創新,以促進全球經濟的發展。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

英國公布合成生物學公眾對話報告,以避免早期爭議的產生

今(2010)年5月,美國克雷格文特爾研究所宣布,成功完成首個由電腦設計之人造基因組控制,並具有自我繁殖功能的合成細胞,研究人員將其取名為辛西亞(Synthia),並發表於科學雜誌,此舉意味生物科技的發展,已經從生命複製階段步入生命創造階段。此次合成細胞的成功,引發先進國家政府方面的對經濟利益、管理及社會法制影響等方面的重視。美國總統歐巴馬便敦促生物倫理委員會對此發展進行密切觀察,評估此研究將之影響、利益和風險。 英國對於合成生物學發展的規範議題也十分關心,該國2009年開啟有關合成生物學的公眾對話(public dialogue),並於今年6月完成並公布報告。獲得的結論如下: 一、肯定合成生物學所帶來的機會: 英國民眾普遍認為合成生物學的應用將會帶來許多重要的機會,可協助解決當前社會所面臨的重大挑戰,例如氣候變遷、能源安全與重大疾病等。 二、關心合成生物學發展的不確定性: 由於合成生物學的發展充滿著不確定性,故當長期的負面影響尚未可知時,有些民眾反而因發展過於快速而覺得到沒有確定感。 三、期待國際規範形成: 英國民眾認為希望能有國際性的合成生物學規範與管理措施,尤其應針對合成生命物質在未受到管制而釋出於環境之生物安全議題,猶應有國際性的管理規範。 四、衡量科研人員動機: 英國民眾擔心,研究者好奇心的驅使,會使合成生物學發展過於快速,故應衡量其研究所帶來的廣泛影響。 五、強調科研人員之責任 負責資助的研究委員會應有清楚角色,促使科學家在此新興科技領域研究中,培養思考科學家責任之能力。 此次對話結果將會納入英國對合成生物學研究補助的法規政策,成為決定補助方式、項目與範圍的重要參考依據。這樣的作法是考量到,希望使合成生物學在健全的管理與法規下持續發展,預先減低過往生物科技發展導致民眾疑慮而致延滯發展的可能性,也更能將政府科研資助有效地投入有利於國家整體發展的領域中。

德國聯邦經濟與能源部提出《GAIA-X計畫》建立歐洲聯合雲端資料基礎建設

  2019年10月29日,德國聯邦經濟與能源部提出GAIA-X計畫(Project GAIA-X),蒐集德國聯邦政府、產業和科學界代表意見,與歐洲夥伴合作共創高性能、具競爭力、安全可信賴的歐洲聯合雲端資料基礎建設平台。GAIA-X計畫被視為歐洲開放、透明的雲端數位生態系統搖籃,用戶得以在可信任的環境中,提供整合安全的共享資料;透過雲端資料的跨國合作,為歐洲國家、企業和公民創造聯邦資訊共享環境、促進數位創新、建構全新商業模式。GAIA-X計畫將嚴格遵循資料保護、公開透明、真實性與可信賴性、數位主權(Digital Sovereignty)、自由市場與歐洲價值創造、系統模組化及互操作性(Modularity and Interoperability)、資料可用性等歐洲價值觀及原則。   GAIA-X計畫設定的目標包括:1.維護歐洲數位主權;2.減少對外國雲端供應鏈依賴;3.拓展歐洲雲端服務的國際市場;4.塑造創新數位生態系統。透過建立資料技術與數位經濟相關的基礎設施,將統一安全規格的雲端技術,落實在公共管理、衛生部門、企業和科研機構用戶與供應商間,形成開放數位資料共享的大平台。另外,GAIA-X計畫能進一步強化歐洲雲端服務供應商及歐洲商業模式的全球競爭力與規模,透過聯合雲端資料基礎建設,連接歐洲大小型企業、公部門、醫療及金融機構的伺服器,將全歐洲對於數位技術的多項投資串連在一起,積極發展AI人工智慧、智慧醫療、數位金融監管等新興產業,得以確保歐洲數位安全並提高雲端資料處理能力。

日本擬定GX基本方針草案致力實現綠色轉型

  日本岸田文雄總理於2022年7月成立「GX(グリーントランスフォーメーション,綠色轉型)實行會議」(GX実行会議),並於同年12月第5次召開「GX實行會議」,初擬《實現GX基本方針》草案,預計於國會提出相關法案,其內容主要有四個面向,本文摘述如下:   一、以能源穩定供應為前提   由於受到烏俄戰爭影響,導致能源短缺,為因應此一現況,日本將透過轉換製造業之原料及燃料,推動節能、並以再生能源作為主要電力來源。鑒於核電具有穩定輸出之特徵,將強化活用核電新措施,特別是將針對核電運轉年限部分進行修正。同時導入氫、氨之元素,用於發電、運輸、產業等領域,以提高自給率及應對可再生能源的輸出變動,有助於穩定供給。   二、成長型碳定價構想之執行   為了達成國際公約和強化日本產業競爭力,將採取以下措施:   1.為了綠色轉型,將於2023年發行規模約20兆日圓之GX經濟移行債(GX経済移行債,暫稱),作為前期GX投資之資金來源,將募集之資金優先投資於具備產業競爭力或經濟成長潛力、能削減排放量之企業為對象。   2.預計於2023年分階段試行碳排放交易,主要是由企業自行參與,根據排放量與發電效率,免費發放排放配額,再逐年減少配額。並於2028年導入賦課金制度(碳稅),針對化石燃料進口業者,先課以較低的稅,再逐漸增加。   三、拓展國際戰略   由於各國紛紛推出碳中和政策,日本有必要為世界的脫碳做出貢獻,故針對全球面向,將確立環保產品的國際評估標準方法,以及評估企業溫室氣體排放量之削减,建構相關減排制度。而針對亞洲部分,日本作為技術開發的領導者,則提供東南亞相關能源投資,活用國際協力銀行(JBIC)和日本出口和投資保險組織(NEXI)等進行公共的金融支援。 四、全體社會邁向GX   為協助化石燃料相關產業轉型成低碳產業,並確保在轉型過程中勞動力移動,將推動公正轉型,以保障國民生活,並針對中小企業一起推行GX,提供相關諮詢及排放量計算之節能診斷等措施,協助中小企業進行脫碳。

TOP