美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/05/04)
引註此篇文章
你可能還會想看
日本循環經濟夥伴強化產官合作,攜手實現循環經濟

  日本經濟團體聯合會、環境省、經濟產業省於2021年3月設立「循環經濟夥伴」(JAPAN PARTNERSHIP FOR CIRCULAR ECONOMY,J4CE),其係為實現循環經濟(CE),而有賴政府、民間企業、國際機構等相關組織,建立劃時代的產官合作平台。   J4CE已成立一年,此段期間已進行三次產官間之對話,如於2021年12月21日係針對「實現循環經濟所新增之成本為何?」、「如何解決所生之成本?」為主題,提出促進循環經濟值幾個值得注意之企業事例。   例如:「新的商業模式」中,由損害保險日本興亞公司與Second Harvest Japan公司共同合作,當食品運送過程中發生事故,該食品被判定失去市場價值時,能將其捐贈給Second Harvest Japan公司,其捐贈花費之費用或損失,將由損害興亞公司負責給付其保險金,而Second Harvest Japan公司則將捐贈之食品提供給生活困窮家庭,其作法將有助社會支援、減少食品浪費;另有Panasonic等電器公司提供「照明」服務,但非燈泡的所有權出賣,而是以繳納使用費方式,提供LED燈給企業經營者,並提供相關修繕、動產綜合保險等服務,已達到省電效果、降低能源成本等。   而在2022年2月17日第3次產官對話中主要以「循環經濟的投資者觀點與資訊公開方法」為主題,為因應氣候變遷經濟產業省設立TCFD制度已受到企業經營者的高度關注,因此也期待J4CE在循環經濟中也能有相同作用。   然截至今日最大難題還是在於當使用再生資源應如何將同質材料作為資源來運用較為棘手,J4CE目前除了對研究開發給予支援外,亦考慮增加補助金及放寬其限制等方式進行。

美國國防部5G戰略

  因應5G通訊技術快速發展與關鍵應用逐漸普及之趨勢,美國國防部於2020年5月2日由部長批准「國防部5G戰略」(Department of Defense 5G Strategy,以下簡稱5G戰略);同月發布之公開版(unclassified)5G戰略,為美國軍方第一份公開發布的5G戰略性指導文件,主要內容包含指出國防部面對5G帶來的挑戰、設定5G技術發展目標、擬定5G發展行動計畫(lines of effort)等,以確保美國在軍事與經濟上的優勢地位。   5G戰略指出,5G技術對於維持美國軍事與經濟優勢至關重要,為關鍵戰略性科技(critical strategic technology)。5G技術為產業與軍事帶來重大變革的契機,同時也帶來對資通安全的挑戰,特別是由於美國潛在的競爭對手國家,正試圖在美國的關鍵合作夥伴國家的5G市場占據主導地位,使得5G基礎建設供應鏈成為競爭對手利用有害元件、惡意軟體或非法存取等方式入侵美國與其合作夥伴的破口,最終將損害美國的國家安全與利益。   因此美國國防部將鼎力協助美國與其合作夥伴提升5G技術力、提高對5G的風險意識至國安層級、開發保護5G基礎設施與技術之措施。具體行動計畫包含:一、藉由大量的實驗場域驗證5G應用,推動技術發展;二、掌握5G資安威脅情報與威脅,評估、識別資安風險採取必要措施,並採取零信任(Zero Trust)反覆驗證之資安模式;三、積極加入5G技術相關標準訂定與規劃5G國防政策;四、吸引國際組織、國家與相關產業的合作夥伴,積極溝通協調以維持美國與合作夥伴間的共同利益,協助美國的盟友與合作夥伴識別5G風險。

美國專利商標局與以色列專利局宣布以色列專利局參與合作專利分類

  美國專利商標局(The United States Patent and Trademark Office,簡稱USPTO)與以色列專利局(The Israel Patent Office,簡稱ILPO)宣布以色列專利局將參與合作專利分類(The Cooperative Classification Patent,以下簡稱CPC)系統。以色列專利局是以色列智慧財產權審查及註冊的主管機關,主要負責智慧財產權如專利、設計、商標的審查、註冊及異議。   CPC已於2013年1月正式啟用。美國專利商標局及歐洲專利局(European Patent Office,簡稱EPO)自2010年10月共同發展一個可用於雙方不同審查程序的相容分類系統,降低工作上不必要的重複作業以強化效率。美國專利商標局局長Michelle K. Lee.表示:「合作專利分類系統了除證明美國專利商標局與以色列專利局良好的關係及合作精神外,更能夠幫助國內外申請專利的創新者與企業。」   美國專利商標局已於2016年7月提供以色列專利局CPC的相關訓練。美國專利商標局及以色列專利局預計進一步著手進行更深入的CPC相關訓練與交流事宜。以色列專利局及美國專利商標局之間的合作正持續擴展當中,並已達到以CPC為以色列專利局所收藏之專利進行分類的目標。以色列專利局局長Asa Kling表示:「隨著新系統的轉變,以色列專利局將強化審查專業及效率,並改善提供給以色列申請人的服務。」

歐盟智慧財產局運用科技強化智財保護,正式啟動產品的區塊鏈物流認證計畫(EBSI-ELSA)

歐盟智慧財產局(EUIPO)為打擊仿冒,保護歐盟消費者及智慧財產權人,於2023年5月31日宣布正式啟動產品的區塊鏈物流認證計畫(European Blockchain Services Infrastructure - European Logistics Services Authentication, 簡稱EBSI-ELSA)。 根據EUIPO與經濟合作暨發展組織(OECD)於2021年發布的研究指出,全球仿冒產品的貿易額高達4120億歐元,占全球貿易總額的2.5%;每年輸入歐盟的產品約有6%是仿冒產品,嚴重影響歐盟的經濟發展、消費者的健康及安全、智慧財產權人(歐盟品牌企業)的權益。 從2019年至今,EUIPO一直努力研擬透過區塊鏈技術保護智慧財產的具體方案。2022年底,EUIPO與4個不同產業的品牌企業(包含汽車業、電子業、醫藥業、服飾業)、物流業者、荷蘭海關進行一個合作的試驗計畫,內容為透過區塊鏈技術追蹤產品於海外製造後,運送至歐盟銷售的歷程軌跡,以達到認證產品為智慧財產權人生產的目標。該試驗計畫於2023年5月完成概念驗證(proof of concept)。 本計畫結合區塊鏈服務基礎設施(European Blockchain Services Infrastructure, EBSI)及數位分身(digital twins)的概念,於生產、運送、海關查驗、配送至消費者的各階段中,在產品上嵌入一個含有序列化代碼(serialization code)的標籤,該代碼必須經產品所屬智慧財產權人的可驗證憑證(Verifiable Credentials, VCs)認證,結合歐盟智慧財產權相關資料庫的資料,以確認產品與其數位分身的連結。 EUIPO將於2023年底前,正式建置一個開源的區塊鏈認證平台,介接執法機構的風險分析系統,以及商標資料庫(TM View)、設計資料庫(Design View)、歐盟執法入口網(IP Enforcement Portal, IPEP)、歐盟區塊鏈智慧財產註冊系統(IP Register in Blockchain),鼓勵供應鏈、物流鏈中的參與者於此平台上交換資料,以更有效率的方式達到認證產品來源真實性的目標。 EUIPO積極運用區塊鏈科技強化歐盟智慧財產的保護,本計畫除可避免消費者買到仿冒產品外,歐盟的品牌企業未來可於相關智財侵權訴訟中,提出區塊鏈紀錄作為證據,有效主張權益。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

TOP