美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=64&tp=1 (最後瀏覽日:2026/07/01)
引註此篇文章
你可能還會想看
美國眾議院通過電信基礎設施安全四大法案,以防止採用構成國家安全風險的設備

  美國眾議院(United States House of Representatives)於2021年10月20日通過安全設備法案(Secure Equipment Act)、通訊安全諮詢法案(Communications Security Advisory Act)、資通訊科技戰略法案(Information and Communication Technology Strategy Act)與國土安全部軟體供應鏈風險管理法案(DHS Software Supply Chain Risk Management Act),以提高網路之可信任度、防止採用構成國家安全風險的設備、支持小型通訊網路供應商,並促進產業供應鏈的經濟競爭力。美國總統拜登(Joseph Robinette Biden Jr.)於同年11月11日完成簽署《安全設備法》。   《安全設備法》旨在禁止聯邦通訊委員會(Federal Communications Commission, FCC)頒發設備許可予構成美國國家安全風險之公司,其目的係為防止美國的網路系統遭受中國大陸設備的監控,保護美國公民的隱私與安全。近年來,美國以國家安全與技術、隱私保護為由,逐步以政府禁令或動用政府影響力,防堵華為、中興等其認為與中國政府關係密切之中國通訊設備業者。自2019年5月15日美國白宮頒布之第13873號行政命令,至2021年10月20日美國眾議院通過電信設施基礎安全四大法案,並美國商務部於隔日即發布「禁止出售、出口駭客監視工具予曾有侵犯人權紀錄的專制政府及地緣政治之敵人」等規定,各種限制手段展現美國保護國土安全之決心。   此外,《通訊安全諮詢法案》、《資通訊科技戰略法案》與《國土安全部軟體供應鏈風險管理法案》分別就通訊網路的安全性、可靠性與操作性;資通訊技術供應鏈報告(例如:定義何謂「對美國經濟競爭力至關重要的資通訊技術」等)」;以及資通訊技術或服務合約之指導方針如何改善國家網路安全等相關事項予以規範。目前,此三大法案皆於參議院二讀後提交至委員會,後續發展應密切關注。

美國政府呼籲立法遏止資料盜取並加強學生隱私保護

  美國歐巴馬總統在美國聯邦貿易委員會(Federal Trade Commission,FTC)2015年1月12日所舉辦的會議上,呼籲聯邦政府應制定「個人資料通知與保護法」(The Personal Data Notification and Protection Act),該法要求美國企業建立通報機制,其必須在資料遭盜取之日起三十天內通報客戶,以保護美國大眾之隱私。此一要求主要係因為發生多起網路駭客與資安事件,但目前聯邦政府卻欠缺相關法制,故聯邦政府嘗試藉此改善各州法律各行其事無法完善資安保護之問題,亦減輕跨州營運之美國企業適用各州法律之負擔,將有助於產業法制環境之改善。   同時,歐巴馬總統亦提出制定「學生數位隱私法」(The Student Digital Privacy Act)之呼籲,該法將禁止企業為獲取利益經由學校取得學生資料。此外,歐巴馬總統亦提及美國企業將需要簽署一自願性協議(Voluntary Code of Conduct for Smart Grid Customer Data Privacy,VCC),使消費者能夠查詢各企業之信用評分,帶動企業自主保護數位資料之安全,並以此作為身分盜取之預警,避免造成個資外洩後損失更多權益。而本次呼籲制定的法規尚針對先前由美國眾議院提出之「網路情報分享及保護法」(Cyber Intelligence Sharing and Protection Act,CISPA),特別強化其網路使用者保護之部份規定;其中包括加強公私部門合作以及深化網路防護安全,藉此妥善處理網路犯罪、保護國土安全等相關問題。是故,本次制定法規之目的將更著眼於擴大授權,使政府目的事業主管機關以及企業之間能夠共享相關資訊之權限,以預防更多潛在性的網路攻擊與資料盜取事件。

綠色商標之挑戰—歐盟智慧財產權局發布綠色歐盟商標報告

2023年7月歐洲創新理事會和中小企業執行機構(European Innovation Council and SMEs Executive Agency , EISMEA)撰文重申綠色商標的重要性與挑戰。隨著環境議題於國際上的重要性日益增加,綠色商標(Green trademarks)成為一個新興議題。許多敏銳的品牌於意識到多數消費者在消費選擇上更注重環保要素時,即開始開發環保相關商品或服務,並透過「綠色」相關之文字、圖像(Images)或標語(Slogans)等進行「綠色商標」布局,向消費者傳達品牌在環保、永續的投入,例如:商品為有機、對地球有益的,或可促進回收利用的等資訊。根據歐盟智慧財產權局(EUIPO)於2023年2月發布最新版之綠色歐盟商標報告(Green EU trade marks–2022 update)的統計資料顯示,綠色商標占總體商標申請的比例穩定上升中,從1996年的4%提升到2021年的12%,可以看出品牌對於綠色商標愈來愈重視。 該報告將綠色產品的商標分別九大類別。其中,能源生產和節能,合計占綠色商標申請的48%以上,污染控制占18%,交通占11%。品牌企業應確保於正確商品或服務類別進行綠色商標布局。除商品或服務註冊類別外,企業於商標註冊前之綠色品牌命名階段,應避免品牌名稱不具商標法要求的識別性,導致被智慧財產局駁回或撤銷商標註冊之風險,例如:以誤導性或純粹描述性(misleading or purely descriptive)的方式使用「生態(Eco)」或「綠色(Green)」等用語(terms)。建議綠色品牌命名應確保避免單純放入該些描述環保特性的用語,而必須考量商標法要求的識別性,能夠使相關消費者能識別綠色商品或服務來源,並得與他人的商品或服務相區別。 綜上所述,隨著近年企業推出綠色品牌、商品或服務,採用環保相關文字或標語作為綠色品牌名稱的情況逐漸增加,這也為商標申請人帶來挑戰。環保意識提升的消費者,對於這些環保相關用語的理解變得更加成熟,品牌商標更容易被認定為單純描述性的用詞(可能符合中華民國商標法第29條第一項不得註冊事由),商標申請人對於品牌商標獨特性的證明上將更加困難。因此,建議品牌擁有者應在商標註冊前之品牌命名階段,更發揮創意、注重商標法「具識別性」之註冊要件,避免品牌命名僅單純向消費者描述環保特色資訊,導致無法取得註冊商標,難以彰顯綠色品牌特色之後果。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

論數位環境下個人資料保護法制之發展與難題-以「 數位足跡」之評價為核心

TOP