美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2025/04/03)
引註此篇文章
你可能還會想看
美國國會議員提出「網路盾」草案

  美國民主黨議員Ed Markey於2019年10月22日提出2019年「網路盾」草案(Cyber Shield Act of 2019),將設立委員會以建立美國物聯網網路安全標準。   雖由參議員MarkWarner所提出之2019年物聯網網路安全促進法(Internet of Things Cybersecurity Improvement Act of 2019)已通過並施行,惟該法僅適用於聯邦政府機構之設備採購。而「網路盾」草案之目的則係設立委員會並建立美國物聯網設備認證標章。依據該草案第3條,於該法通過並經總統簽署後90天內,美國國務卿必須建立網路盾諮詢委員會,該委員會之任務為擬定並建立美國網路盾標章。   另依據該草案第4條,物聯網產品之自願性認證程序與認證標章,內容必須符合特定產業之網路安全與資料保護標準。該標章應為數位標章,並標示於產品之上,且可劃分數個等級,以表彰其符合產業所需求之網路安全與資料安全等級。而針對標章之內容,該法要求美國國務卿於法律通過90天內應建立諮詢相關利益團體之程序,以確保其充分符合產業需求與利益。美國國務卿與各聯邦主管機關亦須合作以持續維護網路安全與資料安全標章之運作,且確保獲得該標章之產品,其資安與資料保護品質均優於未受認證之產品。

日本經產省公布「伊藤報告3.0版」和「價值協創指南2.0版」,強調企業永續發展重要性

  日本經濟產業省於2022年8月31日公布「伊藤報告3.0版」(伊藤レポート3.0)和「為協力創造價值之綜合揭露、對話指南2.0版」(価値協創のための統合的開示・対話ガイダンス2.0,簡稱價值協創指南),強調企業永續轉型重要性。所謂永續轉型,係指社會永續發展與企業永續發展必須「同步」,及企業為此需要在經營面和產業面進行之改革。   「伊藤報告3.0版」整理企業推動永續轉型應採取之措施,包括必須根據社會永續性擘畫未來方向,並制定可實現長期價值之企業戰略、關鍵績效指標(Key Performance Indicators, KPI)、治理目標等。此外,伊藤報告也指出供應鏈全體(包含中堅、中小企業和新創企業等)和投資鏈上之參與者,都需要推動企業永續轉型。   為強化企業經營以實現永續轉型,經濟產業省同步修正「價值協創指南2.0版」,調整企業資訊揭露及對話方式,讓過程可以更有效率及建設性。指南修正重點包括:(1)全部項目都強調為實現永續社會,企業長期且持續提供價值的重要性及因應方向;(2)新設長期戰略項目;(3)確保「氣候相關財務揭露(Task Force on Climate-related Financial Disclosures, TCFD)」所提出之治理、戰略、風險管理、指標與目標之揭露架構與整合性;(4)於項目「實施戰略(中期經營戰略等)」中,強調人才戰略和人才投資重要性;(5)新設實質對話、約定項目。

虛擬的永恆與往生者個人資料運用

  逝者已矣,已不再是定律。2020年2月,韓國文化廣播公司(MBC)播放了一部紀錄片,紀錄了電視台製作團隊實現一位母親以虛擬現實VR(virtual reality)與已逝女兒重逢的過程,製作團隊透過動態捕捉技術,錄下一位兒童演員的動作,用以塑造往生者的行為動態,並重現還原往生者的聲音,製作出往生者的的三維虛擬影像。葡萄牙Henrique Jorge公司建立一個名為ETER9的社交網路,將每位用戶與AI進行配對,AI會學習複製該用戶於社交網路之行為,並可代其發表回覆與評論,即使其用戶已往生,AI仍持續運行。現今許多科技新創公司正著手研究「數位來生」,使往生者於數位中重生。   牛津網際網路研究所(Oxford Internet Institute)的一項最新研究顯示,估計約50年後,Facebook內往生者的帳號數量將超過存活者的帳號數量。而FaceBook可視為現今人類物種歷史上最大的人類行為資料庫,曾經創建過個人資料的用戶都不復存在,但他們的數位資訊卻永存於網際網路中,但在多數國家,往生者的資料並不是個人資料保護法令所含括的保護客體,往生者個人資料之運用勢必成為道德與法律上的重要課題。   英國阿斯頓大學的Harbinja教授表示,或可由遺囑中有無處置往生者個人資料之指示作為參考,但其亦表示在某些國家存在無法保證遺囑可得完全兌現的問題,例如,在英國遺囑中決定了個人資料的處理方式,仍可能僅被視為是個人意願,類似遺囑中選擇火葬的決定仍可能被執行者和繼承人推翻,且無法強制執行。   我國個人資料保護法施行細則第2條規定:「本法所稱個人,指現生存之自然人。」,所保護的個人資料對象是指「現生存有生命」的自然人,並不包括「往生者」,而歐洲部分國家允許繼承人行使被繼承人之個人資料保護相關權利,例如匈牙利規定本人可指定特定人或由直系親屬行使本人往生後之權利、西班牙則規定繼承人有權行使GDPR第15條資料查詢權、第16條更正權和第17條刪除權,而義大利則規定親屬代表可基於保護家庭之因素行使往生者於GDPR第15條至第22條之權力。ETER9便可讓用戶設置死後停止AI代替回覆的功能,也可以指定授權往生後的帳號負責人。在數位來生的議題中,我國應可參酌部分歐洲國家運用GDPR規定從而規範往生者個人資料權利之方式,進而探討我國對往生者個人資料運用之相關議題。

英國通過《電子貿易文件法》,將透過「可信賴系統」的要求強化電子貿易文件的證明效力

英國國會於2023年7月上旬通過《電子貿易文件法》(Electronic Trade Documents Act 2023, ETDA),經國王於7月20日正式批准,該法於2023年9月20日正式生效,未來英國的電子貿易文件將與紙本貿易文件具有相同效力。 一直以來,英國僅承認紙本貿易文件的法律上效力,因此英國企業在進行國際貿易的各環節上,必須處理上百頁的紙本文件,造成英國企業及其交易對象必須花費相當高的時間和金錢成本,不僅效率低且造成環境破壞,同時紙本文件也較難驗證其真實性。在數位轉型趨勢下,此類陳舊的法律早已不合時宜,因此美國、新加坡、德國等國家也正在進行類似立法,而英國是七大工業國組織(Group of Seven, G7)中第一個完成立法的國家。 該法正式施行後,可大幅降低英國企業的成本,提升國貿及融資的效率;根據英國政府估計,未來十年,該法將可為英國經濟創造11.4億英鎊的淨效益(net benefit),同時每年可減少10%以上的碳排放量,有助於落實ESG。更重要的是,相對於紙本,貿易文件的數位化,可提升安全性和透明性。 根據該法第2條第2項規定,電子貿易文件必須是由「可信賴系統」(reliable system)所產生,所謂「可信賴系統」必須具備以下特徵: 1.能清楚識別文件,與其他副本加以區分; 2.能防止文件遭到未經授權的修改; 3.確保任何時點僅有一人能對該文件行使控制權; 4.允許能夠對該文件行使控制之人,能向他人「證明」其控制權; 5.確保電子貿易文件移轉後,使前手立即喪失控制權。 此外,第2條第5項列出在判斷一個系統是否可信賴時,可考量的7點因素,其中第5點指出可考量該系統是否經獨立機構定期稽核(包含稽核頻率和範圍),以及第6點為該系統是否經監管機關進行任何可信賴性的評估。 雖然該法基於技術中立(technological neutrality),並未明定何種技術符合「可信賴系統」的要求。然而,起草該法的法律委員會(Law Commission of England and Wales, LCEW)於2022年3月的草案報告中花了相當大的篇幅說明「分散式帳本」(Distributed Ledger Technology, DLT)的技術,並認為DLT在透明性、安全性、不可竄改等面向有較好的表現,因此指出這是「目前」產生可信賴電子貿易文件的重要技術之一。英國政府表示,承認電子貿易文件的法律效力後,國際貿易各環節的參與者可以透過如DLT等技術,更有效地追踪相關紀錄,進而提高國際貿易的安全性和合規性。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

TOP