美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw//article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/06)
引註此篇文章
你可能還會想看
PayPal 要求電子信箱服務提供業者封鎖未附有電子簽章的信件

  E-bay集團旗下的線上付款服務公司PayPal的代表律師Joseph E. Sullivan 於三月二十七日在倫敦舉辦的第五屆國際網路犯罪討論會議( International E-Crime Congress )中,提案要求電子信箱服務提供業者透過封鎖未附有電子簽章(Digital Signature)信件之方式,減少網路釣魚騙局(Phishing)的產生。該提案主要目的在透過電子信箱服務提供業者過濾垃圾郵件篩選系統( Spam Filters),以防堵看起來幾可亂真的網路釣魚郵件。雖然參與該國際網路犯罪討論會議的業者及政府機構並未對該提案達成共識,但是PayPal公司已和Google公司旗下的電子信箱服務Gmail達成協議,加強過濾垃圾郵件的篩選。   PayPal 是最常被詐騙集團利用偽裝郵件(Spoofing Emails)的受害公司之一,目前詐騙集團以偽裝公司郵件的技術進行網路釣魚,以騙取個人資料或帳號密碼來謀利。Paypal目前已使用數項電子簽章的安全技術,其中包括Yahoo!公司所研發的網域認證鑰匙(DomainKeys),該技術能有效地判斷寄件者的網域(Domain)是否為偽造及寄出信件是否來自偽造的網域。   目前網路釣魚的網站如雨後春筍般地出現,根據一份由國際業者及政府機構聯合提出之「反網路釣魚世界組織」(Anti-Phising World Group)報告指出,統計至今年一月份為止,全世界的詐騙網站已高達兩萬九千九百三十個。故PayPal特別對反制網路詐騙集團利用即可亂真的網路釣魚郵件,將上述提案於國際會議中提出討論 。

日本認可智遊網就其線上訂房服務經營策略可能違反公平競爭秩序所提出之約定改善計畫

  日本公平交易委員會(公正取引委員会,下稱日本公平會)於2022年6月2日宣布,已認可智遊網集團(Expedia,日文原文為エクスペディア)針對其網站線上旅館訂房服務經營方式可能違反公平競爭秩序的情形,所提出的約定改善計畫(確約計画)。依日本獨占禁止法第48條之2、第48條之3規定,受日本公平會通知有違反獨占禁止法疑慮的業者,於規定期限內提出約定改善計畫後,日本公平會審酌認為其計畫之落實能有效消除違法疑慮時,即得作成認可該計畫之行政處分。基此,智遊網集團後續得藉由落實該約定改善計畫,來排除上述經營方式牴觸獨占禁止法第19條禁止業者採取不公正交易方法規範的疑慮。   按獨占禁止法,其立法目的為確保與促進市場的公平與自由競爭,主要規範關於獨占、聯合與結合等行為;至於針對不公平競爭行為,則另訂「不正競爭防止法」加以規範,而與我國公平交易法合併規範獨占等與不公平競爭行為之立法架構有所不同。   根據日本公平會依獨占禁止法規定所進行調查,智遊網集團經營的線上旅館訂房預約網站Expedia,與位在日本國內的旅館設施經營經營業者所締結的契約中約定,日本旅館經營業者在Expedia網站上刊載提供的住宿費用與房間數等條件,需優於或至少等同於與該特定旅館業者在其他訂房服務通路所提供的條件。並且,智遊網集團進一步依據該約款,主動要求旅館經營業者遵守該條件,或由日本之智遊網分公司協助向旅館業者請求。日本旅館業者受此條款拘束,亦影響了與Expedia網站存在競爭關係的訂房網站經營業者之事業活動。例如,其他訂房網站經營業者自行負擔成本提供特定旅館業者之訂房優惠時,因其價格優於該旅館業者刊載於Expedia網站之條件,而被迫中止該訂房網站的優惠活動。   日本公平會於2022年2月25日將上述審查結果依獨占禁止法法第48條之2通知智遊網集團,要求其針對上述經營行為提出約定改善計畫,以恢復公平競爭秩序。而智遊網依此提出的約定改善計畫,主要內容包含: (1)停止、以及不再締結上述約款與要求業者履行約款等行為; (2)將上述決定與作為通知旅館經營業者、以及智遊網集團自家的員工; (3)定期向日本公平會報告上述改善措施的落實狀況等。

德國發布國家資料戰略─《透過資料利用取得進展》

2024年德國預計制訂或修正多部法規,以達成2023年8月公布的德國資料戰略《透過資料利用取得進展》(Fortschritt durch Datennutzung)文件中所設定的目標。該戰略由內政部、經濟與氣候行動部、數位與交通部聯合訂定,規劃德國資料政策與法規的工作進程,以期打破資料封閉的現狀、拓展資料應用的範圍。 德國資料戰略目標與重點摘要如下: 1.更多的資料: (1)公部門資料:藉由統整跨部門的資料增加資料的可近用性,並透過新訂法規提升資料近用機會,包括《交通資料法》(Mobilitätsdatengesetz)確保交通資料的品質和使用規則、《聯邦透明度法》(Bundestransparenzgesetz)作為取得政府資料的法源依據、《研究資料法》(Forschungsdatengesetz)簡化科研資料的取得,以及為增加健康資料二次利用起草的《健康資料利用法》。 (2)私部門資料:德國政府將訂定並提供資料共享之契約範本,以降低資料的交易、操作成本,並評估增修公平競爭相關法規來協助企業間的資料合作。另將新訂《員工資料保護法》(Beschäftigtendatenschutzgesetz),重整散於歐洲人權法院及德國國內與員工資料相關之規範。 2.更好的資料:德國將積極參與國際資料標準訂定與遵循,確保資料的品質、互操作性,以及標準化的資料描述。相關工作包括草擬關於業者使用cookie等數位追蹤技術如何取得使用者同意的管理規範,並將依歐盟準則評估是否訂定不法重新識別之刑責;另外預計建立文化、農業等主題資料室用以協助政府決策。 3. 資料利用和資料文化:為使資料可持續地利用與發展,政府機關方面將設置資料專責人員,並在以政府資料訓練大型語言模型技術時由新設的資料諮詢中心協助。公民數位能力方面,將於STEM 2.0教育計畫中規劃培育資料概念,促進未來社會發展出更多樣的資料應用機會。 德國資料戰略涉及政府、企業、研究單位和公民各層面,顯示資料的重要性逐漸成為德國重大的課題,亦是我國在建立資料治理時如何確保資料品質、交換義務與使用規則的參考方向。

淺談美國建築能源科技法制政策發展近況

TOP