美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/05/23)
引註此篇文章
你可能還會想看
何謂「美國創新戰略」?

  美國創新戰略(Strategy for American Innovation)係美國經濟委員會(National Economic Council,NEC)及白宮科技政策辦公室(Office of Science and Technology Policy,OSTP)於2009年9月所提出的重要科研指導政策,為美國近年調整科研發展之依據,曾分別於2011年2月及2015年10月配合時事增補最新內容。該政策主要在說明美國政府、國民與企業應如何共同努力進行全面性的創新,強化長期的經濟成長;在此基礎上發展對於美國產業發展具有優先重要性的技術領域。最初提出時內容包括:1.美國創新基石之投資;2.促進以市場為導向的創新;3.以及針對國家需求的優先順位催化重要的科技突破。   白宮在2011年4月進一步提出一些重要的創新促進新機制,包括改革專利制度、重視數位教育以及基礎科學教育的強化、加速發展再生能源、提振美國創業精神(entrepreneurship)等。隨著政策的逐步推行,2015年10月公布之最新版本,內容包括:1.投資創新基石;2.刺激私部門進行創新活動,並研議租稅優惠永久制度化;3.營造一個創新者國家,改善創業環境,協助更多創新者成功創業。並且在政府機關間強調創新,另著重於從私部門的根本改變其活動和行為模式,提升創新層次才能確實將創新成果在產業間創造出來。

美國網紅控訴前員工竊取其成功經營社群媒體之機密計算公式

美國J. Cathell公司於2022年12月21日以《保護營業秘密法》(Defend Trade Secrets Act of 2016)、《喬治亞州營業秘密法》(The Georgia Trade Secrets Act)控訴前員工Martin侵害其營業秘密「設計社群媒體發文及服裝策畫計算公式」。   J. Cathell公司是知名引領潮流、設計與旅遊的網紅兼部落客Jess Cathell所成立,其個別社群媒體皆有上千、萬名之追蹤者。其所經營之J. Cathell公司透過Instagram(@j.cathell)與網站(www.jcathell.com)提供前往特定目的地旅遊而設計的服裝,亦融合特定風格與特殊活動,同時提供販售連結。另有經營Facebook(J. Cathell Facebook)、Pinterest(J. Cathell Pinterest)、Like To Know It(下簡稱LTK)(J. Cathell LTK)等社群媒體。該服裝與風格設計是由Jess Cathell針對其客群研析出專屬、非公開之計算公式(營業秘密)所得出之結果。   被告Martin自2020年9月起任職於J. Cathell公司、擔任Jess Cathell的助理。Jess Cathell主張其提供Martin專屬計算公式之使用權限,並投注大量成本教導如何運用計算公式詮釋服裝策畫結果、設計社群媒體發文內容。前述資訊對J. Cathell公司皆具有獨立之實際或潛在經濟價值、他人亦可因被揭露之資訊,或使用該資訊而獲利。   Jess Cathell主張僅有自己、Martin能接觸專屬計算公式,並運用該公式產出設計社群媒體發文及服裝策畫結果。Jess Cathell為了保密,不曾以紙本記錄留存專屬計算公式相關資訊;用於追蹤銷售與其他績效指標的系統,皆以帳號、密碼保護。而Martin知悉該密碼,且於Martin任職期間多有提醒前述資訊之秘密性,Martin針對這些資訊具有保密義務。   Jess Cathell於2022年4月左右,發現WEAR TO WANDER公司(下簡稱WTW公司)成立Instagram、Pinterest、Facebook、LTK等帳號與WTW公司網站,於前述社群媒體發文的格式及概念,與J. Cathell公司於社群媒體發布的內容幾乎相同,並於同年8月發現Martin是WTW公司的創立者。Jess Cathell主張因Martin、WTW公司不當使用其營業秘密「設計社群媒體發文及服裝策畫計算公式」,在短短11個月內,WTW公司的Instagram即獲得近9萬名追蹤者,造成J. Cathell公司之財務與競爭損害,遂於同年12月向法院提出營業秘密侵害訴訟。   本案為首件社群媒體經營產業相關之營業秘密訴訟案件,後續判定將值得關注。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

美國財政部發布「非銀行金融、金融科技和創新」之金融科技創新報告

  美國財政部於今(2018)年7月31日發布一份重要報告,呼籲對金融科技領域的創新要採取更靈活,更有利的監管方法。這份報告主題為「非銀行金融、金融科技和創新」,其內容提及加密貨幣和分散式帳本技術(Distributed Ledger Technologies,DLT),並指出該些技術正由金融穩定監督委員會(Financial Stability Oversight Council)的工作組來主導進行跨部門的研究。整體來說,該報告表明美國政府大力推動新興金融技術的發展,並使現有的監管框架現代化,主張更加精簡和適當的監督,以消除發展過程中的障礙。並對於可能阻礙金融科技發展的法規,提出合理化建議,包括協調各州間加密貨幣交易的資金移轉立法。   美國財政部提及金融服務業正在開發的一系列DLT應用程式,其優勢仍有高度不確定性,因而進一步倡導使用監理沙盒,並鼓勵創建實驗室、工作組、創新辦公室,和其他讓行業參與者直接接觸監管機構的管道。監管機構和創新者之間的共生關係,是支持美國經濟和保持全球競爭力所必需的。該報告最後結論提到美國必須與新興技術並肩一起進步,要以不限制創新的方式來適當調整原有的監管策略。美國監管機構必須比過去更加靈活地履行職責,不能給創新的發展帶來不必要的阻礙。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

大倫敦政府推動城市資料市集,期尋求資料利用及隱私保護間之平衡,建立民眾對資料市集之信賴

  資料利用之層面越來越廣,且無論是基於商業或公益目的,產生越來越多難題。穿戴式裝置及物聯網的發展,亦使得資料之蒐集利用及界線等問題更顯其重要性。有鑑於此,大倫敦政府(Greater London Authority, GLA)在今(2016)年3月公布「倫敦城市資料策略」(London City Data Strategy),積極推動「城市資料市集」(City Data Market),期將倫敦打造成世界首屈一指的智慧城市。   增加大眾對資料市集之信賴並減少疑慮乃「倫敦城市資料策略」之一環,近年在英國有一系列新法上路,除新的歐盟資料保護規範(GDPR)外,英國國內有關「開放銀行」(open banking)之新規範,以及已有能源及電信公司參與之MiData initiative等,上述機制均為促使個人更容易掌握其個資被利用之狀況。   大倫敦政府亦推動「倫敦資料交易」(London Data Exchange),大眾可利用此一機制掌握其個資流向。其中有關建置新的數位符號(digital tokens of proof),使民眾未來可利用此等符號證明符合特定資格,例如在道路受檢時,毋須拿出駕照說明個人姓名、地址、出生年月日等資料,利用該等符號,便可判定符合駕駛年齡。   近期,大倫敦政府透過資料科學合作夥伴(Data Science Partnership)推動資料科學倫理架構(Framework for Data Science Ethics),著手研究民眾對資料交易新機制的反應,試圖在資料利用與法律和道德問題間尋求平衡。

TOP