美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/29)
引註此篇文章
你可能還會想看
我國電子公文法制的最新發展

美國證券交易委員會允許Overstock公司以區塊鏈(Block Chain)技術為基礎發行公司證券

  數位金融時代已然來臨。美國金融證券市場在2015年12月發生一些重大轉變,其中之一為美國證券交易委員會(U.S. Securities and Exchange Commission,下稱SEC)允許Overstock.com公司以區塊鏈技術(Blockchain technology)為基礎透過網路發行公司證券。   區塊鏈技術為一種以分散式結構方式,記錄數據、傳輸及驗證的方法。當有資訊產生時,所有相連電腦會共同驗證該資訊之真實性。驗證該資料具真實性後會寫入區塊鏈,並產生不可竄改的紀錄。   區塊鏈技術特點如下: 一、分散式結構之設計:可達到去中心化效果,以此降低資料遭駭客攻擊或竄改之風險,提升資訊安全。 二、驗證機制:可提供所有參與者共同驗證資料真實性,打造安全可靠之共識環境。 三、P2P機制:可節省繁瑣程序並降低交易成本。   綜合上述三點,區塊鏈技術受到市場極大的關注。為提升資訊安全與降低交易成本及因應數位金融時代,金融業者嘗試將區塊鏈技術應用於股票、債券或是有價證券交易市場,期望可完善金融交易環境。   雖然區塊鏈技術潛在市場龐大,但Overstock公司也在向SEC申請允許以區塊鏈技術發行證券之文件中,指出其選擇將公司訊息儲存在任何人皆可查閱之公開區塊鏈,可能導致個人對其隱私安全的疑慮。即便有此風險,仍認為區塊鏈技術應用於發行證券,將有助完善證券市場交易環境,透過區塊鏈技術,將可紀錄所有交易,從中減少中間商控制市場的空間,並減少賣空之套利行為。   但是,將區塊鏈技術應用於數位金融或許將衍生金融法規相關問題。因為金融法規針對不同類型金融商品,有相關規範管制。若應用區塊鏈技術於相關金融商品,勢必產生相應問題。諸如:股票交易需依據證券交易條例實行,然其中並未設有電子移轉及交易相關規範,若應用區塊鏈技術進行證券交易,主管機關須思考如何規範並控管市場。因此,金融法規將勢必隨之調整以符合數位化趨勢。

韓國公共行政安全部制定《公部門AI倫理原則》草案,以提升民眾對公部門應用AI之信任

2025年11月,韓國公共行政安全部(Ministry of the Interior and Safety,下稱MOIS)於新聞稿宣布制定《公部門AI倫理原則》草案,追求公益、公平無歧視、透明、問責明確、安全性及隱私保護等六大核心價值,旨於促進創新、提升民眾對公部門應用AI之信任。 一、適用範圍 《公部門AI倫理原則》草案適用對象為公部門,包含中央、地方政府機關等,其性質為不具強制力的指引。 二、檢核表分三階段漸進式管理 《公部門AI倫理原則》草案依AI 應用的複雜程度分為三階段漸進式管理,設計最高達90個細項的檢核表(Checklist),惟目前尚未公開詳細內容: (一)第一階段:基礎導入(AI基礎應用) 針對技術引進的初步活用階段,共包含31個檢核項目,旨在建立基礎的倫理合規防線。 (二)第二階段:進階應用(AI決策支援) 適用於AI提供資料分析與建議以輔助人員進行行政決策的情境。隨著影響力提升,檢核項目擴增至74個,強化透明性與責任性的審查。 (三)第三階段:深度融合(AI自主決策) 針對AI具備高度自主決策權的高風險情境(如自主化服務或複雜判斷),執行最嚴密的倫理檢查,共達90個檢核項目。 建議公部門依檢核表自行檢查,並依結果建立「調整與回饋」的循環機制,以因應不斷變化的技術環境。 MOIS部長指出,未來將進一步蒐集學界意見以完備倫理原則,並開發一套AI倫理原則之培訓課程,確保一線能落實執行這90個檢核項目,保障人權與基本權利。 由於目前未見90個檢核項目內容,值得持續追蹤後續進展。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

歐巴馬旋風之商標影響力

  美國總統歐巴馬在選舉前後已對於產品市場,造成一股莫大的熱潮,商人們都想藉由這股熱潮來獲得利益。可以從口號「Yes We Can」、「Change」的利用及一系列歐巴馬肖像相關產品充斥於產品貨架上得以瞭解。然而,這樣的現象,美國白宮律師正著手處理保護總統的發言權及肖像權,且在不損民眾熱情之下制定規範以進行管理。   在美國總統大選期間,已有數家美國企業向美國專利商標局 (United States Patent and Trademark Office, USPTO)提出新商標申請。1月份即有73件混合歐巴馬名字為商標之申請案,其中包括填充玩具「Bearak Obama」、「ObamaLlama」、棒棒糖「Obama」、「Obama vodka」、啤酒「Obamanator」、服飾「Obamanation」、鞋子「Obamaniac」以及「Broccoli Obama」於冷凍蔬菜,冰淇淋公司Ben Jerry’s ice提出「Yes Pecan」,甚至有出版業者提出「Obamaland」之商標申請。在歐洲也是如此,Benelux Office for Intellectual Property (BOIP) 也有二件申請案,「Obama」雜誌、音樂及「Obama」花卉種籽。目前已經有些商標申請案被USPTO駁回,如「Obama vs Osama」。   Rise & Ries之董事長Al Ries表示:「現在這股歐巴馬風潮是可以理解的,但並不會持續到永遠」。然而,美國白宮律師依舊可能會針對各個情況作判斷以最好的方式保護總統的權利,並且尊重人民使用的權力,必竟歐巴馬是大多數人的驕傲。

TOP