美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/04/25)
引註此篇文章
你可能還會想看
日本經濟產業省公布「再生能源導入促進關聯制度改革小委員會報告書」

  日本經濟產業省「促進再生能源關連制度改革小委員會(再生可能エネルギー導入促進関連制度改革小委員会)」於2016年2月5日公布了報告書,該報告書集結了自2015年9月以來,共計13次的討論整理,未來FIT制度改革方向,將以此為根基。   提出該報告的目的在於,達成最加能源構成方案(エネルギーミックス)之目標,於2030年導入22-24%之再生能源,冀望在最大限度導入再生能源,並與抑制國民負擔之間調合並存。   該報告提出五大修正制度方針,分別簡述如下: (一)針對未運行案件對應修正認證制度 (1) 進一步加強撤銷認證制度之報告徵收及聽證程序。 (2) 創設新認證制度,應確認該發電事業的實施可能性後,才得認定為FIT。 (二)促進長期安定發電的配套措施 (1) 事業者應做適當的檢查及維修、發電量定期報告,制定廢棄及回收等應遵守事項。若有違反情事,主管機關得發出改善命令或是取消認定資格。 (2) 確認並遵守所涉及之土地使用條例、公告認定資訊、提供地方政府建構計畫內容。 (三)導入成本效率 (1) 設定中長期之「收購價格」目標。 (2) 以Top Runner等方式決定具備「成本效率」之收購價格,亦即以最佳方式選擇。 (3) 賦課金減免制度為一個可持續的機制,同時透過活用賦課金以確保基金,並確認對象事業的節能方案及對國際競爭力的影響等(檢討減免率)。 (四)擴大導入開發週期長(リードタイムの長い)之電力 (1) 開發週期較長之電力,預先於數年前決定認證案件之收購價格。 (2) 進行環評期間減半(通常為3~4年)等必要規制改革。 (3) 於FIT認證前,得申請接續系統。 (4) 針對不同電力的挑戰檢討對應的支援方法 (五)擴大導入電力系統改革之優勢 (1) 基於「廣域系統整備計畫」,計畫性地推動整備廣域系統。 (2) 對應區域系統之限制,公告系統資訊以及建設費用之單價。此外,繼續活用投標邀請規則(入札募集ルール),共同負擔系統升級費用。 (3) FIT收購義務人由零售事業者轉換為輸配電事業者,並促進全國區域間電力調配(広域融通)之順暢性。收購後之電力,得經由交易市場外直接輸送予零售事業者。 (4) 整備再生能源事業者間公平之輸出控制規則(公平な出力制御ルール)。

新加坡擴大適用中小企業數位化政策以因應COVID-19疫情

  新加坡為實現「智慧國家」(Smart Nation)願景,長期致力於數位發展政策之推動。當中,在「協助產業加速數位化」方面,針對中小企業建置「中小企業數位化計畫」(SMEs Go Digital),並將其下「預先批准解決方案」(Pre-Approved Solutions)與「生產力解決方案補助金」(Productivity Solutions Grant, PSG)列為重要措施之一;甚而,於此波COVID-19疫情下,新加坡再度強化該等制度之運用,藉此加速中小企業數位發展進程。   所謂「預先批准解決方案」與「生產力解決方案補助金」,係指中小企業得透過企業科技庫(Tech Depot)網頁,了解中小企業數位化計畫下有哪些經過資通訊媒體發展管理局(Infocomm Media Development Authority, IMDA)預先批准的數位解決方案,並在取得供應商報價後,向新加坡企業發展局(Enterprise Singapore, ESG)申請「生產力解決方案補助金」之支援。於COVID-19疫情發生前,預先批准的數位解決方案包含「銷售與庫存管理」、「會計與文件管理」、「顧客關係管理」、「人力資源管理」、「網路安全」、「行動裝置門禁控制」及「車隊管理」等等13項系統,中小企業最高得享有報價70%的補助。   於COVID-19疫情發生後,除原有數位解決方案外,IMDA再預先批准下列內容,ESG亦於2020年4月1日到2020年12月31日間將所有方案的最高補助水平提升至80%,協助中小企業因應疫情並維持業務連續性: 遠距上班─線上協作工具(Online collaboration tools) 遠距上班─虛擬會議和電話工具(Virtual meeting and telephony tools) 訪客管理─佇列管理系統(Queue management system) 訪客管理─溫度檢測方案(Temperature screening solutions)   新加坡為因應COVID-19疫情,加強適用原有中小企業數位化計畫下的預先批准解決方案與生產力解決方案補助金,在既有制度上迅速地進行調整,以減緩疫情造成的產業衝擊,甚至加速中小企業數位發展之進程;另一方面,藉由COVID-19的特性,協助中小企業導入遠距上班與訪客管理等數位技術,改善過往因資金有限而未能優化營運基礎設備之難題,為中小企業開啟新的可能。

專利戰爭:柯達告蘋果與宏達電 侵犯影像專利

  伊士曼柯達(Eastman Kodak)於1月10日向美國紐約州羅徹斯特(Rochester)聯邦法院與國際貿易委員會(ITC)提起訴訟,控告蘋果、宏達電侵犯5項有關數位相機影像處理之專利,意圖以法律訴訟作為擴大專利權價值的手段。   目前擁有超過1000項影像技術專利的131歲老店柯達,試圖出售1000多項專利權及提出專利訴訟,以挽回面臨破產邊緣的危機。柯達認為蘋果侵犯4項和數位相機影像相關專利(美國專利字號7,210,161、7,742,084、7,453,605、7,936,391),其中包含使用者可直接透過網路或e-mail傳送相機內照片的技術。而宏達電除被控侵犯上述4項專利之餘,柯達亦向國際貿易委員會申訴宏達電侵犯第5項的影像預覽技術專利(美國專利字號6,292,218),之前柯達方以該專利起訴蘋果和RIM。柯達要求蘋果立即停售侵權產品,同時支付3倍損失賠償。相關人士表示,柯達一直在尋找願意買下該公司影像專利的業者,起訴科技龍頭舉動之目的在於尋求好買家。   除此之外,柯達亦宣布進行業務重組,從3個部門合併成為2個部門,雖然對外宣稱乃為節省成本開支、盼能轉虧為盈,不過在可能破產的疑慮下,柯達內部氣氛相當低迷,出售技術專利仍無進展,加上大批主管相繼離職,過去兩周有3位董事辭職,上周四CCO(Chief Communications Officer)Gerard Meuchner宣佈離職之後,開始傳言柯達募資未成,未來數周可能就會宣布破產。

Google新版桌面搜尋工具引發隱私權顧慮

  Google在2006年2月11日推出最新版的桌面搜尋工具Google Desktop 3,它的最新功能可以讓用戶同時搜尋多台電腦的資料。當啟用這項功能後,它會將電腦裡的文件和文字檔案(如Word、Excel)內容予以複製上傳到Google的伺服器上。當用戶在一台電腦搜尋資料時,也會在其他台安裝此工具的電腦自動開始搜尋。Google 表示,目前已經有很多人同時使用數台電腦,這個新功能可以讓使用者的生活更為便利。   但是倡導網路隱私權的團體Electronic Frontier基金會卻表示憂慮。由於新功能可能會讓駭客更容易盜取用戶個人資料,用戶的個人隱私將面臨更大的威脅。該基金會律師Fred von Lohmann認為,使用者應重視個人資料被放在Google伺服器上可能產生的問題,這比便利性更為重要。因為使用時若未花時間處理功能選項和設定問題,它將可能導致個人資料諸如納稅、醫藥和財物紀錄,以及其他文字檔案等資料外洩。

TOP