美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/04/28)
引註此篇文章
你可能還會想看
魔術方塊立體商標權與競爭法之交會

  今年5月26日,歐盟高等法院做出裁決,認為魔術方塊不應擁有立體商標權的保護,結束了長達十年的魔術方塊立體商標權爭議。而本案於11月10日已結束聽證會(full hearing),多數意見仍然支持法院的觀點。   歐盟高等法院認為,魔術方塊的立體造型外觀,已成為他3D多面旋轉功能不可或缺的一部分,如果賦與其商標權保護,由於商標權可無限期展延的特性,等於永久阻止所有相同或類似造型外觀的產品上市,間接妨礙了技術上的突破與創新,形成一種相同或類似技術上的獨占地位(monopoly)。裁決更指出,其應以專利權作為申請標的,以保障發明人智慧財產權,而非以商標權變相延伸專利權的保護範圍。   在類似的案例中,雀巢的四指造型巧克力被歐盟法院(CJEU)駁回,理由之一為產品形狀為達到技術結果的必須條件(該造型提供了掰開巧克力的獨特方式),與本案有異曲同工之妙。   然而,反對見解認為,如不賦與魔術方塊立體商標,等於鼓勵仿冒者用相同或類似外觀作為商標使用,而不論該仿品外觀是否確實賦與相同之技術結果,間接限縮了立體商標權的保護效力。   我國立體商標審查基準中也有類似的規定,排除具有功能性的外觀造型註冊立體商標。然而,應該思考的毋寧是,當產品技術水準無法成功申請專利權保護時,如同時駁回該產品外觀的立體商標註冊,則該如何維護該產品的智慧財產權,又該如何防止他人抄襲與仿冒,是本案遺留下的重要問題。

英國生物資訊身分證法將納入醫療及犯罪紀錄 引發侵犯個人隱私爭議

  英國為了 減少受到恐怖威脅和犯罪攻擊,於去年底在一讀通過 英國身分證法,預計2008年實施。該法案最具爭議之處是記載資料,包含一些生物辨識 (biometrics) 資料,如指紋、容貌辨識和虹膜掃描等,這些資料將會儲存在國家身分辨識註冊資料庫中。反對身分證法案者認為,儲存這些資料已侵犯個人隱私權。保守黨議員表示,除非內閣能「確實證明」有其必要性,否則將反對身分證法案到底。   現行持有英國護照並不需要更新,但在2008年後想要申請更新或換發護照時,就必須遵守新的規定,也引發另一爭議問題~費用過高。倫敦政經學院的報告認為,每個人的新版身分證所需的技術成本,實際需要約 300英鎊;而登錄生物辨識資訊所需要的掃描器,就需要花4000英鎊;另外,所登錄的資訊判讀性會隨著時間而降低,至少得每五年重新掃描換發。

美國推動創新研究獎勵方案,鼓勵中小企業投入潔淨能源研發

  美國能源部今(2012)年5月宣布1千1百萬美元的預算,獎勵小型企業發展潔淨能源創新研究與科技。美國的小型企業並非以營運的領域來區分,而且必須合於美國聯邦法規(13 CFR 121)中對於小型企業的規範,另外,美國小型企業管理局(U.S. Small Business Administration,SBA)對於各種營利活動亦建立有大小區分的標準,依照不同的行業別,就員工人數或營業額的數目訂立區分標準。因為企業大小的區分,在美國政府採購契約發包的程序上極為重要,因為他們確保,為大小不等的小企業之間提供公平的競爭基準,而這些區分標準同時也適用在SBA的貸款/補助計畫以及能源部小型企業創新研究計畫(Small Business Innovation Research ,SBIR)與小型企業技術移轉計畫(Small Business Technology Transfer ,STTR)上。   能源部此次小型企業創新研究計畫是歐巴馬政府為扶持小型企業,增加美國就業機會政策的一部分,計畫內容在於,給予每個小型企業最高15萬美元的補助金,只要企業的業務致力於發展創新能源技術,製造新的工作機會,以提高美國在世界的經濟競爭力,這些獲選企業在未來兩年內,可以參加第二階段的競賽,並將有機會獲得高達2百萬美元的獎勵金,目前已有67個小型企業,總共75項創新研究計畫,包括風力渦輪機、燃料電池技術以及煤炭能源等的相關研究工作,這些獲選的小型企業遍佈全美各州。   美國政府認為,小型企業為其經濟體的主幹,提供全美二分之一的工作機會,並且在國內持續製造三分之二的新就業機會,重要的是,這些企業正在幫助美國減輕對進口石油的依賴,保護美國的環境,降低環境污染。而為了支持這些小型企業在國內經濟體所扮演的重要角色, 在能源部主責進行的SBIR計劃和STTR計劃中,持續支持科學卓越和技術創新,以達強化國家經濟的目標。

車聯網「V2V」簡介

  V2V(Vehicle-to-vehicle)通訊使用短程無線通訊技術(dedicated short-range radio communication, DSRC)交換周邊車輛速度與位置等相關訊息,並協助採取相對應措施,如警告駕駛前方車輛正在剎車,或於駕駛視線死角處有其他車輛正高速接近。因此,使用V2V通訊技術可有效避免車輛間相互碰撞、紓解交通壅塞之問題,對環保方面亦有所助益,然而,此技術於多數車輛間得以相互通訊時,方能最大化其效益。   V2V通訊技術可以每秒約10次之頻率,使車輛間相互廣播並接收全面之訊息,從而在一定距離範圍內360度「感知」其他車輛並與其他車輛進行「對話」。若將搭載V2V通訊技術之車輛配備適當的軟體或安全設備,車輛間即可利用接收到的有效訊息來避免潛在的事故威脅。V2V通訊技術可偵測出超過300公尺範圍之交通情況,包括因交通、地形或天氣影響而受人類駕駛忽略之危險,較傳統使用雷達系統或攝影鏡頭進行偵測之方式更為精準。   無論是機車、汽車、卡車及公車皆可使用V2V通訊技術以提升車輛安全系統的性能,車輛間之連接技術將成為協助駕駛發現潛在交通危機的輔助工具,有助於顯著減少每年因交通事故喪生之人數。

TOP