美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/05/14)
引註此篇文章
你可能還會想看
IBM釋出500項專利

  IBM送大禮給開放原始碼軟體開發商,全美專利龍頭IBM宣布,釋出500項專利供軟體開發業者使用。此舉顯示IBM的智慧財產權策略有重大改變,而高科技產業同時將面臨挑戰。   IBM有意藉此在開放原始碼軟體開發業間建立專利共享的風氣,IBM資深副總凱利(John E. Kelly)表示,此舉是跨出一大步,希望其他人能追隨IBM做法,讓共享的專利能愈來愈多。另一位副總史托凌(Jim Stallings)指出,此舉是美國史上截至目前最大宗的專利開放案,意在鼓勵其它公司釋出專利以刺激科技創新。與此同時,美國專利商標局公布了去年度專利核發紀錄,IBM以獲得3248項專利勇冠全美,並將連霸紀錄推向連續12年,IBM去年度新添專利數量硬是比第二名的松下電器多出1314項。   IBM這次釋出的五百項專利,其領域涵蓋儲存管理、模擬多重處理、影像處理、資料庫管理、網路連結和電子商務。該公司希望透過此一開放授權計畫帶動開放原始碼軟體開發業的合作風氣,這有利將問題轉化成一個交流平台,也有助改良IBM的發明。   過去,IBM曉得利用專利授權創造更大利潤,這十年來IBM靠專利賺來的錢一直是勇冠全球,即使這次開放五百項專利,仍有數以千計的專利繼續為IBM賺取大筆佣金。大量開放專利的舉動造就IBM以較寬鬆定義重新詮釋專利法的先驅地位,評論家認為,這十年來的專利法改革侷限了軟體開發者的創新自由度,不再像促成個人電腦革新和網路革命的時空背景那般自由。IBM表示,該公司仍是專利的所有人,依舊保留運用專利對抗商用軟體製造商的權利。

日本創設搭載遠距型系統自駕車基準緩和認定制度

  日本國土交通省於2017年2月修正《道路運輸車輛安全基準》第55條第1項、第56條第1項及第57條第1項規定之告示,放寬車輛安全基準規定,期望自動駕駛實驗能順利展開。惟在各種自動駕駛實驗中,遠距型自動駕駛系統是透過電信通訊技術,從遠距離外操作車輛行駛,儘管修法後已放寬安全基準規定,但其仍與現行以車內有駕駛為前提而訂定之《道路運輸車輛安全基準》相距甚遠,想一律判斷其符合安全基準有所困難。據此,為使遠距型自駕系統道路實驗能夠順利進行,國土交通省於2018年3月30日創設「搭載遠距型系統自駕車基準緩和認定制度」,明確規定遠距型自駕系統實施道路實驗所需各項手續。   「搭載遠距型系統自駕車基準緩和認定制度」規定項目包括︰申請放寬基準之對象、申請者、申請書及繳交文件、審查項目、條件及限制、基準放寬之認定、車體標示、行政處分等。

美國專利商標局針對最近可專利性客體之相關判決發布了備忘錄

  美國專利商標局下之專利審查政策處(Office of Patent Examination Policy)於2016年11月2日發布了一份備忘錄(memorandum),就近來聯邦巡迴上訴法院所做之可專利性客體(subject matters eligibility, SME)相關判決為整理並對專利審查者提出若干指引。   該備忘錄表示,美國可專利性客體審查手冊(SME guideline,下稱SME審查手冊)自今年5月修改後,聯邦巡迴上訴法院陸續做出相關判決,因此除了先就相關事項為一整理,之後亦會依據這些判決所確立之一些原則以及專利之利益相關人(patent stake holders)之回饋意見對SME審查手冊進行修改。   此備忘錄主要討論的判決為McRO案以及BASCOM案,在此兩判決中,聯邦巡迴上訴法院均認為下級審法院錯誤地依Alice規則認定專利無效。在McRO案,法院認為有關利用電腦所執行之自動人臉語音同步之動畫系統(automatic lip synchronization and facial expression animation )之方法請求項係屬有效。審查者在適用Alice規則時應依據SME手冊的2階段步驟對請求項進行整體考量,且不應忽略請求項中許多特定要件,過度簡化請求項為抽象概念。其並指出「電腦相關技術之改良」,不僅止於電腦運作或是電腦網路本身,若是一些規則(rules)(主要為一些數理關係式(mathematical relationship))可以增進改善電腦之效能者亦屬之。   備忘錄另藉著BASCOM案提醒審查者,在決定請求項是否無效時,應考慮所有的請求項之元件(elements),以判斷該請求項是否已經具備實質超越(substantial more)一般常規、通用之元件(conventional elements)之要素。同時備忘錄並提醒審查者不應依據一些法院決定不做為先例之判決(nonprecedential decisions)之意見。

CODEX增訂低量摻雜重組DNA植物成分之食品安全評估準則

  經過兩年的研議溝通,由國際食品標準委員會(Codex Alimentarius Commission,CODEX)生技衍生食品小組(Task Force on Foods Derived from Biotechnology,TFFBT)所研擬的「重組DNA植物成分低量摻雜之重組DNA植物來源食品安全評估準則之附件草案」(Draft Annex to the Guideline for the Conduct of Food Safety Assessment of Foods Derived from Recombinant-DNA Plants on Low-Level Presence of Recombinant-DNA Plant Material,LLP草案),終於日前送交CODEX大會決議通過。   關於植物來源食品內基改物質低量呈現(Low-Level Presence)的問題之所以受到國際間高度關切,其背景因素,其實是來自於全球各地域對於基因改造食品之食品安全審查進度狀態不一之情況使然。以最明顯的美國和歐盟為例,因為,對於植物來源食品而言,其所使用的植物原料,例如穀物、豆類、油菜種子等,在種植、運送至成品途中,尤其是在採收過程中,無可避免地均有可能會混雜到某些鄰近的合法基改植物原料;而目前國際現況是,許多在美國已通過食品安全評估之基改食品植物原料,在歐盟卻遲未獲得許可,而那些意外混雜了在美國為合法基改植物原料的食品,出口至尚未核准那些經混雜基改原料食品之國家時,則會因此被拒絕進口,而形成貿易上阻礙。   針對此問題,自2006年起,TFFBT特別召集成立一個工作小組,由美國出任小組主席,並與德國及泰國擔任共同主席,負責研擬LLP草案,以提供一套較簡易評估程序,專門針對這些混雜了低量的在出口國家已經合法、但在進口國家尚未通過食品安全檢驗之重組DNA植物成分食品之情形,提俱一套安全評估方法供進口國家政府參考,藉此,一方面確保這些摻雜低量重組DNA食品之安全性,另方面也不致令進口者因其產品含有低度摻雜而銷耗掉太過的貿易利益。   LLP草案對於摻雜低量重組DNA成份之進口國家而言,其較重要具實質意義的部份,係在於資料庫之建立、共享資訊之快速使用(rapid access)等機制的導入。研議期間,工作小組即表示會與相關國際組織聯繫,搭配建立適當之資訊資料庫。而負責籌設該資料庫的國際糧農組織(FAO)則表示,其除將運用其已建立的「國際食品安全及動植物健康入口網」(International Portal on Food Safety, Animal and Plant Health,IPFSAPH)外,並計劃與經濟合作發展組織(OECD)進行合作,引用「OECD生物追蹤產品資料庫」(OECD BioTrack Database)內依CODEX「重組DNA植物來源食品安全評估準則」(Guideline for the Conduct of Foods Safety Assessment of Foods Derived from Recombinant-DNA Plants (CODEX Plant Guideline),CODEX植物準則)所蒐羅之資訊,彙集各類相關資訊為一整合網站,並開放給公眾使用。

TOP