美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/12/14)
引註此篇文章
你可能還會想看
美國航空公司控告Google銷售不當的關鍵字廣告

  美國航空公司(American Airlines, 以下簡稱AA),世界最大的航空公司,控告Google私自銷售包含AA的名稱或註冊商標之搜尋關鍵字 AA日前向德州北區地方法院提出訴訟,控告Google將關於AA的名稱或註冊商標的搜尋關鍵字,如「American Airlines」或「AA.com」,銷售給其它公司作為廣告用途。   AA表示,Google甚至將該等搜尋關鍵字銷售給AA的競爭者。換言之,當使用者於Google搜尋引擎查詢關於前述之AA名稱或註冊商標之關鍵字時,Google除了提供相關連結之外,也可能會在「贊助者連結」中提供AA競爭者的連結,而引導使用者前往其競爭者的網頁。   AA於聲明中指出:「我們希望能減輕此類行為所造成的損害」。截至目前為止,AA並未透露求償金額等細節。   Google則在其聲明中指出:「我們相信本公司的商標政策已經在商標所有人的權益以及消費者的選擇之間取得適當的平衡,並且我們的立場在相關案例的判決中已經被證實是合法的」。

德國法院判決,網站上“連絡我們(Contact-Formula)”非屬德國電信服務法第5條規定之電子聯繫資訊

  德國Essen地方法院判決(Az. 44 O 79/07),網站上之聯絡我們的功能(Contact-Formula),並不符合網路服務者依德國電信服務法第5條(Telemediengesetz, TMG)所應遵守之資訊揭露義務*。   根據德國電信服務法第5條第1項第2款規定,網路服務提供者之資訊揭露義務範圍,包括應提供一個供網路使用者可以快速且直接聯繫網路服務提供者之電子聯繫方式,例如提供電子郵件。   按德國電信服務法第5條規定目的在提供消費者法定之保護,而違反本條規定者,將可依德國「不正競爭防止法,UWG」第4條第11款及第2條第1項第2款規定,視為違反公平競爭之行為。   該法院認為,網站上「連絡我們功能(Contact-Formula)」性質上僅屬於一個用以製造連結的科技措施,使用者需填寫網站上表格,按下傳送鍵後,始能得知網路服務者之電子郵件,而有些網站甚至無法顯示網路服務者之電子郵件。   我國於「電子商務消費者保護綱領」第5點企業經營者應提供有利於消費者選擇及進行交易之充分資訊包括「企業經營者本身資訊」,例如登記名稱、負責人姓名及公司簡介、公司或商號所在地及營業處所所在地、電子郵件、電話、傳真等聯絡方式及聯絡人等資訊,資訊提供範圍與德國電信服務法第5條第1項第2款大抵相同。 *德國電信服務法(TMG)第5條網路服務者應揭露之資訊範圍包括其聯繫資料、特許職業執照證號、營利事業登記證號等。

WIPO馬拉喀什條約

  《馬拉喀什條約》全名為《關於為盲人、視力障礙者或其他印刷品閱讀障礙者獲得已出版作品提供便利的馬拉喀什條約》(Marrakesh Treaty to Facilitate Access to Published Works for Persons Who Are Blind, Visually Impaired or Otherwise Print Disabled),2013年由世界智慧財產權組織(WIPO)通過,並於2016年9月30日生效。《馬拉喀什條約》目標是在保護智慧財產權的同時,亦能擴大視覺障礙者資訊及資源獲取的管道,允許盲人及視障者得複製已出版作品、簡化無障礙文本的印刷流通與授權,增加視障者閱讀機會。條約並要求締約方必須在國內法中明文對著作權人權利的例外與限制規定,允許被授權實體(例如為視力及閱讀障礙者服務的非營利性組織),製作圖書的無障礙格式版本,包括點字文本、大字本、數位化音訊等,並允許跨國境交換,均無須請求著作權人授權。   美國是目前擁有最多無障礙格式英文文本的國家。2019年1月28日,美國總統批准《馬拉喀什條約》後,美國成為了該條約的第50個締約國。條約在美國國內實施後,居住在條約締約國的視力障礙者將能立即獲得約550,000份無障礙文本。

瑞士諾華藥廠針對數間印度學名藥廠之ANDA申請程序,提起專利侵權訴訟

  瑞士諾華藥廠成立於1996年,為全球前十大藥廠之一,其首創新藥Entresto,係作用於心臟神經內分泌系統,以對抗心力衰竭症狀,其在美國也取得相關專利(US8101659、US8796331、US8877938和US9388134),專利效期大致落在2023~2027年間。藥品上市後統計至2019年6月,Entresto的全球收入已達約7.78億美元。   印度學名藥廠Macleods、Alembic、Natco公司於2019年9月向美國食品藥品監督管理局(下簡稱FDA)提交Entresto學名藥簡易新藥上市申請(下簡稱ANDA),諾華於2019年9月11日接獲通知後,即於2019年10月24日,針對上述申請ANDA之印度學名藥廠提起專利侵權訴訟,試圖阻止該些印度學名藥廠仿製Entresto。   依照美國規定,當學名藥廠提出ANDA申請時,若專利權人在45天內提出專利訴訟,則會限制美國FDA不得於30個月內核准該ANDA申請。因此,在實務上ANDA從申請到上市,需花費約三年時間,使得學名藥廠往往會選擇在原廠藥物專利尚未到期前,提早申請藥品查驗;而原廠也通常會積極於45天內發起專利訴訟,已鞏固其專利期間之市場地位。   我國西藥專利連結制度業於2019年8月20日正式上路,建議我國相關生醫藥廠商應了解相關制度規範、與國外規定之差異,並提早納入企業內部之智財管理與智財策略規劃。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」

TOP