美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/06/23)
引註此篇文章
你可能還會想看
德國資料保護會議通過「哈姆巴爾宣言」,針對人工智慧之運用提出七大個資保護要求

  德國聯邦及各邦獨立資料保護監督機關(unabhängige Datenschutzaufsichtsbehörden)共同於2019年4月3日,召開第97屆資料保護會議通過哈姆巴爾宣言(Hambacher Erklärung,以下簡稱「Hambacher宣言」)。該宣言指出人工智慧雖然為人類帶來福祉,但同時對法律秩序內自由及民主體制造成巨大的威脅,特別是人工智慧系統可以透過自主學習不斷蒐集、處理與利用大量個人資料,並且透過自動化的演算系統,干預個人的權利與自由。   諸如人工智慧系統被運用於判讀應徵者履歷,其篩選結果給予女性較不利的評價時,則暴露出人工智慧處理大量資料時所產生的性別歧視,且該歧視結果無法藉由修正資料予以去除,否則將無法呈現原始資料之真實性。由於保護人民基本權利屬於國家之重要任務,國家有義務使人工智慧的發展與應用,符合民主法治國之制度框架。Hambacher宣言認為透過人工智慧系統運用個人資料時,應符合歐盟一般資料保護規則(The General Data Protection Regulation,以下簡稱GDPR)第5條個人資料蒐集、處理與利用之原則,並基於該原則針對人工智慧提出以下七點個資保護之要求: (1)人工智慧不應使個人成為客體:依據德國基本法第1條第1項人性尊嚴之保障,資料主體得不受自動化利用後所做成,具有法律效果或類似重大不利影響之決策拘束。 (2)人工智慧應符合目的限制原則:透過人工智慧系統蒐集、處理與利用個人資料時,即使後續擴張利用亦應與原始目的具有一致性。 (3)人工智慧運用處理須透明、易於理解及具有可解釋性:人工智慧在蒐集、處理與利用個人資料時,其過程應保持透明且決策結果易於理解及可解釋,以利於追溯及識別決策流程與結果。 (4)人工智慧應避免產生歧視結果:人工智慧應避免蒐集資料不足或錯誤資料等原因,而產生具有歧視性之決策結果,控管者或處理者使用人工智慧前,應評估對人的權利或自由之風險並控管之。 (5)應遵循資料最少蒐集原則:人工智慧系統通常會蒐集大量資料,蒐集或處理個人資料應於必要範圍內為之,且不得逾越特定目的之必要範圍,並應檢查個人資料是否完全匿名化。 (6)人工智慧須設置問責機關進行監督:依據GDPR第12條、第32條及第35條規定,人工智慧系統內的控管者或處理者應識別風險、溝通責任及採取必要防範措施,以確保蒐集、處理與利用個人資料之安全性。 (7)人工智慧應採取適當技術與組織上的措施管理之:為了符合GDPR第24條及第25條規定,聯邦資料保護監督機關應確認,控管者或處理者採用適當的現有技術及組織措施予以保障個人資料。   綜上所述,Hambacher宣言內容旨在要求,人工智慧在蒐集、處理及利用個人資料時,除遵守歐盟一般資料保護規則之規範外,亦應遵守上述提出之七點原則,以避免其運用結果干預資料主體之基本權利。

瑞士新修正專利法進一步釐清研究、試驗免責範圍

  近幾年,製藥領域專利權效力的範圍及例外空間何在,引起廣泛討論,為發展製藥產業,諸多先進國家紛紛修改其專利法,擴大專利權例外範圍,使研發工作更易進行,以爭取跨國藥廠研發委外之機會。例如歐盟2004年修正通過的第2004/27指令,即對學名藥的試驗免責予以明文規定,而歐盟各會員國在將該指令內容落實為內國法的過程中,則有不少國家進一步擴大該指令例外規定的適用範圍。   瑞士雖非歐盟會員國,不過其在化學及製藥領域擁有世界一流的領先技術,因此瑞士也特別注意法規範面對於技術研發與產業發展之影響,並在近幾年積極展開類似的修法工作,瑞士新修正的專利法所規定的研究或試驗免責範圍,更進一步釐清農業領域使用受保護之生物物質之疑義,值得參考。   瑞士新修正專利法第9條規定,專利權效力不及於:(1)於私領域基於非商業目的之行為;(2)基於實驗與研究目的,為針對發明客體及其可能之應用獲取新知識所進行之行為,特別是與該發明客體有關之所有科學研究,均為容許空間;(3)為就某一藥品於瑞士取得上市許可,或於其他有類似藥品上市管制的國家取得上市許可所進行之必要行為;(4)為於教學機構中教學之目的而使用發明;(5)為進行植物品種之選育、發現或開發,而使用生物物質之行為;(6)在農業領域,出於偶然或因技術上不可避免而獲得生物物質。   上述新規定自2008年7月1日生效,隨著專利法對研究例外範圍的進一步釐清,瑞士的法規環境更具有發展生技研發服務的吸引力與國際競爭力。

英國智財局發布2020-21創新與成長報告,強化智財環境打造創新國家

  英國智慧財產局(UK Intellectual Property Office)於2021年9月28日發布「2020-21創新與成長報告」(Innovation and growth report 2020-21)。本報告為英國智慧財產局對其2020至2021年間施政工作的總結報告,以創新為帶動國家與企業成長的核心,並期許能透過串接創新者與市場來帶動價值創造,從而建設英國成為全世界最具創新力與創造力的國家。   本報告指出,英國在全球創新指標當中均名列前茅,關鍵在於以系統化、組織化的方式推動創新,從而使創新成為帶動國家發展的動力,並得以對抗冠狀病毒的侵襲與實現淨零(Net Zero)排放的目標。呼應英國在2020年發表研發路徑圖(R&D Roadmap)以及2021年7月發布的創新戰略(Innovation Strategy),英國目標在2035年成為全球創新中心。   面對2020年英國脫離歐盟的巨大轉變,英國智慧財產局同步推動「單一智慧財產局轉型計畫」(One IPO Transformation Programme),以組織重塑、流程再造及數位轉型等方式,完成包含透過政府數位服務系統(Government Digital Service, GDS)推動智慧財產權管理數位化、開發基於人工智慧的商標搜索工具以協助商標申請人降低檢索成本,以及優化包含會計系統在內等工作流程以支持電腦設備更新並提升作業效率等措施。   為了打造世界一流的智慧財產權環境,英國透過一系列政策與法規來鼓勵創新活動,除了面對脫歐過渡期確保對英國商標跟設計等智慧財產權能在脫歐後繼續受歐盟法規的保護,還有藉由與歐洲經濟區以及其他國家的雙邊或多邊貿易協定,納入智慧財產權條款(包含智財保護與執法)、對創新活動的支持、排除與智財相關之市場准入障礙(IP-related market access barrier)、保障消費者選擇,以及獎勵創作人跟補助產業創新等措施,支持英國企業在國內外的創新與成長。

何謂專利適格(Patent Eligibility)的兩階段標準(Two-Step Test)?

  「專利適格」(Patent Subject Matter Eligibility)用淺白的文字解釋,就是成取得專利的基礎門檻、資格。專利適格的司法排除事項(Judicial Exception)為:「自然法則、自然現象、抽象概念」。而「兩階段標準」的導入,是給司法排除事項「敗部復活」的機會。   可取得專利適格的標的於35 U.S.C. §101有明文:「任何人發明或發現新穎而有用之程序(Process)、機器(Machine)、製品(Manufacture)或物之組合(Composition of Matter),或其新穎而有用之改良,皆得依據本法所定規定及要件就其取得專利權利。」但符合§101的敘述,不必然具專利適格。最高法院表示:「自然法則、自然現象、抽象概念是科學與科技成品的基礎,不可被獨佔。」然而,隨愈來愈多的發明與發現推出、電腦文明的發展,司法排除事項亦受挑戰,在 Mayo v. Prometheus,最高法院首次針對自然法則和自然現象提出「兩階段標準」。基此,美國專利與商標局(USPTO)2012年發表專利審查綱要。後續,Alice v. CLS Bank中,引「兩階段標準」將兩階段標準應用在「電腦應用過程、電腦系統、減免交割風險的電腦可讀媒介」的抽象概念。USPTO也將「兩階段標準」編入專利審查手冊(Manual of Patent Examining Procedure)。 USPTO專利審查手冊公布的「兩階段標準」: 第1步:四種可取得專利適格的標的(35 U.S.C. §101)   程序、機器、製品、物之組合。 第2A步:司法排除事項   假設不是「自然法則、自然現象、抽象概念」三種司法排除事項,則具專利適格;若是司法排除事項,則進入第2B步。 第2B步:是否「更具意義」(Significantly More)?   這一個步驟是「敗部復活」。如果該發明存在「發明概念」(Inventive Concept),則符合「更具意義」,可取得專利適格;反之,則無專利適格。

TOP