美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/04/10)
引註此篇文章
你可能還會想看
何謂「ERIC」?

  為加強歐盟及各成員國的研究基礎設施合作,從發展政策方面,於2002年成立「歐洲研究基礎設施策略論壇」(European Strategy Forum on Research Infrastructures, ESFRI)協助各會員國統籌規劃RIs(Research Infrastructures, RIs)的發展藍圖。在法律層面,於2009年通過「第723/2009號歐盟研究基礎設施聯盟法律架構規則」(COUNCIL REGULATION (EU) No 723/2009 of 25 June 2009 on the Community legal framework for European Research Infrastructure Consortium (ERIC),使各歐盟會員國、夥伴國家、非夥伴國家之第三國家或跨政府國際組織等對於分散的RIs整合起來後,可向歐盟執委會提出申請,依該號規則取得法律人格,成立「歐盟研究基礎設施聯盟」(European Research Infrastructure Consortium, ERIC),且可為權利得喪變更之主體,更可與他方簽訂契約或成為訴訟當事人,使其具有自我經營管理之能力。   截至目前為止(2015年9月),歐盟的RIs正式成立11個ERIC,並且透過國際間合作將RIs做更有效率之使用。國際上近年來創新研發競爭激烈,歐盟執委會為了持續推動建置世界級歐洲研究區域(European Research Area, ERA),無論在資金面、政策面及法律層面均有積極作為,在強化歐盟RIs同時促進國際科技研發合作,俾使歐盟於研發創新的領域保持世界領導之地位,歐盟未來仍會持續推動各個重要研發領域的ERIC,ERIC對於整合歐盟各國重大RIs負有重要使命。

運用AI工具協助管理智慧財產組合(IP Portfolio)之方式

美國實務界律師2023年6月9日撰文指出,人工智慧(artificial intelligence,簡稱AI)將對智慧財產法律和策略帶來改變,大部分企業熟悉的改變是目前仍有爭議的法律問題—由AI工具產生的發明創造是否為專利或著作權適格的保護標的。但除此之外,AI工具對於創建和管理智慧財產組合(IP Portfolio)的方式也已發生改變,並介紹以下五種利用AI工具協助管理智慧財產組合之方式。 1.簡化先前技術之檢索 無論是評估新產品的可專利性、評估競爭對手之智慧財產權之相關風險、抑或是回應侵權索賠,企業均須了解特定領域之先前技術,因應此需求,全球已有大量公司提供先前技術檢索服務,惟AI工具的出現使得企業可自行進行先前技術檢索。例如知名的文件審查平台Relativity創造了Relativity Patents,使用者輸入專利號碼等特定關鍵字即可進行先前技術檢索;美國專利商標局亦為了審查官開發一種AI工具,提升其確認先前技術之準確性及效率。 2.協助專利申請文件撰寫 對於專利申請人而言,可使用AI工具協助草擬專利申請範圍,有些企業甚至會運用AI工具自動化撰寫專利申請文件,惟使用AI工具撰寫專利申請文件時,應留意提供AI工具的資料是否會保密,抑或有向第三人提供之風險。此外,AI工具撰寫之內容建議仍須雙重確認內容正確性及適當性,如引用來源及內容是否正確。 3.改善商標維權能力 企業可使用AI工具協助監控潛在的侵權及仿冒產品,有鑒於現今網站及社群媒體仍有大量未經商標授權的賣家存在,AI工具可作為審查貼文及識別商標侵權案件之工具,相較於傳統的人工審查可更有效率。 4.協助商標檢索作業 於美國、澳洲、歐盟、中國,甚至世界智慧財產組織導入AI工具協助審查官進行商標審查,包括以關鍵字及影像標記之搜尋功能,此一工具不僅可簡化商標申請和註冊審查程序與時間,亦有部分國家提供使用者自行檢索之功能,使企業可進行更快速、有效率之商標檢索,使其於品牌保護策略上節省不必要之時間及金錢。 5.支持策略性專利組合管理 AI工具亦可協助專利組合管理,包括最廣的專利範圍、評估是否需繼續維護專利、或是評估擬收購專利之價值,以AI工具協助評估以上事項,雖無法完全取代人工進行策略評估,惟可顯著減少勞動力支出。 AI工具改變了智慧財產組合創建及管理之方式,雖然AI工具不能完全承擔管理智慧財產權組合之職責,但AI工具在專利/商標檢索、專利申請文件撰寫、專利權評估、商標維權等方面已可大量減少人力及管理成本,有助於企業智慧財產組合管理,惟企業及使用者須留意使用AI工具的資料管理問題,以避免機密資訊遭到外洩。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

馬里蘭州去氧核醣核酸採集法(DNA Collection Act)引發隱私爭議

  2009年,馬里蘭州立法通過去氧核醣核酸(下稱DNA)採集法(DNA Collection Act),允許警方向已經被起訴但尚未定讞之犯罪嫌疑人採集DNA樣本,其適用對象主要在於暴力犯罪或一級竊盜案件。對此問題,美國大約有26州立有與馬里蘭州類似的法案,例如維吉尼亞州的執法單位對於暴力犯罪在經過逮捕後即可進行DNA採集。然而,該法案卻引發了隱私權利與公眾安全之平衡的爭論。   此次爭議爆發於Alonzo Jay King Jr. v. State of Maryland案,案件中Alonzo Jay King Jr.在2009年被起訴暴力攻擊,且因此被警方採集DNA,而後又在經過DNA比對之後,發現與2003年一宗強制性交案件所遺留下的DNA樣本符合,並據此判決Alonzo Jay King Jr.強制性交罪。本案經Alonzo Jay King Jr.上訴高等法院後,高等法院認為調查人員採集其基因資料並以之與舊案件進行比對,已經侵犯了美國憲法第四修正案所賦予人民的合理隱私期待,屬於不合法的搜索,並據此判決禁止向犯罪嫌疑人採集DNA樣本。本案目前正在最高法院上訴中,而最高法院首席法官John Roberts日前發布了一份命令,阻止了高等法院判決的生效,並使得馬里蘭州在最高法院作出判決之前仍然能夠採集DNA;全案預計將在10月進行聽證,未來,最高法院將如何判決,值得吾人注意。

促進頻譜使用效率--美國啟動獎勵拍賣機制

  為了滿足行動寬頻時代對於無線頻譜的需求,美國規劃了多種不同的頻譜釋出、分享或共用的政策,以增加可用的頻寬或提高使用效率,其中針對既有的數位無線電視服務所使用的頻譜,則提出「獎勵拍賣機制(incentive auctions)」。此機制最初於2010年由FCC提出,其特色在於具備自願性及市場導向兩項內涵。本次美國啟動獎勵拍賣機制,主要目的為藉由新業務之頻譜拍賣,將所得之部分標金作為誘因,以鼓勵廣播電視業者繳回原有頻譜使用權,並促進美國寬頻計畫(National Broadband Plan)之發展。目前針對此機制,美國國會已於2012年2月22日正式授權FCC執行。而FCC則於2012年10月2日發布FCC 12-118法規制定建議通知(Notice of proposed rulemaking, NPRM),並依據美國「2012年中產階級稅收減免及創造就業法案」(Middle Class Tax Relief and Job Creation Act of 2012)之授權,針對廣播電視頻譜獎勵拍賣機制進行商擬,並廣徵各界建議。   本次廣播電視頻譜獎勵拍賣機制主要可區分為三個步驟,(一)反向拍賣(reverse auction),指廣播電視業者藉由投標之方式,標得原持有頻段之自動放棄權。(二)頻譜重組(reorganization or repacking),此步驟是為了讓廣播電視頻譜藉由重組後,可釋出部分的超高頻(UHF)頻段以作為其他業務使用。(三)正向拍賣(forward auction),即針對頻譜進行重新授權,對此FCC提出將以更為彈性的概念使用頻譜。   目前整體拍賣機制尚處發展階段,各步驟內部運作應如何規劃,FCC仍積極尋求外界建議。不過從FCC所提出的五項關鍵政策目標(key policy goals)中,亦可歸納出未來整體機制的規劃方針包含(一)提升頻譜效能,期望未來得以5MHz為拍賣單位,並且支持各類無線行動技術如W-CDMA、HSPA以及LTE技術之發展、(二)確保不干擾鄰近國家頻譜之使用、(三)發展各頻段之通用性(interchangeable),促進各頻譜區段在重新配置後具備可替換性、(四)刺激頻譜回收達理想數量,以及(五)促進頻譜技術中立概念。面對美國在提升頻譜使用效率策略上又一記新嘗試,即便目前仍有許多不確定因素亟待突破,但就促進頻譜使用效率而言,亦不失為頻譜交易機制之外,另一可參考之方向。

TOP