美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2025/12/04)
引註此篇文章
你可能還會想看
美國國家標準暨技術研究院發布「全球AI安全機構合作策略願景目標」,期能推動全球AI安全合作

美國國家標準暨技術研究院(National Institute of Standards and Technology, NIST)於2024年5月21日提出「全球AI安全機構合作策略願景目標」(The United States Artificial Intelligence Safety Institute: Vision, Mission, and Strategic Goals,下稱本策略願景),美國商務部(Department of Commerce)亦於2024年參與AI首爾峰會(AI Seoul Summit)期間對外揭示本策略願景,期能與其他國家攜手打造安全、可靠且可信賴之AI生態系。 由於AI可信賴與否往往取決於安全性,NIST指出當前AI安全所面臨的挑戰包含:一、欠缺對先進AI之標準化衡量指標;二、風險測試、評估、驗證及確效(Test, Evaluation, Validation, and Verification, TEVV)方法不健全;三、欠缺對AI建模後模型架構與模型表現間因果關係的了解;四、產業、公民社會、國內外參與者等在實踐AI安全一事上合作程度極為有限。 為因應上述挑戰並促進AI創新,NIST在本策略願景中擬定以下三大戰略目標:(1)推動AI安全科學發展:為建立安全準則與工具進行技術合作研究,並預先部署TEVV方法,以利評估先進AI模型之潛在風險與應對措施;(2)推展AI安全實務作法:制定並發布不同領域AI風險管理之相關準則與指標,以達到負責任設計、開發、部署與應用AI模型與系統之目的;(3)支持AI安全合作:促進各界採用前述安全準則、工具或指標,並推動全球合作,以發展國際通用的AI安全風險應對機制。

日本個人資料保護委員會發布「禁止不當利用」與「停止利用」論點資料作為將來發布指引參考

  日本為因應去年6月通過「個人資料保護法」之修正(下稱「新法」),個人資料保護委員會於2021年2月19日第166次會議議題「禁止不當利用與停止利用之完備指引論點」(改正法に関連するガイドライン等の整備に向けた論点について(不適正利用の禁止・利用停止等)),公開兩份論點資料,作為將來發布指引之參考,並使企業等關係者在新法實施準備期間,得採取適當措施以達到法遵要求。   新法第16條之2「禁止不當利用」,旨在防止不當利用個人資料致本人權益受損。於「禁止不當利用之論點資料」指出具體要件有(1)「違法或不當行爲」,係指違反個人資料保護法及其他法令之行爲,或有違公序良俗,在社會觀念上非屬正當之行為;(2)「助長或誘發之危害」,在認定上將限縮在以業者提供時有認識第三方將違法利用個人資料,並可預見提供個人資料將受違法利用之情形,以免造成寒蟬效應。若第三方刻意隱瞞取得目的,即使已盡相當注意仍不能預見違法利用之情形,則非屬「危害」。   新法第30條第5項擴大「停止利用」請求權範圍,於「停止利用之論點資料」指出適用要件有(1)「個人資料處理業務已無利用個人資料之需要」,即個人資料利用目的已消失或該事業已中止時;(2)「發生第22條之2第1項本文情形」,係指發生資料外洩依規定須報告委員會之情形;(3)「可能損害本人權益時」,係指依法受保護之正當權益有受損可能為必要。另論點指出請求停止利用必須在「為防止本人權益受損必要限度內」,故業者對於超出必要限度之部分得拒絕之。而對於停止利用所費不貲或顯有重大困難之情形,得依個案具體考量採取適當替代措施。

美國聯邦最高法院判決網域名稱「booking.com」可取得聯邦商標註冊

  美國聯邦最高法院(Supreme Court of the United States)於2020年6月30日以8票對1票之決定,肯認網域名稱「booking.com」可取得聯邦商標註冊。   本案之爭點在於,「通用名稱.com(generic.com)」是否亦會被認定為通用名稱而無法取得商標註冊。過去美國專利商標局(United States Patent and Trademark Office, USPTO)認為,當通用名稱與通用頂級域名(如「.com」)組合時,所得到之組合仍會被認定具有通用性(generic),因為僅在通用名稱中加入「.com」,如同加入「公司」一詞,無法藉此傳達任何可識別來源之意義。就「booking.com」而言,由於 「Booking」一詞意指旅行預訂,「.com」一詞表示其為一個商業網站,故消費者觀諸「booking.com」此一用語,會認為其是提供旅遊住宿之線上預訂服務。且即便認為「booking.com」屬於描述性商標,其亦缺乏第二意義而無法註冊。   惟聯邦最高法院認為,因為同一時間僅有一個實體可占用一特定網域名稱,因此「generic.com」一詞可向消費者傳達與特定網站之關聯。且對於通用性之認定原則主要有三:首先,通用性係指商品或服務之類別,而非該類別之特定示例;其次,對於複合用語而言,其識別性之認定應以整體觀之,非個別隔離觀察;最後,應視用語之相關意涵對於消費者之意義而定。基於該等原則,「booking.com」是否具有通用性,取決於該用語是否整體上向消費者表示為線上旅館預定服務之類別,例如:消費者是否會認為另一家提供相似服務之Travelocity也是一種「booking.com」;但消費者並非以此種方式來認知「booking.com」用語,因此,由於「booking.com」對於消費者而言並非通用名稱,其未具通用性。   USPTO另認為基於政策考量,其反對如「booking.com」之「generic.com」之商標註冊,因此種商標保護將使商標權人對於其他應保持自由使用之相似文字擁有過度控制權,例如可能會妨礙競爭者使用「booking」用語或「ebooking.com」、「hotel-booking.com」等域名。聯邦最高法院指出,USPTO顧慮之情形其實也會出現於任何描述性商標。事實上,除非可能造成消費者混淆,競爭者之使用並不會侵害商標權。「booking.com」是識別性較弱的商標,較難導致消費者混淆,且booking.com公司亦自承「booking.com」之註冊不會阻止競爭者使用「booking」之用語來描述其之服務。因此,聯邦最高法院最終認定「booking.com」之註冊不會使商標權人壟斷「booking」此一用語。

中國大陸國務院印發關於實施《促進科技成果轉化法》之規定

  中國大陸於2015年8月29日修改了其《促進科技成果轉化法》,為了該法的實施,中國大陸國務院於今年2月17日的常務會議中,即發表了其對於鼓勵研究機構及大專院校之科技研發成果運用的相關措施;而針對這些措施,中國大陸國務院於同月26日制定了相關的具體規定,並在3月2日時發布,並行文於各相關機關。   該規定分作16點,主要分三個大方向,包括促進研究機構及大專院校的科技研發成果轉移於民間企業、鼓勵科技研發人員發展創新技術以及創業活動,與科技研發環境的營造等等。   具體而言,其主要措施包括允許研發機構得自主決定其科技研發成果的運用,原則上不需要向政府申請核准或報備、其運用後的收入不需繳交國庫,得全部留於研發機構內,用於對研究人員之獎勵及機構內科技研發之用、其並對該收入用於對研究人員獎勵之比例下限作出明文規定、允許國立研發機構及大專院校之研究人員在一定條件下得保留原職位在一定期間內至民間企業兼職,或進行創業活動,以從事科技研發成果的運用,以及對研發機構的考核標準應納入對機構之科技研發成果及運用的評鑑等等。

TOP