美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/05/04)
引註此篇文章
你可能還會想看
美國著作權法109(a)條「第一次銷售原則」之適用原則

  美國最高法院於2010年12月13日以4:4的平手票數確立了第九巡迴上訴法院於Omega, S.A. v. Costco Wholesale Corporation案中關於著作權法109(a)條「第一次銷售原則」(first sale doctrine) 並不適用於享有美國著作權法保護之外國製造但未經授權於美國再販售之產品。   此案源於由知名瑞士鐘錶品牌Omega 於瑞士製造的手錶透過所謂「水貨」或「灰色市場」的途徑輾轉由一家名為ENE Limited的紐約公司所購得,而Costco自該公司購得手錶後於加州賣場以低於合法代理商的價格販售。然而,Omega雖對於該手錶於外國的初次販售給予授權,但並未授權該商品爾後輸入美國並由 Costco 販賣之行為。Omega乃對Costco提出侵權告訴,而此案所牽連的著作物即為手錶底面都刻有受美國著作權法所保護之「歐米茄全球設計(Omega Globe Design)」字樣。   Costco則以著作權法第109(a)條作為抗辯,主張「第一次銷售原則」之規定,亦即Omega首次於外國販售該手錶之行為,已排除其對於後續散布、進口及未經授權之銷售等行為之侵權主張。第一審法院聽取Costco 之意見,Omega 乃上訴於第九巡迴法院。上訴法院對於「第一次銷售原則」之適用較為限縮,認為先前Quality King案的判決,並未使上訴法院對於「第109(a)條,只有當該主張涉及在美國國內製造受美國著作權法保護之著作的重製物時,可以對抗第 106(3)條(公開散布權)及第602(a)條(輸入權)」之一般規定無效。換言之「第一次銷售原則」並不適用於銷售外國製造但未經授權於美國再販售的著作物或其合法重製物。而最高法院亦同意上訴法院的看法。此案的判決結果意味著作權人或合法代理商將可間接防止或控制於外國製造的真品(即水貨)未經授權輸入於美國市場。

荷蘭公司控《中國好聲音》商標侵權,索賠300萬

  北京法院於2016年3月17日開始審理關於「夢想強音文化傳播有限公司」和「北京正議天下文化傳媒公司」未經授權使用荷蘭Talpa公司商標一案。   Talpa公司主要業務為開發、製作電視節目模式,〈The Voice of〉是該公司開發的一款歌唱比賽真人秀電視節目模式,為該公司知名產品。Talpa已向中國、澳州、美國、歐盟等在內約70個國家,註冊了「The Voice of 」商標,商標圖示為一隻手拿麥克風之圖像。   《中國好聲音》製作單位於2012年向荷蘭Talpa 買下節目模式與商標圖示,用以製作音樂真人秀《中國好聲音》;今年Talpa並未與其續約,故《中國好聲音》製作單位未取得Talpa公司商標專用權。   惟負責《中國好聲音》第五季海選活動之夢想強音文化傳播公司和北京正議天下文化傳媒公司,在好聲音全國海選活動與宣傳中,大量使用與Talpa註冊商標幾乎相同的圖形及文字;Talpa公司認為,此為類似商品上使用與註冊商標相同或近似商標行為,已造成消費者混淆,依中國大陸人民共和國商標法第57條,構成侵害商標專用權。據此,Talpa公司要求上開兩間公司立即停止商標侵權行為,並要求登報道歉與連帶賠償律師費、公證費、翻譯費及各項損失300萬元。 本文同步刊登於TIPS網站(http://www.tips.org.tw)

日本因新冠肺炎而將修正著作權法關於線上教學之著作利用部分提前施行

  日本著作權法在2018年修正時,在第35條針對教育相關資通訊(利用網路進行線上教學與傳送預複習資料)之權利對應規定進行增修。修正前,利用人在每次利用時,均需獲得個別權利人之同意並支付授權金;而修正後,僅需一站式的支付補償金即可,無須得到權利人之許可。   然而本條規定原訂於2021年4月施行,但因為新冠肺炎疫情蔓延影響,許多學校、教學機構因停課而使得線上教學之需求提高。日本文化廳為防止感染並考量停課措施有可能長期化,宣布將文學作品、論文及新聞記事等作為線上教學教材,自本月開始無須得著作權人之許可即可使用,亦即將修正施行日期大幅提前。   而作為日本著作權人補償金分配窗口之「教學目的公眾放送補償金管理協會」,也在今年(2020年)4月6日決定本年度相關作品之補償金以特例無償之方式處理。依據上開規定,本年度的線上教學,不論是文學或是音樂等作品,均無須取得著作權人之同意,即可免費使用。

新加坡個人資料保護委員會針對企業蒐集、使用、揭露永久居留證(NRIC)號碼提出新的諮詢指引

  考量各行各業的從業習慣及民眾對企業蒐集、使用、揭露永久居留證(National Registration Identification Card, NRIC)號碼之看法,新加坡個人資料保護委員會(Personal Data Protection Commission, PDPC)於2017年11月提議修改個人資料保護法的諮詢指引(Advisory Guidelines on the Personal Data Protection Act ),明確界定企業蒐集、使用、揭露NRIC及其號碼之範圍。   依據舊的諮詢指引,新加坡個人資料保護法允許企業在基於合理特定目的並依法獲得當事人有效同意之情況下,蒐集、使用或揭露NRIC號碼。因此,不少企業活動習慣蒐集利用民眾的NRIC號碼,包括零售商店所舉辦的抽獎活動。然而,在PDPC提出新的諮詢指引後,企業可蒐集利用NRIC號碼的情況受到大幅限縮。   由於NRIC號碼與個人資訊息息相關且具不可取代性,無差別地蒐集利用將增加資料被用以從事非法活動之風險,故新的諮詢指引闡明,原則上企業不應蒐集、使用或揭露個人NRIC號碼或複印NRIC,除非有下列兩種例外情況之一:(一)法律要求;(二)為確實證明當事人身分所必要。第一種例外情況,雖因法律要求無須取得當事人同意,但企業仍應踐行告知義務,使當事人知悉NRIC號碼被蒐集、使用或揭露之目的,並確保企業內已採行適當安全措施,防止NRIC號碼被意外洩漏。第二種例外情況則仍須就NRIC號碼的蒐集、使用或揭露取得當事人同意,除非符合個人資料保護法規定下毋庸取得當事人同意之例外(如急救等緊急狀況)。   此外,PDPC針對得蒐集、使用或揭露NRIC號碼或複印NRIC的情況,以情境案例方式於諮詢指引中說明供企業參考,另給予12個月的審視期間,使企業得修正組織內部政策並尋找可行替代方案。

TOP