美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/03/28)
引註此篇文章
你可能還會想看
美國最高法院認定州政府得對電商業者課徵銷售稅

  美國最高法院在今(2018)年1月12日決定接受南達科塔州的上訴,就South Dakota v. Wayfair一案(下稱Wayfair案)進行審理,以決定州政府是否有權對網路零售業者課徵銷售稅。依據最高法院在1992年Quill v. North Dakota (下稱Quill案)所確立之原則,若網路零售商在該州無實體呈現 (physical presence),州政府即不得對該零售商向該州居民所銷售之貨物課徵銷售稅。   在1992年Quill案中,最高法院認為州政府對於遠距零售者(remote retailer)課稅,將違反潛在商務條款(dormant commerce clause),理由是對於無具體呈現的零售商課稅,將使其面對許多不同的課稅管轄權,造成零售商巨大的負擔,並增加州際商務的複雜性。南達科塔州認為科技的進步已使得零售商商所面臨課稅的複雜度降低,故在2016年通過法案對無實體呈現之電商業者課稅,因而引發相關爭訟。   本案在今年6月21日宣判由南達科塔州勝訴,判決指出隨著電子商務的成長及資訊科技的進步,課稅並不如過往會對業者造成具大的負擔,同時也可滿足正當程序與潛在商務條款的要求;此外,Quill案將會造成市場的扭曲,其所造成的稅捐保護傘將對具有實體呈現的業者造成不公平的競爭。因此認定Quill案已難以適用於現在的電子商務市場。   但本案仍有四位大法官反對,認為應由國會立法來糾正此一錯誤。因為國會並未明確授權州政府可對跨州零售交易課稅,因此才有潛在商務條款的適用,換言之,國會實際擁有立法授與各州徵收遠距交易之權力,在115期國會當中,也已經有相關的法案被提出,包括Remote Transaction Parity Act of 2017 (H.R. 2193)、Marketplace Fairness Act of 2017 (S.976)。在最高法院完成此一判決後,後續可繼續觀察美國國會是否會以立法的方式,授與州政府對跨州商業貿易課徵租稅。

電信產業號碼資料庫之應用與法制議題-以個人隱私保護為中心

美國賓州眾議院通過《人工智慧生成內容揭露法》

美國賓州(Pennsylvania)眾議院於2024年4月10日通過《人工智慧生成內容的揭露法草案》(House Bill 1598 Disclosure of Artificially Intelligent Generated Content,下稱草案),規範AI生成內容及其利用行為以保護消費者。 草案規定,以AI生成之各種形式內容,在其首次呈現給消費者時應揭露資訊,使消費者知道該內容為AI生成之結果。如果明知或重大過失(Knowingly or recklessly)產出、散布或發布任何未「明確且顯著」(clear and conspicuous)揭露其內容為AI所生成者,即屬「不公平或欺騙性行為或做法」,將被依賓州《不公平貿易行為與消費者保護法》(Unfair Trade Practices And Consumer Protection Law)規定處罰。草案亦說明應如何揭露資訊,方符合條文所謂「明確且顯著」標準,例如針對AI生成之音訊內容,其揭露應以足夠的音量和節奏傳達,以便消費者聽取和理解。 此外,草案也關注兒童保護問題。鑑於AI生成的兒童性剝削圖像通報日益增加,草案最後新增規定,未來不能將「兒童性剝削圖像為AI生成」作為辯護理由,且檢察總長或地區檢察官可起訴製造、持有以及傳播AI生成之兒童色情或性虐待素材等相關行為。 目前草案已在州眾議院通過,由州參議院審議中。草案的提案議員強調,人們有權知道其消費的內容實際上是使用AI產出的成果,因此草案通過後,可望有效遏阻濫用AI的行為,提供賓州民眾更多的保障。

數位著作權侵權監控公司Rightscorp, Inc.之爭議

  Rightscorp, Inc.成立於2011年,總部位於美國洛杉磯,該公司與網際網路服務提供者合作(Internet Service Provider, ISP),監控以P2P方式所進行之非法下載行為,並依數位千禧年著作權法(Digital Millennium Copyright Act)之規定,代理權利人與當事人和解(下載一非法檔案的和解金額是20美元)或透過訴訟以保護權利人之智慧財產權,近年越來越多大學甚至是華納兄弟(Warner Bros.)、唱片公司BMG使用Rightscorp這樣第三方公司的服務來監控非法網路活動。   年初(2015)在喬治亞州(City of Monroe, Georgia),該公司因未得消費者同意以電話留言或者發送簡訊、email的方式威嚇消費者達成非法著作權下載之和解,被控訴違反「電話消費者保護法」(Telephone Consumer Protection Act),原告Brown和Ben Jenkin主張針對每一筆非法之通訊連絡請求損害賠償,總額估算可能會超過千元美元。   去年(2014),Rightscorp在加州聯邦法院(California federal court)面臨之集體訴訟仍在進行中,原告方指出Rightscorp並未提供非法下載之債務有效證明且濫用美國千禧年著作權法(DMCA)的通知機制,控訴該公司違反「電話消費者保護法」(TCPA)、「公平債務催收行為法案」(Fair Debt Collection Practice Act )和「濫用訴訟權利」(Abuse of Process)。   Rightscorp的商業模式,對權利人來說,確實可以有效追蹤侵權行為人,某種程度上可適當地遏止非法下載行為,但手段上也影響到當事人的權利,妥適性有待商榷。惟可預見的是,後續判決結果將可能影響類似公司在防範網路非法下載時的相關反制措施。

TOP