美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/13)
引註此篇文章
你可能還會想看
歐盟執委會發布《2019歐盟產業研發投資計分板》,美國和歐盟為世界研發投資最主要地區

  歐盟執委會(European Commission, EC)於2019年12月18日發布《2019歐盟產業研發投資計分板》(The 2019 EU Industrial R&D Investment Scoreboard)。產業研發投資計分板是歐盟每年出具一次的報告,2019年計分板報告包含2500家在2018-2019年間投入最多研發資金的企業,分別位於全球44個國家/地區,每一企業的研發投資金額超過3000萬歐元,總計約為8234億歐元,為全球研發支出的90%。在這2500家企業中,551家來自歐盟公司,為投資總額的25%;769家來自美國,為投資總額的38%;318家來自日本,佔13%;507家中國公司,佔12%。   報告中指出,2018年企業研發投資總額較2017年增加8.9%,主要是中國在全球研發資金投入比例不斷增加。另外,研發投資高度集中於大型企業;在這2500家企業中,前10大、前50大企業分別佔研發總額的15%和40%。前50大企業中,最多者為美國企業22家和歐盟企業17家。再從研發投資領域觀察,前三大領域分別為資通訊產業(38.7%)、健康(20.7%)和汽車產業(17.2%),佔總量的76.6%。但每一個國家重視的領域不盡相同,例如歐盟投資20%在資通訊、21.6%在健康、31%汽車,而美國的資通訊研發投資佔了52.8%、26.7%在健康,僅有7.6%在汽車。   再從個別企業研發投資排名來看,前四大企業分別為Alphabet、Samsung、Microsoft和Volkswagen。另外,報告統計在過去的15年中,有8家企業在全球研發投資金額排名中上升了70名以上,分別為:Alphabet、華為、蘋果、Facebook、阿里巴巴、Celgene、Gilead Sciences和德國馬牌;也代表這15年間資通訊、生技與汽車產業發展的重要性。

「反間諜程式法草案」於參議院尋求闖關通過

  美國眾議院已於本週(2007.05.23)口頭表決通過「反間諜程式法草案」,未來將有待於參議院表決通過後,公佈施行該法。   間諜程式通常是指涉收集電腦使用者資訊的惡意軟體,該惡意軟體通常係安裝免費軟體中不知名的某個套件,或者是隱含在所下載網路遊戲程式中、不請自來的廣告頁面或者電腦中毒所導致。其危險之處即在於,該惡意軟體將使電腦使用者的使用者帳號、密碼以及個人金融帳目細節等等個人資料傳遞出去,以詐欺該使用者。   由於該法案要求程式開發商於使用者下載此類程式前,需要提醒使用者以及獲得他們的同意,因此,軟體產業非常反對該項規範。   據了解,美國眾議院已於2004年及2005年以壓倒性的勝利表決通過「反間諜軟體法案」,惟當時該法案並無法獲得參議院的青睞,而慘遭否決。

掀起網路自由與版權衝突的另一場戰爭-Megaupload事件概述

掀起網路自由與版權衝突的另一場戰爭-Megaupload事件概述 科技法律研究所 法律研究員 劉得正 101年06月25日   Megaupload 是著名的線上網路硬碟服務商,提供用戶上傳檔案、藉此分享資料予他人之網路空間。自2005年3月間上線後,迅速累積用戶至1億8千萬,並一度排名全球網站瀏覽量第11名。然而在2012年1月19日卻遭到美國政府強制關閉,相關負責人(包括創辦人KIM DOTCOM)遭到美國司法部起訴,並透過國際合作逕予逮捕。此舉為網路環境投下前所未有之震撼彈。本文以下便針對此一個案提出簡要說明,釐清美國採取行動之依據及考量。 壹、Megaupload起訴依據   根據本案起訴書[1],司法部本次起訴KIM DOTCOM等,主要是認為其觸犯以下規定: 一、「共謀實施著作權侵權」[2]、「著作權侵權刑事處罰規定」[3]-   美國司法部認為Megaupload直接藉由複製、散佈盜版物來賺取利潤,構成對著作權之侵權。因其發現,Megaupload獲利來源主要來自網站上商業廣告之瀏覽量。為了提高廣告瀏覽量,Megaupload規定用戶所上傳文件之存續時間,取決於該文件的下載次數,並鼓勵上傳可長期受到使用者青睞下載的文件。換言之,Megaupload獲利與盜版物之散佈具有直接關連。   其次,司法部發現,Megaupload網站上已使用一種「移除程序」來辨認兒童色情內容,但卻未將此技術應用在移除侵權的內容上,或以其他方式使「移除程式」無法搜尋特定盜版物,顯見Megaupload係故意以散佈盜版物來賺取商業利益,並因此無法適用數位千禧年著作權法案中,對於網路服務提供者之「安全港」條款。 二、「共謀詐欺」[4]與「網路詐欺、教唆及幫助網路詐欺」[5]-   此外,司法部認為,Megaupload網站運作方式,除了構成著作權侵權外,其以組織運作方式進行犯罪,以及透過網路進行犯罪,此等行為已符合「共謀詐欺」及「網路詐欺」 ( Fraud by Wire ) 。同時,Megaupload使用激勵程序來鼓勵用戶上傳「流行」的文件,亦構成教唆及幫助網路詐欺。 三、洗錢防制規定[6]-   最後,美國司法部認為KIM DOTCOM等Megaupload之負責人,有針對上述不法所得再進行金融交易之行為,因此亦違反洗錢防制規定。 貳、Megaupload案目前發展情況   如前所述,美國司法部係透過國際合作,逮捕相關負責人。以創辦人KIM DOTCOM而言,目前仍在紐西蘭政府監管之下,不過近期內,將依美國司法部之請求,召開引渡聽證會,討論是否引渡KIM DOTCOM至美國受審。至於在犯罪調查方面,紐西蘭法院已下令允許美國FBI可從Kim Dotcom電腦中拷貝超過150TB的資料,以作為美國司法部指控Megaupload之訴訟證據[7],相信對於是否得以引渡Kim Dotcom,將帶來一定影響。 參、代結論   Megaupload案之所以造成如此大的風波,主要可從對用戶之影響與對整體網路環境之影響看起。在用戶方面,首要原因在於Megaupload擁有廣大用戶,美國查封Megaupload之結果,造成眾多付費用戶之權益受損,此部分將如何求償,將會是相當大的難題。其次,如前所述,本次紐西蘭法院已容許美國FBI拷貝Megaupload。其中將涉及用戶資料之探知,對此是否有適當的保護措施保障用戶隱私,將是考驗美國政府之另一難題。   至於對整體網路環境面而言,此一事件是首次針對網路平台業者 ( 網路硬碟服務商 ) ,所進行之大規模跨國查緝行動。眾多網民多形容此舉象徵著作權凌駕網路言論自由的時代已經來臨,未來網路服務業者間勢必將出現所謂的寒蟬效益。然而,有待觀察的是,本次美國司法部起訴之主要依據在於,主張Megaupload係故意利用複製、散佈盜版物,以獲取商業利益,對此美國法院是否能接受此一見解,事實上仍是未定之天。因美國司法部需說服法院,Megaupload並無善盡網路服務業者保護著作權之義務。更重要的是,僅是提供平台之Megaupload,能否被解釋侵權行為人,並非毫無疑慮。 [1]USA v Kim DotCom et al, U.S. District Court, Eastern District of Virginia, no. 1:12CR3 [2]18 U.S.C. § 371 - Conspiracy to Commit Copyright Infringement. [3]18 U.S.C. §§ 2,2319;17 U.S.C. § 506 - Criminal Copyright Infringement By Electronic Means & Aiding and Abetting of Criminal Copyright Infringement. [4]18 U.S.C. § 1962(d) - Conspiracy to Commit Racketeering. [5]18 U.S.C. §§2, 1343 - Fraud By Wire & Aiding and Abetting of Fraud by Wire. [6]18 U.S.C. § 1956(h) - Conspiracy to Commit Money Laundering. [7]“FBI told to copy seized Dotcom data”http://www.nzherald.co.nz/technology/news/article.cfm?c_id=5&objectid=10813260 (last visited 2012/06/25)

荷蘭公私協力機制PPP

  自2012年來,荷蘭政府鼓勵荷蘭科學研究機構(Netherlands Organization for Scientific Research, NWO) 隸屬教育文化科學部(Ministry of Education, Culture and Science, OCW)積極推動與9大重要領域(Top Sectors)與企業相關研究的合作,NWO同時是政策實施機構也是創新研發機構。OCW每年資助約275億歐元在重要領域,其中有超過100億歐元在協助公私協力機制 ( Public-Private Partnerships, PPP)。近年來,OCW增加編列給NWO的預算,2014年增加2千5百萬歐元;2015-2017年增加7千5百萬歐元;2018年預計增加1億歐元。PPP 參與者為研究機構(例如大學機構、公私立研究機構)及民間企業(國內國外企業皆可)。主要規範依據NWO-Framework for Public-Private Partnership,合作後以聯盟(consortium)形式運作,聯盟成員間可以契約個別約定合作內容,但相關權利義務仍須遵循NWO-Framework for Public-Private Partnership。關於既有智慧財產權之使用方式,聯盟成員間須另外約定非無償使用。為實現該聯盟之研發目的, NWO為主要出資者時,可成為該研發成果之所有人或共有人,待研發成果運用及收益可以獲得妥善安排時,得將研發成果轉讓予能將研發成果運用效益最大化之人。原則上,參與PPP的企業並不當然有優先權可將該研究成果運用於商業用途,除非參與企業出資額幾乎達到整個研發支出的百分之百,且已簽訂研發成果書面授權或轉讓契約後,始能將該研發成果運用於商業用途。

TOP