美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/06/03)
引註此篇文章
你可能還會想看
美國藥品CGMP規範關於製劑部分修正之觀察

  美國食品及藥物管理局(Food and Drug Administration,FDA)於2008年9月8日針對現行優良藥品製造作業規範(Current Good Manufacturing Practice In Manufacturing, Processing, Packing or Holding of Drugs,藥品CGMP規範)中關於製劑的部分,公布了最新修正規則,並在同年的12月8日正式實施,希冀藉此能與其它FDA規範(例如:品質系統規範﹙the Quality System Regulation, 21 CFR part 820﹚)和國際性的CGMP標準(例如:歐盟CGMP規範﹙the CGMPs of the European Union﹚)相調和。   本次修正係採漸進式,而非一次性的方式為之,主要針對無菌處理(aseptic processing)、石棉過濾裝置(asbestos filters)之使用、以及第二者驗證(verification by a second individual)等做修正。   首先,針對無菌處理部分,要求設備及器具必須清潔、保養,且視藥品的本質不同,予以消毒和(或)殺菌,以避免故障或污染。對於可能遭微生物污染致影響其預定用途之原料、藥品容器或封蓋,要求應於使用前經過微生物檢驗。此外,尚新增生物負荷量測試(bioburden testing)於管制程序的列表中,以保障每批藥品之均一及完整性。   其次,關於石棉過濾裝置之使用方面,回應一直以來所存在著將使用於生產液態注射劑產品(liquid injectable products)之過濾裝置規範更現代化的需求,本次修正明訂,於今後禁止使用石棉過濾裝置,同時,亦將石棉過濾裝置於非纖維釋出性過濾裝置的定義之中刪除。   最後,有關第二者驗證部分,因應生產過程逐步自動化的潮流,本次修正於原有規範下增設規定指出,如以自動化設備執行秤重、測量、分裝、產量計算、設備清潔與使用記錄、生產與管控紀錄等之工作,且符合相關條文要求,並有一人檢查該設備是否如預設正常運作,則視為合乎原有規範下須有一人操作另一人檢查之規定。亦即修正後之執行,只需一人加以確認該自動化設備是否適當運作即為已足,毋須就過程中的每一步驟加以檢視,避免多餘人力之浪費。   總括來說,本次修正確保法規確實涵蓋現行業界的操作實務,同時並確立FDA將藥品CGMP規範與以現代化,並與國際標準調和之目標,為以漸進方式修訂藥品CGMP規範跨出重要的一步。

2005 台日科技高峰論壇 揭示綠色環保的新契機

  「 2005 台日科技高峰論壇」於本﹙九﹚月 16 、 17 日在台北圓山飯店盛大展開,與會者包括台日高階產官學研代表,分就環境政策、環保科技及綠色產品等議題進行交流,研擬未來可能進行的合作模式。   於第一天開幕式中,亞東關係協會科技交流委員會主任委員蕭萬長即表示,藉由科技論壇可以增加政策和策略的相互了解,並減少重複浪費的研發 ; 藉由知識相互激盪可以維持競爭力和高度經濟成長,創造雙贏的局面。日本交流協會台北事務所的池田維代表則指出,先前日本於八大工業高峰會議中所倡議的 3R(REDUCE 、 REUSE 、 RECYCLE) 觀念,獲得各國極力贊成,他希望將日本特性表現在本次研討內容中,以加強彼此合作。   台日科技高峰論壇從 2003 年 4 月成立後,今年乃第三度在台灣舉行,與會貴賓包括日本眾議員水野賢一﹙ Mizuno, Kenichi ﹚ , 以「日本環境政策」發表專題演說;地球環境戰略研究機關理事長森 ( 山鳥 ) 昭夫﹙ Morishima, Akio ﹚則以「建構環保型產業」為題,自法律觀點說明,日本政府如何透過修訂法規之方式,逐步落實 3R 理念及其他永續發展措施;除此之外,日本 JST 、東京大學、北九州市立大學、日立製作所、東元電機、豐田汽車、福特六和汽車等台日環保科技代表亦分就「綠色產品」、「環保科技」等面向擬定專題發表談話。預料本次研討內容,對於未來台日科交流將能形成實質的幫助 , 並為未來科技發展指出綠色環保的新契機。

歐盟《企業永續盡職調查指令》草案,將永續治理內化至企業經營

  歐盟執委會(The European Commission)於2022年2月23日發布《企業永續盡職調查指令》草案(Proposal for a Directive on corporate sustainability due diligence),其目的在於促進永續及負責任企業行為,並使企業將人權與環境考量內化至企業營運與公司治理。   本指令要求各歐盟成員國,須確保企業確實執行人權及環境盡職調查,具體要求企業之作為如下: (1) 將盡職調查納入公司政策(第5條); (2) 採取適當的措施,以鑑別企業自身或子公司於營運及其既有商業關係價值鏈之現有或潛在的不利衝擊(adverse impacts)(第6條); (3) 採取適當措施,預防及減緩潛在的不利衝擊,並消弭現有不利衝擊或縮小其影響範圍(第7、8條); (4) 建立並維持申訴制度,確保受前述不利衝擊影響或有相當理由信其將受影響之人、價值鏈中之工作者代表以及關注相關領域的民間社團等利害關係人之申訴管道暢通(第9條); (5) 定期針對自身及子公司之盡職調查政策及措施進行評估,以確保其有效性(第10條); (6) 企業須於每年4月30日前揭露盡職調查相關資訊,受《企業永續報告指令》(Corporate Sustainability Reporting Directive, CSRD)規範之企業須於企業年報中揭露,其他企業則須於企業網站揭露(第11條)。   另一方面,本指令也明定公司董事義務,依據第25、26條,董事於其決策過程須考量短、中、長期之人權、氣候及環境因素;企業亦須指定部分董事負責盡職調查相關治理作為,並定期向董事會進行報告。   適用本指令的歐盟企業有兩種:(1) 員工人數500人以上且全球年營業額1億5,000萬歐元以上之大公司;(2) 員工250人以上之且全球年營業額4,000萬歐元的高衝擊產業(如:紡織、農業、採礦業等)。另外,非歐盟企業若符合前述員工人數之要求,且於歐盟境內之營業額達到前述標準,亦適用本指令。

美國法院於 8 月 9 日判決「隱私權合理期待不及於網際網路用戶資訊」

  在 Freedman v. America Online 一案中,原告 Freedman 使用 AOL(ISP 業者 ) 的電子郵件帳號匿名寄送一封載有「末日近了 (The end is near) 」之郵件給另外兩個康乃迪克州之居民,該郵件之收文者將其視為對於安全威脅之信件並立即報警處理。警員 Young 和警官 Bensey 雖製作了筆錄與提出搜索令 ( 授權令 ) 之申請,然而在將該等文件送交州檢察官辦公室並經同意前, Young 即將該等文件傳真給 AOL 法務部門,一周後 AOL 即提供 Freedman 之姓名、地址、電話號碼與其他許多與原告之 AOL 電子郵件帳號有關之訊息,原告因而提起訴訟,主張提供其帳戶資料之行為侵犯其隱私權,已違反美國憲法修正條文第四條。   法院認為在美國憲法修正條文第四條之意旨下,網路使用者不能合理期待其用戶資訊為其隱私權所及範圍,主要理由為當網路使用者申請使用服務前,用戶本身已在其本身知悉之情況下將其資訊提供給 ISP 業者,使該 ISP 業者得以提供相關服務,且 AOL 已在其使用合約中註明,倘於其用戶或他人受有人身威脅 (physical threat) 之個別案例之情況下 ( 如同本案例事實 ) , AOL 將提供用戶資訊,而「電子通訊隱私權法案 (The Electronic Communications Privacy Act) 」第 2510 條以下條文亦規定,於有人身損害之虞 (the risk of physical injury) 之情況下,用戶資料之揭露即具正當性。

TOP