美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/05/23)
引註此篇文章
你可能還會想看
Nokia 出售125項專利價值120億美元

  美國NPE公司Pendrell Corporation日前宣布從Nokia收購了125項專利。根據Pendrell Corporation之發言可知,前揭125項專利當中,共有81項專利為關鍵專利(essential patent)。主要涉及領域包括運用於智慧型手持裝置、桌上型電腦、MP3播放器等電子設備的多種基礎記憶體技術,其中尚包括以SD卡為主之嵌入式快閃記憶體技術。   市場分析師預估上開技術的全球市場在今年(2013)將有超過120億美元的價值,若僅論及SD卡市場,其價值甚至在2018年將超過210億美元。   依據雙方契約內容可知,為延續Nokia位於芬蘭之研發投入,Pendrell Corporation亦已成立一名為赫爾辛基記憶體技術(Helsinki Memory Technologies,HMT)之子公司。Nokia有權使用HMT未來所收購及所開發之所有專利。又,前揭專利之授權金收入均將運用於進一步之研發活動。   Pendrell Corporation之智財長Joseph Siino則指出,將購自Nokia之125項專利與該公司原有之其他智財組合結合後,除可提供持續性創新之用以外,亦可以公平合理的價格出售給全世界對其感興趣的公司。   赫爾辛基當地律師事務所之合夥律師Jan Lindberg表示大公司將更積極於出售已非其核心資產之專利資產。但應注意對專利之鑑價時有變化。以本件為例,便應考量Nokia之在赫爾辛基交易所之市值僅餘123億美元。

歐美貿易與技術理事會發表第6次聯合聲明,確保雙方於新興技術及數位環境之領導地位

歐美貿易與技術理事會(EU-U.S. Trade and Technology Council,TTC) 2024年4月4日至5日在比利時魯汶舉行第6屆部長會議,依據會後聯合聲明,雙方針對數位轉型所帶來的機遇與挑戰,同意在新興技術和數位環境等面向促進雙邊貿易和投資、進行經濟安全合作,並捍衛人權價值。未來雙方將針對AI、半導體、量子技術和6G無線通訊系統等制定互通機制及標準,簡述如下: (1) AI技術:採取「風險基礎方法」(risk-based approach)實施「可信任人工智慧和風險管理聯合路徑圖(Joint Roadmap for Trustworthy AI and Risk Management),提高透明度以降低公民及社會使用AI的風險;更新關鍵AI術語清單(a list of key AI terms),減少雙方於概念認知上的誤差;承諾建立對話機制,以深化雙邊合作。 (2) 半導體:為促進半導體供應鏈韌性(resilience)與協調(coordination),將延長實施「供應鏈早期預警機制」(joint early warning mechanism)及「透明機制」(transparency mechanism)兩項行政安排,共同解決半導體產業市場扭曲、供應鏈過度依賴特定國家等挑戰。 (3) 量子技術:雙方將成立量子工作小組(Quantum Task Force),以制定統一量子技術標準,加速技術研發。 (4) 6G技術:雙方通過「6G願景」(6G vision),並對於未來研究合作簽署行政安排(administration arrangement),建立6G技術開發共同原則。 歐美雙方期望透過上述作法,促進半導體和關鍵技術研發和供應鏈多元化,以確保經濟安全及落實數位轉型,確保歐美於新興技術和數位環境之領導地位。

泰國計畫拍賣下世代行動通訊頻譜

  根據外電報導,泰國政府目前正在規劃,將越過3G標準,直接以拍賣方式釋出3張執照給更先進、俗稱3.9G的行動通訊技術,可能的時間點為今年9月。   泰國國家電信委員會(National Telecommunications Commission)委員 Pana Thongmeearkom於2010年5月27日表示,相較於3G技術,3.9G的技術可以提供消費者更好的資料傳輸服務;規劃釋出的執照將以15MHz為單位,期限為15年,規劃釋出的頻段主要為2.3GHz,但2.5GHz亦為另一個可能釋出的頻段。   2.3GHz目前由國營的電信業者TOT&CAT與軍方使用中,2.5GHz則由廣播電視業者使用;泰國政府預計於年底提出清空頻譜方案。   各界評估新的頻譜將允許業者佈建以LTE為基礎的電信設備。泰國三家主要行動電信業者Advanced Info Service(AIS)、Total Access Communication(DTAC)與True Move早已表態將參與競標。   泰國政府之前曾多次宣布將展開3G執照競標計畫,惟時程不斷被推遲,外界歸咎於欠缺一個整合性的獨立頻譜監理機構。對此,Pana被迫給予保證,目前泰國的政治紛亂不會影響國家電信委員會的時間表,但如果設立一個可同時監管廣電與電信頻譜的獨立機關的草案未能通過國會立法程序,釋照程序確實有可能被中斷。   LTE行動通訊技術爭取應用的頻段,在歐洲主要為2.1GHz、2.5GHz、900MHz、與800MHz,在北美為700MHz,在日本為2.1GHz。根據國際電信聯合會ITU的頻譜分配建議,相關頻段多為傳統被劃歸為廣電用途的頻段;對沒有獨立頻譜監理機制的國家而言,相關頻譜的收回與再釋出均可能面臨如泰國政府一樣的挑戰。

國衛院生物製劑先導工廠 三年內投產

  慶祝國家衛生研究院成立十周年,國衛院表示將規劃成立生物製劑先導工廠,今年可發包動工,預計三年內完成,未來除了生產台灣本土性傳染病所需疫苗外,也協助衛生署流感疫苗自製計劃提供技術來源。行政院核准通過十二億元的生物製劑先導工廠,目前已進入招標階段,預計六、七月份可正式動工,預計三年後完工投產,未來將成為符合聯合國國際疫苗中心 (The International Vaccine Institute, IVI) 的規格的 GMP 生產線。   此外,配合衛生署的公共衛生計劃,國衛院疫苗研發中心也將建立本土性傳染病如腸病毒、 SARS 、白喉、百日咳、破傷風及日本腦炎的資料庫,部份疫苗市場潛力發展有限,但是透過國衛院的保存,讓我國具備完整的疫苗量產能力。政府計劃投資五十億元興建大型流行感冒疫苗工廠,國衛院將扮演技術提供的角色,包括參考實驗室,人員訓練,及微生物量產疫苗的開發,都將由生物製劑先導工廠負責。

TOP