美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/01/12)
引註此篇文章
你可能還會想看
美國參議院司法委員會通過草案 擬規範學名藥給付延遲訴訟和解協議

  為禁止藥廠間持續利用「給付遲延和解協議」(pay-for-delay settlements)來延遲低價學名藥品上市,美國參議院司法委員會(Senate Judiciary Committee),日前已表決通過由參議員Herb Kohl 所提之「保障低價學名藥品近用法草案」 (Preserve Access to Affordable Generic Drugs Act 【S. 369】),並已提交兩院,進行後續之討論及審查。而就該新法草案內容,大致上,是為解決品牌藥廠因採逆向給付(Reverse Payment)和解協議以阻礙學名藥品上市時,將帶來長期用藥與醫療成本增加等問題之目的而設。   而就前述所提及之訴訟協議模式來說,原則上,在品牌藥商為解決藥品專利訴訟問題之前提下,透過給付學名藥品廠商數百萬美元報酬(即補償金)之方式,來做為換取學名藥廠同意並承諾願將該公司學名藥產品延緩上市條件之對價,並藉此以保存系爭藥品原先既存之市場利潤。而對此類將嚴重影響大眾日後近用低價藥品權益之和解協議,美國聯邦貿易委員會(Federal Trade Commission;簡稱FTC)業已於近期內,作出完整之分析報告,其指明,若政府能終止此類和解協議,除將可於往後十年間,可為聯邦政府減低近120億美金之預算支出外;同時,亦可為民眾節省下近350億美金之醫療成本。   此外,由於受FTC該份分析報告之影響,於先前司法委員會之表決過程中,委員對此類訴訟和解所採之態度,也產生重大轉變,亦即,其從最初肯認可提出充分證據並證明將不會損及正常藥廠間競爭之和解協議,轉而改為,應嚴格限制此類訴訟和解協議之產生;同時,為嚇阻藥廠間給付遲延訴訟協議之達成,於此項新法草案中,亦新增相關處罰之規定。   最後,參議員Kohl強調:「一旦此項草案通過,除將可終結過往那些罔顧消費者權益之不當競爭行為外;從長期影響之角度來看,該法案亦可為公眾省下每年約數十億美金之用藥花費」。。

網路服務提供者於2016中國大陸反恐法下之通報義務

  中華人民共和國第12屆全國人民代表大會常務委員會第18次會議於2015年12月27日通過並公布《中華人民共和國反恐怖主義法》(以下簡稱反恐法),並自2016年1月1日開始施行。反恐法第18條與第19條要求電信業務經營者與互聯網服務提供者,應當為公安機關、國家安全機關依法進行防範、調查恐怖活動「提供技術接口和解密等技術支持和協助」,並應當依照法律與行政法規規定,「落實網絡安全、信息內容監督制度和安全技術防範措施,防止含有恐怖主義、極端主義內容的信息傳播;發現含有恐怖主義、極端主義內容的信息的,應當立即停止傳輸,保存相關記錄,刪除相關信息,並向公安機關或者有關部門報告。」倘有違反以上規定且情節嚴重者,反恐法第84條授權由主管部門對該公私處50萬人民幣以上罰款,並對該公司直接負責之主管人員與其他直接責任人員處10萬元人民幣以上50萬人民幣以下罰款,並可由公安機關對該等人員處5日以上15日以下之拘留。   我國刻正進行資通安全管理法之制定,以為範圍更廣之資訊基本法的作用法。資通安全管理法當中考量納入與關鍵基礎建設相關之民間產業,使之成為資安通報之一環,政府需要民間企業配合時也將於法有據。於恐怖攻擊事件頻傳之今日,倘我國需要就此等事件要求電信業者或服務提供者進行通報時,相關國際立法例及其實踐,即值參酌。

英國發布國家資料戰略(National Data Strategy)

  英國數位、文化、媒體暨體育部(Department for Digital, Culture, Media & Sport)於2020年9月9日發布「國家資料戰略」(National Data Strategy),作為英國規劃其政府資料流通運用的整體性框架。數位、文化、媒體暨體育部長Oliver Dowden表示,資料為驅動現代社會經濟發展的關鍵。於今年COVID-19的全球疫情流行期間,政府、企業、組織等彼此及時共享重要資訊,除達成了防疫目標,更維繫了各層面的經濟生活。因此,本戰略則規劃活用此段期間獲得的知識與經驗,試圖透過資料的釋出流通與運用,讓英國經濟自COVID-19疫情中復甦,提高生產力與創造新型業態,改善公共服務,並使之成為推動創新的樞紐。   為優化英國資料的運用,本戰略提出了四個核心面向:(1)資料基礎(data foundation):資料應以標準化格式,且符合可發現(findable)、可取用(accessible)、相容性(interoperable)與可再利用(reusable)的條件下記載;(2)資料技能(data skills):應藉由教育體系等培養一般人運用資料的技能;(3)提升資料可取得性(data availability):鼓勵於公共、私人與第三部門加強協調、取用與共享具備適切品質的資料,並為國際間的資料流通提供適當的保護;(4)負責任的資料(responsible):確保各方以合法、安全、公平、道德、可持續、和可課責(accountable)的方式使用資料,並支援創新與研究。   基此,本戰略進一步提示了五個優先任務:(1)釋出資料的整體經濟價值:建立適切的條件,使資料在經濟體系內可取得且具備可取用性,同時保護私人的資料權(data rights)、以及企業的相關智慧財產權;(2)建構具發展性且可信賴的資料機制:協助企業家與新創人士以負責任及安全的方式使用資料,避免產生監管上的不確定性或風險,並藉以推動經濟發展。同時,也期待藉由機制的建立,鼓勵公眾參與資料的數位經濟應用;(3)改變政府運用資料的方式,提升效率及改善公共服務:以COVID-19疫情期間政府對資料積極運用為契機,推動政府間的整體資料有效管理、使用與共享措施,為相關作法建構一致性的標準與最佳實踐方式;(4)建立資料基礎設施的安全性與彈性:資料基礎設施為國家關鍵資產,應避免其遭遇安全或服務中斷的風險,進而導致資料驅動的相關業務或組織服務中斷;(5)推動國際資料流(international flow of data):與國際夥伴合作,確保資料的流通運用不會因各地域的制度不同,而受到不當限制。

泰國計畫拍賣下世代行動通訊頻譜

  根據外電報導,泰國政府目前正在規劃,將越過3G標準,直接以拍賣方式釋出3張執照給更先進、俗稱3.9G的行動通訊技術,可能的時間點為今年9月。   泰國國家電信委員會(National Telecommunications Commission)委員 Pana Thongmeearkom於2010年5月27日表示,相較於3G技術,3.9G的技術可以提供消費者更好的資料傳輸服務;規劃釋出的執照將以15MHz為單位,期限為15年,規劃釋出的頻段主要為2.3GHz,但2.5GHz亦為另一個可能釋出的頻段。   2.3GHz目前由國營的電信業者TOT&CAT與軍方使用中,2.5GHz則由廣播電視業者使用;泰國政府預計於年底提出清空頻譜方案。   各界評估新的頻譜將允許業者佈建以LTE為基礎的電信設備。泰國三家主要行動電信業者Advanced Info Service(AIS)、Total Access Communication(DTAC)與True Move早已表態將參與競標。   泰國政府之前曾多次宣布將展開3G執照競標計畫,惟時程不斷被推遲,外界歸咎於欠缺一個整合性的獨立頻譜監理機構。對此,Pana被迫給予保證,目前泰國的政治紛亂不會影響國家電信委員會的時間表,但如果設立一個可同時監管廣電與電信頻譜的獨立機關的草案未能通過國會立法程序,釋照程序確實有可能被中斷。   LTE行動通訊技術爭取應用的頻段,在歐洲主要為2.1GHz、2.5GHz、900MHz、與800MHz,在北美為700MHz,在日本為2.1GHz。根據國際電信聯合會ITU的頻譜分配建議,相關頻段多為傳統被劃歸為廣電用途的頻段;對沒有獨立頻譜監理機制的國家而言,相關頻譜的收回與再釋出均可能面臨如泰國政府一樣的挑戰。

TOP