美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=0&tp=1 (最後瀏覽日:2025/05/21)
引註此篇文章
你可能還會想看
韓國提出一系列新創支援措施,以躋身全球四大新創強國為目標

  韓國中小企業暨新創事業部(Ministry of SMEs and Startups)於2021年8月30日發布「使韓國躋身全球四大新創強國之新創支持措施」(Venture Complementary Measures for Korea to Become One of the Top 4 Global Venture Powerhouses)。韓國總統文在寅指出,第二波創業爆發期為立基於西元2000年的第一波創業爆發期之上,如今韓國企業數量較當時已增加四倍,創投投資額更突破4兆韓元,顯示韓國新創的蓬勃發展潛力。為了能在政策面有效支持韓國新創能在第二波創業爆發期(Second Venture Boom)獲得所需的人才與資金,韓國中小企業暨新創事業部規劃三大面向、十二項任務作為推動韓國躋身全球四大新創強國之新創支持措施:   在打造韓國新創國際競爭力面向,推動股票選擇權改革、全面修正《促進新創事業發展特別措施法》並廢除落日條款、提高由政府對高科技新創公司貸款提供擔保的技術擔保(technology guarantee)額度上限至200億韓元、安排國際創投媒合價值1兆韓元的全球創投資金,以及配合全球關注ESG趨勢,以碳價值(carbon value)評估為基礎,提供價值5000億韓元的氣候應對保證(climate response surety)。   在擴大創業投資市場面向,包含創造私人基金投資的誘因及允許對特定智慧財產權進行投資、進行矽谷式的(Silicon Valley-type)創投基金監管、為早期新創公司引進一兆韓元的創投資金,以及提供創業加速器租稅減免等措施。而在多元化新創出場措施面向,則規劃新增技術創新併購擔保以及增加新創併購基金、給予更多併購租稅優惠,以及提供價值1000億韓元的出場基金等。   韓國中小企業暨新創事業部指出,在第一波創業爆發期中,韓國新創打下了良好基礎,為了把握第二波創業爆發期的發展機會,韓國政府將加強與民間合作,以發展新創來創造就業機會並作為國家發展動能。為了達成躋身全球四大新創強國的目標,中小企業暨新創事業部將全力協助人才與資金的募集,從而完善韓國的新創生態系資源。

英國Ofcom準備展開全國性的WhiteSpace測試應用

  為了增進無線頻譜的使用效率,各國紛紛針對閒置頻譜(White Space)的應用進行討論與發展,除美國已經制定出相關的技術參數與管制規則,並展開全國性的測試外,英國也在多次的公開諮詢與規則修訂後,準備展開全國性的測試應用。   閒置頻譜係指已經指配於特定用途之無線頻段,但因各種因素(如地理地形、人口分布),而在部分地區閒置未使用(即獲得頻譜使用權之業者,在當地並未提供訊號覆蓋);或者因避免頻譜間訊號干擾,而特意保留的空白區塊(以電視頻道為例,為了避免訊號互相干擾,故於頻道1與頻道3播送電視節目,而頻道2則保留空白。)由於無線通訊技術的提升,可藉由天線高度、訊號發射功率、與主要基地臺保持距離等方式,將這些閒置的頻譜區塊進行利用。   由於閒置頻譜屬於已經指配用途、發出執照的頻段,故存在著眾多的既有使用者,閒置頻譜的開放使用必須保障既有使用者不受到有害干擾。英國在2010年至2012年間已經進行多次的公開諮詢與技術發展,故相關的技術參數與管理規則已經原則上確定,但因配合歐盟整體的頻譜政策規劃,故仍暫時不開放商業使用,為了進一步確定White Space在英國的可用性,也為了測試對既有服務的干擾程度,Ofcom決定展開全國性的測試。   本次干擾測試的重點有三: 1. 針對節目製作與特殊事件(program making and special events,PMSE):PMSE泛指獲得無線頻譜使用執照的既有使用者,可能使用無線麥克風、無線攝影機或戶外無線廣播裝置,因此White Space的開放,必須避免對這些既有的使用者造成有害干擾。 2. 數位地面電視(digital terrestrial television,DTT):DTT是無線數位電視,也是最重要的既有使用者,White Space的開放除必須遵照嚴格的技術參數外,也必須避開無線電視台的發射站。 3. 其他鄰近UHF電視頻段的無線服務。   Ofcom指出,各地閒置頻譜的情況不同,如在倫敦地區,對DTT的干擾較低,但格拉斯哥(Glasgow)則相反;而在PMSE的部分,倫敦市中心(如溫布敦球場)則有相當多的節目轉播、無線廣播的使用。Ofcom計畫透過本次測試,瞭解英國各地White Space的使用潛力,屆時將收集英國各地的試點與服務業者的服務品質、功率設定、區域大小與可用的時段,以確保不會發生有害的干擾,整體試驗將持續至2014年夏季。

三菱電機子公司三菱電機informationsystems公司所研發的圖書館系統發生個資外洩事件

  三菱電機informationsystems公司所研發用於圖書館的系統封包MELIL/CS造成引進系統的圖書館發生個人資訊外洩與Web館藏檢索系統當機的系統障礙。從2010年7月到9月因系統障礙,總共有3間圖書館,共2971人的姓名、出生日期、住址、電話及圖書名稱等個人資料外洩。   有關個人資料外洩的經過,是因為三菱電機informationsystems公司在研發MELIL/CS系統時,先在引進系統的圖書館進行系統測試,於測試之後再將系統程式帶回公司修改,此時就不知情的將存有個人資料的程式帶回公司,也把這些資料登錄到產品的原始碼上。因此將進行測試的2間圖書館使用人約210人的個人資料登錄於該產品的原始碼上。 但發生個資外洩的直接原因更在於負責三菱電機informationsystems公司產品運作、維修的銷售伙伴千代田興產公司,該公司所設置的伺服器完全沒有設定權限區分,甚至不需密碼就可以連接該公司伺服器存取資料。因此發生第三人進入該公司伺服器,下載3個引進該系統圖書館約3000人的個人資料。   另外對於Web館藏檢索系統當機的發生,是因為圖書館使用人為了獲取圖書館新增加館藏圖書的資訊,以自動蒐集資訊程式直接存取館藏資料庫所發生。三菱電機informationsystems公司當初在設定網路連接圖書館系統,是以一次存取可以連接10分鐘的方式,所以只要以連接頻率高的機械性存取,只要超過資料庫的同時連接數的設定數值,就會發生存取障礙。   對於三菱電機informationsystems公司系統設計失當及千代田興產公司未設定伺服器存取權限所造成個人資料外洩事件,因為這兩家公司都是屬於財團法人日本情報處理開發協會(JIPDEC)的取得隱私標章企業,所以由JIPDEC依據隱私標章營運要領中的「有關賦予隱私標章規約」第14條規定,各處以由2011年1月起3個月的隱私標章停權處分。

日本公正取引委員會啟動以交易優勢不當攫取新興智慧財產之實況調查

  日本公正取引委員會(下稱公取委,其性質等同於我國公平交易委員會)在2019年12月11日的定期記者會上表示,由於近年出現許多關於「智慧財產及knowhow保護不足」的聲音,因此將針對大型企業在與新創、新興企業進行共同合作或研究時,是否有濫用優勢地位不當掠取智慧財產權及專業知識技能(knowhow)的情形,啟動實況調查。   公取委將以書面方式,針對日本國內約1萬家創業10年以內的IT製造新創產業與大企業間交易之實況進行調查。相關報導整理了以下幾種常見的問題交易型態: 獨占智慧財產:(1)契約約定大型企業無須經新興企業許可,即可逕自申請專利;(2)共同研究成果全歸大型企業所有;(3)要求無限制的無償授權。 限制與他人合作:(1)長時間禁止新興企業與其他業界合作;(2)相關專利遭到大企業所限制,導致事業無法拓展。 強勢締約:(1)大型企業對於契約的意思決定過於緩慢;(2)直接交付簽訂好的紙本契約,並告知不得變更契約內容。   公取委表示,因為新興企業具有開放式創新的價值,在與大型企業進行合作時,對於國家產業發展及競爭力的提升,能發揮很大的貢獻。因此藉由實態調查,確保建構出一個自由、公平的良性競爭環境,並預計在2020年依據調查結果,擬定相關指引或方針。

TOP