美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/02/09)
引註此篇文章
你可能還會想看
歐盟執委會宣布「軟體開源授權及複用」決定

  歐盟執委會於2021年12月8日宣布「軟體開源授權及複用」決定(COMMISSION DECISION on the open source licensing and reuse of Commission software)。本決定規範執委會軟體之開源授權條件與複用方式,其軟體開源授權流程如下: 一、執委會依本決定(下同)第5條授予其軟體的開源授權證應為歐盟公共授權(the European Union Public Licence, EUPL),除因(1)適用第三方軟體的互惠條款,而強制使用其他開源授權證,或替代開源授權證比EUPL更便於人民使用該軟體;(2)適用第三方軟體之授權條款,存在多個開源授權標準(不含EUPL),則應優先選擇授予最廣泛權利的開源授權。 二、透過第8條對智慧財產權進行核實,包括:(1)軟體識別(2)對軟體的智慧財產權進行驗證;及(3)安全驗證。 三、依第6條規定將所有開源軟體置於資料庫,供公民、公司或其他公共服務有潛在利益者取得。   另外,依第四條規定,本規則不適用於以下情形:(1)因第三方智慧財產權問題,無法允許複用的軟體;(2)該原始碼之發布或共享,對執委會、其他歐洲機構或團體的資訊系統或資料庫安全構成實質或潛在風險;(3)因法律規定、契約義務或性質,其內容須被視為機密之軟體;(4)依(EC)1049/2001第4條所列之情形,包含但不限於:因公共利益、國家安全、隱私保護、商業利益、訴訟或審計之利益等,該軟體須被排除,或只能由特定之一方取得或管理;(5)委託由執委會進行研究產生之軟體,若公開將干擾臨時研究結果之驗證或構成拒絕註冊有利於執委會之智慧財產權的理由。

德國2021年再生能源法修正草案最新發展

  德國的再生能源法(Renewable Act)在經歷過2014年及2016年兩次較大的修正後,今年度九月由部分上議院議員提出修正草案。   德國再生能源法起源於20年前,當時主要重點在於提升離岸發電、太陽光電(Solar PV)及生物氣體、水力資源對於城市用電的供應率。由於現階段德國幾乎半數的城市用電仰賴上開再生能源,因此2021年度的修法上,主要導向了協助再生能源廠得以更完善的準備進入市場,包括與現有的政策發展接軌,例如2020年的國家氫能源政策(hydrogen strategy)及電動車的電價制定等。以下將列舉數項較為重大之項目: 實現2050年碳中立的目標 結合歐盟遠大的氣候目標 擴大再生能源產能 重新制定再生能源徵收稅款 提高公眾對於再生能源的接收度 於德國南方增設更多風力發電的渦輪機及生物燃料 訂定彈性電價 提升太陽能板安裝回饋酬勞 響應氫能源政策,擬使氫能源廠商於使用再生能源時得免付費(但此項提案尚待利害關係人取得共識)。   本次再生能源法的修正提案誠然立意良善,但仍有不少批評者認為,本次修法未將日後使用再生能源的人數可能增加一事納入考量,且未將老舊風機重新供電等事納入法規中。   而根據11月份修法決議結果,德國政府並未採納上開提案,其中主要理由是認為該草案所列之內容無法達成氣候目標(climate targets),並建議該提案應擴張再生能源產能,尤其是離岸風電及太陽能。德國能源部則認為提案中所預估的2030年電力需求過低,無法切實因應未來的需求,是以,未來德國再生能源法之修法方向仍有待持續觀察。

時尚奢華品牌-Gucci與服飾品牌-Guess間之商標戰爭

  Gucci America, Inc. (Gucci) 於2009年對Guess?, Inc. (Guess)提出商標侵權訴訟,美國聯邦地方法院(United States District Court, SDNY)於2012年5月在無陪審團審判的結果下,判定Guess禁止使用「紅-綠條紋」、「G字菱形圖」、及「環環相扣的G圖」等三項商標,並須賠償Gucci 466萬美元之損害賠償。   緣,Gucci聲明Guess係惡意侵害及仿冒Gucci的商標設計,企圖造成消費者的混淆誤認,並淡化Gucci的商標權,故針對「紅-綠條紋」、「G字菱形」、「環環相扣的G圖形」、及「手寫Guess logo」等商標設計聲明其禁止銷售、販賣及使用,並主張因Guess的惡意仿冒,請求1.2億美元的損害賠償。   Guess於訴訟過程中提出抗辯,(1) Guess無理由仿冒Gucci的商標、 (2) Gucci至少超過七年以上放任Guess使用其所聲稱的Gucci商標設計且未提出訴訟;此外,(3) 消費者並不會將Guess的產品與Gucci的產品誤認,因Guess與Gucci所訴求的客戶市場並不相同。   Scheindlin法官於裁定書中敘明,Gucci無法直接證明因Guess之商標侵害造成其品牌上的極大損害,故最終損害賠償金額僅判定466萬美元 。   本案之法院結果將影響其他時尚品牌之商標或產品外觀近似的侵權案件。

美國著作權局發布2022–2026策略計畫

  美國著作權局於2022年1月20日提出2022–2026五年策略計畫,以培養創造力及豐富文化為主軸,並闡明四個總體目標:著作權服務普及、提升效率、公正專業及增進資料使用。相關內容值得持續關注後續發展,說明如下: 一、著作權服務普及   隨著數位網路技術興起,著作權局已展開如製作溝通素材、回答公眾問題、提供各式主題教育計畫等活動。後續將更專注於讓所有人盡可能了解其服務,如著作權賠償委員會(Copyright Claims Board, CCB)等,創造一個屬於大眾的著作權系統,並豐富公眾可使用創意內容的數量與多樣性。 二、提升效率   著作權局進行包括建立企業著作權系統(Enterprise Copyright System, ECS)使其服務數位化、透過改進公共資訊聯絡中心、倉庫管理和財務系統以提升效率等工程。除持續更新ECS等系統外,未來將以用戶為中心來滿足著作權界的需求。 三、公正專業   著作權局長期以來擔任國會的著作權法律顧問,處理相關立法、政策與實踐問題,並與其他行政機關、法院合作處理各式著作權疑義。除了持續透過立法推動、規則制定及研究來衡平著作權法及政策之外,著作權局將繼續在國際舞台上參與政策討論及提供教育,發揮積極作用,成為全球著作權界的資源。 四、增進資料使用   在提供服務的過程中,著作權局蒐集了各類有價值的著作權相關資訊。此外,其亦網羅與內部運營績效、網路指標有關的其他資料。著作權局將加強資料的開發和使用,並以此作為決策的論證基礎、改進組織績效衡量標準,並使內、外部受眾更容易取得該等資料。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

TOP