在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。
美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。
與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。
但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。
歐盟普通法院(EU General Court)於2024年6月5日宣告McDonald’s(後稱麥當勞)在與競爭對手愛爾蘭速食品牌Supermac's的訴訟中,失去其「Big Mac」(又稱「大麥克」)之部分商標權,即無法將「Big Mac」商標用於雞肉三明治等家禽類商品與餐廳內用及得來速外帶等餐飲服務上。 此案件起因於Supermac's公司拓展事業版圖進入歐盟市場,將公司品牌名稱「Supermac's」申請註冊歐盟商標,而麥當勞則主張消費者可能與其於1996年取得之「Big Mac」歐盟商標產生混淆誤認。然而,Supermac's於2017年向歐盟智慧財產局(European Union Intellectual Property Office,後稱EUIPO)以「麥當勞未真實使用(genuine use)『Big Mac』商標逾五年」為由,申請廢止麥當勞之「Big Mac」註冊商標。EUIPO於2019年廢止「Big Mac」商標於部分類別的註冊,惟EUIPO仍允許麥當勞仍可將「Big Mac」商標用於雞肉三明治、其他家禽產品及餐廳服務上。 爾後,Supermac's向歐盟普通法院提出上訴,而歐盟普通法院於2024年6月認為,麥當勞未能證明其於連續五年間有將「Big Mac」商標「真實使用」於雞肉三明治、家禽商品或餐廳服務的使用程度(例如:銷售量、商標使用期間長短及使用頻率等),故認定麥當勞不得再將「Big Mac」商標用於雞肉三明治、家禽商品或餐廳、得來速或外帶等服務上,惟本案尚未確定,而可再就法律問題上訴,故仍可持續關注本案的後續發展。 企業可從本案了解到當品牌標識成功註冊為商標後,務必留意各國所規範之連續使用年限(例如若連續五年未使用歐盟商標,則可能有被商標廢止之風險),以及明確留存足以佐證「真實使用」於註冊所指定之類別與品項之使用證明,以維護品牌商標之保護。
Google提供免費大量的專利及商標資料美國專利商標局(下稱USPTO)於6月2日和Google簽訂一協議,為期兩年Google將免費協助USPTO提供超過10TB(terabytes)大量的專利及商標相關資訊,提供使用者一次下載大量資料。其下載網站為http://www.google.com/googlebooks/uspto.html,該網站載明,所有的原始資料都來自於USPTO,Google未修改任何資料,只將檔案轉為zip壓縮檔。 早期專利及商標的資料是由使用者付費後方可由政府的DVD取得,所以公司往往花費龐大的費用在於取得所需要的資料。 USPTO表示,IP群體渴望USPTO可提供大批機器可閱讀的格式,然而USPTO未具備相關的技術能力。目前此協議是過渡的解決方案,USPTO正發展策略,希望未來能讓合作承包商獲得大量專利商標相關資料,並提供給大眾使用。 Google工程經理Jon Orwant表示,Google非常高興能與USPTO合作,以促進專利及商標資料更具存取性(accessible)及有用性,更重要的為,使公開的資料更容易蒐集與分析。 為可經由Google下載相關專利及商標資料,包括已獲證圖像(grant images),已獲證全文(grant full text),已獲證目錄資料(grant bibliographic data),已公開申請案(published applications),轉讓(assignment),維護費用事項(maintenance fee events),USPTO Red Book及分類資料(classification information)等。USPTO表示,未來將與Google再合作提供額外的資料,包括專利及商標申請歷史檔案及其相關資料。
自由軟體運動燒向BIOSBIOS是「基本輸出/輸入系統」(Basic input/output systems)的簡稱,這種在所有應用底層的軟體,過去以來PC廠商一向自我保護相當嚴密,而且還需要用到專門設計BIOS的公司。而現在,一些批評開始希望逼迫業界放棄其機密,這些批評宣稱,客戶應該可以自由發開自己的選擇方案,確保可以控制自己的裝置──也就是說,可以讓他們自由取得BIOS資訊。 「我們需要自由的BIOS,因為如果我們無法控制BIOS,就無法控制電腦。」自由軟體基金會(Free Software Foundation)總裁Richard Stallman表示。BIOS自由軟體計畫開始於BIOS史上的第一波改革──當時軟體程式碼希望轉向新的「可延伸式韌體界面」(Extensible Firmware Interface,或簡稱EFI)。另一方面,PC硬體安全功能的一些計畫也讓Stallman等一類團體批評指出,消費者對於自己的裝置缺乏主控權,希望能夠公開BIOS撰寫規格,可讓消費者能夠自行安裝、修改,及再發佈BIOS軟體──雖然不見得會是免費的。更重要的是,將可讓使用者避開未來一些可能的安全強化功能,例如廠商用控制文件使用方式的數位版權管理功能。 已有許多廠商宣稱,BIOS的自由軟體純粹只是為了自由而自由,對於電腦使用者沒什麼意義。BIOS廠商的高層及晶片巨子英特爾都表示,由於目前業界對BIOS的控管嚴密,也才能夠保有PC的安全和穩定,同時可藉由對一些廠商IP(智慧財產權)的保護以促進市場競爭。有些人則認為,對於BIOS的嚴密保護,有助於防止駭客攻擊。 英特爾則已經提出了折衷的方案──名為Tiano的開放原始碼技術。Tiano是為了取代BIOS的一種框架工作,希望透過EFI,讓PC零件以自己的驅動程式來啟動零件。英特爾的這項計畫為BIOS的汰換工作建立了一個框架,因此可能成為BIOS自由軟體的基礎。但是它把PC零件初始化用的程式碼撰寫工作留給了軟體的下載者。但Stallman依然宣稱英特爾做得不夠,且BIOS廠商其實是多餘的,他希望看到資訊釋出。