在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。
美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。
與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。
但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。
英國通訊傳播管理局(The Office of Communications, Ofcom)於2024年5月21日發布「行動網路與Wi-Fi混合共享上層6 GHz 頻段之重要性」(Mobile and Wi-Fi in Upper 6 GHz: Why hybrid sharing matters)文件,指出為促進稀缺頻譜資源有效利用,需實施創新頻譜共享機制,以便為更多用戶提供服務。有鑑於2023年世界無線電通訊大會(World Radiocommunication Conference 2023, WRC-23)決議上層6 GHz(6425-7125 MHz)為國際行動通訊(International Mobile Telecommunications, IMT)使用頻段,同時承認該頻段可供Wi-Fi等無線接取系統(wireless access systems)使用,因此Ofcom初步探索出兩種可能分割方式,並於文件中分享,期望透過靈活混合共享機制,在與其他既有使用者共存之同時服務更多用戶: 1.可變頻譜分割(Variable spectrum split): 此方法將上層6GHz分割為Wi-Fi及行動網路優先頻段,Wi-Fi和行動網路可於各自優先頻段中自由布建,亦可於不干擾對方之前提下,於對方之優先頻段布建。 2.室內外分割(An indoor/ outdoor split): 此方法以建築物做為兩技術運作之分界,於室外及淺層室內(shallow indoor)區域布建6GHz行動網路,以降低既有3GHz行動通訊服務之負載;6GHz覆蓋不到之範圍,則仍由3GHz提供服務。室內大部分區域則分配給Wi-Fi布建,降低兩技術重疊布建情形,確保資源有效運用。 未來Ofcom將持續與業界合作開發其他混合共享框架技術與解決方案,計劃於2025年發布有關此主題之技術報告,早日實現行動網路與Wi-Fi之共享機制。
韓國修法簡化"孤兒著作法定授權程序"韓國著作權法施行令於今年(2012)4月12日修正,10月13日施行,其中值得注意的地方就是簡化「孤兒著作法定授權程序」,目的就是要改善孤兒著作授權,耗時過長的問題。在韓國,一般來說,取得孤兒著作授權要花2個月以上時間,而且對申請人而言,最困難的地方在於要證明已盡一切努力搜尋權利人未果,所以過去10年(2001~2011)內,只有37件孤兒著作獲得授權。 韓國孤兒著作法定授權程序之簡化內容為:除申請人可自行證明已盡相當努力外,政府可代為證明已盡相當努力,亦即只要符合「查詢著作權登記簿」、「查詢著作權集體管理團體之權利資訊目錄」、「著作在『尋找權利人資訊系統』公告3個月以上」等法定要件,即可認定已盡相當努力,直接准予授權使用孤兒著作。其目的主要就是要增進使用孤兒著作的便利性。 前述之「尋找權利人網站」:www.findcopyright.or.kr,係由韓國著作權委員會建置,申請人亦可在網站上申請孤兒著作授權。手續費每件1萬韓圜(相當於新台幣287.9元)。
由Meta案看數位資料商業化面臨之跨國問題於2023年5月22日愛爾蘭資料保護委員會(Ireland's Data Protection Commission, DPC)對於Facebook的母公司Meta將歐盟境內資料傳輸到美國的行為做出開罰12億歐元的決定,並暫停資料跨境傳輸行為,再次引起了各界對於資料跨境傳輸的關注。 針對跨國提供網路服務的企業,如何確保企業處理資料的方式可以符合多國的法規要求,向來是一困難的問題。自從2015年「安全港隱私準則」(Safe Harbour Privacy Principles)被歐盟法院宣告失效後,美國與歐盟試圖就資料跨境傳輸重新達成一個可符合雙方要求的框架,包含2020年被歐盟法院宣告無效的「隱私盾框架」(EU-US Privacy Shield Framework),而2022年3月雙方達成原則性同意的歐盟美國資料隱私框架(EU-U.S. Data Privacy Framework, DPF),惟就美國於同年10月發布用以實施之行政命令(EO 14086),亦於2023年5月被歐洲議會認為對於歐盟境內資料的保護不足。 2023年6月8日英國跟美國共同發布建立英美資料橋(UK-US data bridge)的聯合聲明,以建立起英美之間的資料流動機制,但該英美資料橋是基於歐盟美國資料隱私框架做進一步的擴展,能否符合歐盟對於資料保護的要求,目前尚無法預期。 目前的商業模式中資料跨境傳輸是難以避免的現實困境,各國亦就資料跨境傳輸建立框架,企業需持續關注自身營業所在地之法規變化,以即時因應調整自身管理機制。 本文同步刊登於TIPS網站(https://www.tips.org.tw/)