美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/01/28)
引註此篇文章
你可能還會想看
歐盟2019電子政府基準報告

  歐盟執委會(European Commission, EC)於2019年10月18日發布電子政府基準報告(eGovernment Benchmark 2019: trust in government is increasingly important for people)。電子政府基準是歐盟的年度檢測工具,用以確認公部門中資通訊技術使用狀況,亦是歐盟2016-2020年的重點政策之一:2016年4月,歐盟執委會發布「歐盟e政府四年行動計畫」(EU eGovernment Action Plan 2016-2020),歐盟應致力落實「公共行政現代化」、「跨境數位行動服務」和「加強公部門與公民和企業的數位互動」等三面向。電子政府基準報告即因應此一政策方向而生。   電子政府基準的評測指標有四:以使用者為中心(User centricity)、透明度(Transparency)、跨境移動(Cross-border mobility)、其他關鍵促成因素(Key enablers)。報告中評估2019年總體表現最佳的國家是馬爾他、奧地利等;立陶宛和芬蘭等國則為其次;表現低於平均者則多為東南歐國家。報告中亦提到,現階段公民已十分容易在機關官網上取得所需資訊,但相較於提供給一般公民的服務,機關官網對企業提供之服務通常更加完整及清楚。另外,在推行各項電子政府措施時,公民對政府的信任益發重要。唯有公民信任該機關,包含對機關安全在線服務、個人資料透明度、公共網路安全等的信賴,機關數位化改革才能常態運作。因此,電子政府的發展是建立在人們信任相關數位服務,並與政府交流時更容易知悉並利用該服務。   再觀我國電子化政府之發展,自民國87年至今已進入第五階段。初期致力建設政府骨幹網路和電子認證、90年代持續深化及擴大政府網路應用,並推動10大旗艦計畫實現網路政府主動、分眾、持續及紮根之服務。101年後建構電子化政府之設備、網路和應用服務,發展資訊服務系統整合、全程服務及跨部門協調。近期分別有「第五階段電子化政府計畫-數位政府」和「服務型政府推動計畫」,以資料驅動、公私協力、以民為本之核心理念,透過巨量資料、開放資料和服務個人化等工具,發展跨機關一站式整合服務及打造多元協作環境,落實數位政府服務。

加拿大針對奈米科技提出評估與建議報告

  在奈米產品開創新生活態樣的同時,也因為奈米材料相異之運用途徑,產生了管理上的困難。儘管如此,新興科技仍應就風險而設計因應之道,並著眼於鑑別奈米材料潛在之危險性、瞭解人體暴露於奈米微粒環境之程度,以及確認適當之評估策略。   加拿大學術議會(Council of Canadian Academies)於2008年7月公佈奈米研究報告「微小即不同:由科學觀點看奈米法制之挑戰(Small is Different: A Science Perspective on the Regulatory Challenges of the Nanoscale)」;目的係針對奈米科技之學術研究、風險評估與管理監控等三部份奠定法制基礎。該報告由加拿大健康部擔任召集人,並成立奈米專家小組,共歷時八個月完成;內容分為三項:彙整該小組對於奈米議題所累積之科學成果、擷取網路使用大眾對於奈米材料相關法規之諮詢與對話,以及奈米專家針對該新興科技所提出之建議與發展方針。   然而,就法規面而言,該研究小組認為,根據現下奈米材料之特性,尚無制定新法之必要,僅需延伸現有法規機制即可,並提供建議如下: (1) 設定專門用語和分級以便於奈米材料之EHS研究。 (2) 建立標準安全控制程序或技術。 (3) 重新思考以工作場域、消費者及環境為主軸之監督方式。 (4) 使用得宜之生命週期途徑以分析奈米材料之相關風險。   該報告指出,現有的科技法規與風險處理機制,著實因侷限於奈米材料諸多之未知而遭受挑戰,並引發各界對於相應管理策略之大規模研究,故無論中央或地方政府,應更加關注國內各部會於奈米議題下之協調、科學環境之變化,及他國法制之更替。

5G汽車協會發布《先進駕駛案例-聯網技術與無線電頻譜需求之遠景路線圖》

  5G汽車協會(5G Automotive Association, 5GAA)於2020年9月9日發布「先進駕駛案例-聯網技術與無線電頻譜需求之遠景路線圖」(A visionary roadmap for advanced driving use cases, connectivity technologies, and radio spectrum needs),提供車聯網技術與產業利益相關者對於未來遠景之綜整觀點。   白皮書著重於結合通訊科技之先進駕駛系統,具體描述先進駕駛系統與連結通訊技術在全球發展的現況與展望外,同時呼籲各國應提供車聯網(V2X)應用上足夠的無線通訊頻譜,以涵蓋接下來蜂巢式車聯網(C-V2X)、專用短程通訊技術(Dedicated Short Range Communications, DSRC),及5G-V2X之通訊技術普及,指出汽車與電信等全體利害關係產業共同合作已是趨勢,以確保整體車聯網交通獲得必要的投資與創造新的商機,更有利發揮車聯網真正效益。希冀運用車聯網技術增進未來道路交通之安全性、改善交通效率、降低環境生態之衝擊,並提升駕駛舒適性與整體運輸環境。迄今,全世界高達近2億部通訊聯網車輛於道路上行駛,透過技術得以交換交通與路況資訊,而具備蜂巢式通訊資訊能力之車輛數亦日益增加,證明各國已逐步完備基礎通訊技術與相關基礎建設之布建,而未來5G車聯網更將立基於此,進一步聚焦於運用5G-V2X提升駕駛效率與安全,技術上包括整合最新晶片組與模組的車載設備(OBU)、路側設備(RSU)、智慧型手機,提出感測器共享與協同操控等先進駕駛應用案例。   此外,白皮書更對車聯網行動通訊之頻譜提出建議,概述在國際數位交通運輸體系下,車輛、用路人、路側設備及智慧運輸系統基礎設施,應與蜂巢式網路之通訊協調,共同使用5855至5925MHz中低頻段之通訊頻譜,以提升無線頻譜的運用效益、行動網路涵蓋率與通訊之安全性。而欲實現端對端之車聯網與發揮車輛連網的真正效益,亦需為專用短程通訊技術在5.9GHz提供足夠的頻段分配,其中基本安全應用需要10~20MHz,先進駕駛應用則額外還需至少40MHz,並提供路側設備低延遲性網路服務,以利資訊即時傳輸,白皮書更強調基本和先進駕駛系統之頻譜需求差異將涉及安全性之問題,不可輕視。

法國CNIL認Google於Gmail中投放之偽裝廣告及個人化廣告因欠缺當事人有效同意而違法,開罰3.25億歐元

法國國家資訊與自由委員會(Commission Nationale de l’Informatique et des Libertés, CNIL)於2025年9月1日針對一起由歐洲數位權利中心(noyb - The European Center for Digital Rights)提出的申訴做成決議,指Google未經Gmail使用者同意,將廣告偽裝為電子郵件進行「偽裝廣告」(Disguised Ads)投放,以及在對Gmail使用者投放個人化廣告前,未能於Gmail帳號申請流程中提供當事人提供較少cookies、選擇非個人化之通用廣告(generic ads)的選項,違反了《電子通訊法》(code des postes et des communications électroniques)與《資訊與自由法》(loi Informatique et Libertés)中關於歐盟《電子隱私指令》(ePrivacy Directive)之施行規定,對Google裁處了3.25億歐元的罰鍰,並要求改善。以下節錄摘要該裁決之重點: 一、 偽裝成電子郵件的偽裝廣告與電子郵件廣告均須獲當事人同意始得投放 歐盟《電子隱私指令》第13條1項及法國《電子通訊法》規定,電子郵件直接推銷(direct marketing)僅在其目標是已事先給予同意的使用者時被允許。CNIL,依循歐盟法院(CJEU)判例法(C-102/20)見解,認為若廣告訊息被展示在收件匣中,且形式類似真實電子郵件,與真實電子郵件相同位置,則應被認為是電子郵件直接推銷,須得到當事人之事前同意。因此,CNIL認定偽裝廣告即便技術上不是狹義的電子郵件,僅僅因其在通常專門用於私人電子郵件的空間中展示,就足以認為這些廣告是透過使用者電子郵件收件匣傳遞的廣告,屬於電子郵件廣告,而與出現在郵件列表旁邊且獨立分開的廣告横幅不同,後者非屬電子郵件廣告。 二、 Cookie Wall下當事人的有效同意:「廣告類型」的選擇、服務申請流程的隱私設計與資訊透明 CNIL參酌歐盟個人資料保護委員會(European Data Protection Board, EDPB)第2024/08號關於「同意與付費模式」意見,認為同意接受廣告在特定條件下得作為使用Gmail服務的條件。換言之,以「cookie wall」(註:拒絕cookie的蒐集即無法獲得服務之網站設計)取得之當事人「同意」,非當然不自由或無效。CNIL認為,在免費服務的框架下,cookie wall在維持提供服務與服務成本之間的經濟平衡上,要求服務申請者須接受投放廣告的cookie是合法的。惟CNIL認為,這不代表Google可以任意決定所蒐集的cookies和相應廣告模式的類型。 CNIL要求,當事人在cookie wall的框架內仍應享有選擇自由,才能取得蒐集為投放個人化廣告之cookies的當事人有效同意,亦即:在個人化廣告處理更多個資和對當事人造成更多風險的情況下,當事人應被給予機會選擇「等值的替代選項」,亦即通用廣告,並完全且清晰地了解其選擇的價值、範圍及後果。 然而,CNIL發現,Google將與廣告個性化相關的cookies拒絕機制設計得比接受機制更複雜,實際上阻礙了使用者拒絕隱私干預程度更高的cookies。這種拒絕途徑偏袒了允許個人化廣告的cookies的同意,從而影響了當事人的選擇自由。CNIL也發現,Google從未以明確方式告知使用者建立Gmail帳戶時面臨cookie wall,以及對此使用者享有甚麼選擇,而其提供的資訊更引導使用者選擇個人化廣告,導致選擇一般廣告的機會遭到犧牲。 三、 為何不是愛爾蘭資料保護委員會(Data Protection Commission, DPC)管轄? GDPR設有「單一窗口機制」,依據該合作機制,對Google進行的GDPR調查,應由作為主任監管機關(Lead Supervisory Authority)的愛爾蘭DPC管轄。惟在本案,CNIL認為並不適用於單一窗口機制。因為與cookies使用及電子推銷相關的處理並非屬於GDPR範疇,而是適用電子隱私指令,CNIL對法國境內的cookies使用及電子推銷處理享有管轄權。此爭議反映出即便GDPR旨在確保標準化單一市場內的數位管制,但尚不足以弭平成員國間監管強度之差異。

TOP