美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/01/12)
引註此篇文章
你可能還會想看
澳洲專利法新制上路

  澳洲於去(2012)年通過「智慧財產權法修正案」 (Intellectual Property Laws Amendment Act 2012),主要修正條文已於今(2013)年4月15日起正式施行。此次的修法大幅度提高了可專利性的審查標準,為澳洲專利制度帶來重大變革。新法適用於2013年4月15日以後提出實體審查申請之專利申請案,在新法施行後專利申請案將受到更嚴格的審查。   重要修正如下: ‧新法去除了舊專利法關於先前技術的地理區域範圍的限制。將其他各國的先前技術也一併納入考量,規範較舊法更為國際化。 ‧新法只要求所屬技術領域具有通常知識者「可能了解」且「技術相關」即可,放寬了用來判斷進步性根據之先前技術標準,使得符合進步性的要求較舊法為提高。 ‧新專利法要求專利說明書需揭露系爭發明特定的(specific)、主要的(substantial)、可信的(credible)用途,以滿足實用性的要件。此外,專利說明書上之描述必須清楚且完整,使所屬技術領域中具有通常知識者得以了解文件內容並可據以實施, ‧新法對於可專利性的認定改採「概然性權衡」(balance of probabilities)標準,亦即若專利審查員認為,未來在進行專利有效性審理,法院有超過50%的機率認定系爭發明不具可專利性時,審查委員即得駁回該申請案。 ‧增加了修正專利說明書時禁止加入新事項的限制規定,對於專利的申請益趨嚴格。   此次修法是澳洲專利制度近20年以來的最大變革,經過此次修正可預見未來申請取得澳洲專利的難度將大幅提升。更值得注意的是,由此次修正,可發現澳洲專利制度已向大多數國家的規範靠攏,使得澳洲專利法與國際間其他國家如美國、歐盟等國家的規定更為協調一致。

德國機器人和人工智慧研究

  人工智慧及機器人分為以下4種類型:首先是工廠裡的作業機器人,可自主性重複執行相同任務,例如拾取、放置、運輸物品,它們在侷限的環境中執行具體事務,而且通常是在周圍無人的圍籬區內作業,然而目前趨勢已有越來越多機器人可安全執行人機協作的任務。第二種係用在傳統製造外的專業機器人,例如:擠奶機器人、醫院手術機器人。第三種是生活中常見的消費產品機器人,常用於私人目的,例如:吸塵器機器人、割草機器人。最後是人工智慧軟體,此軟體可應用於醫療診斷輔助系統、語音助理系統中,目前越來越多人工智慧軟體結合復雜的感測器和聯網裝置,可執行較複雜之任務,例如:自動駕駛車。   德國人工智慧研究中心(Deutsche Forschungszentrum für Künstliche Intelligenz,DFKI)為非營利性公私合作夥伴(PPP)之研究機構,與歐盟,聯邦教育及研究部(BMBF)、德國聯邦經濟及能源部(BMWi),各邦和德國研究基金會(DFG)等共同致力於人工智慧之研究發展,轄下之機器人創新中心(Robotics Innovation Center,RIC)亦投入水下、太空、搜救、物流、製造業等各領域機器人之研究,未來將著重於研究成果的實際運用,以提升各領域之生產力。2016年6月,各界專家於德國聯邦議院的數位議程委員會中,呼籲立法者應注意機器人技術對經濟,勞動和社會的影響,包括技術及產品的安全標準、機器人應用之法律歸責問題、智慧財產權的歸屬與侵權問題,隱私權問題、及是否對機器人課稅等,進行相關修法監管準備。   解決台灣人口結構老化、勞動力短缺與產業競爭力等問題已是當務之急,政府為促進台灣產業轉型,欲透過智慧機械創新與物聯網技術,促使產業朝智慧化生產目標邁進。未來除需持續精進技術研發與導入產業業升級轉型外,應將人工智慧納入政策方針,並持續完備法制環境建構及提升軟實力,以確保我國技術發展得以跟上世界潮流。

南韓個人資料保護委員會宣布通過修訂個人資料保護法施行法

2024年3月6日,南韓個資保護委員會(Personal Information Protection Commission, PIPC)宣布通過個人資料保護法施行法(Enforcement Decree of the Personal Information Protection Act, PIPA Enforcement Decree)修正案,並於2024年3月15日正式實行。 本次修法重點如下: 1.明訂個資主體可要求公開自動化決策過程之權利及應對不利結果時可採取之措施 針對使用AI等自動化系統處理個資並做出的自動化決策,個資主體(即,個人)有權要求解釋決策過程並進行審查,尤其當決策結果對個資主體權益有重大影響時(例如:不通過其社福補助申請),個資主體可拒絕自動化決策結果,並要求改為人為決策及告知重新決策結果。另為確保透明、公平,自動化決策依據的標準與程序亦須公開,並於必要時向公眾說明決策過程。 2.確立隱私長(Chief Privacy Officers, CPOs)的資格要求及適用範圍 為確保CPO能順利開展個資保護工作,要求處理大量或敏感個資機關之CPO至少具有4年個資、資安相關經驗,且個資經驗至少2年。適用機關包括:年營業額達1,500億韓元以上、處理超過100萬人個資或超過5萬人特種資料者;學生超過2萬人的大學;處理大量特種個資的教學醫院或大型私人醫院等;疾管局、社福、交通、環保等公共系統運營機構。 3.明訂評估公共機構個資保護效能之標準及程序 依據個資法第11-2條規定,PIPC每年需對公共機構(如:中央行政機關及其所屬機關、地方政府及總統令規定者)進行個資保護程度評估,而為使評估作業有所依循,本次新增評估標準及相關程序包括:政策和業務表現及其改進情形、管理體系適當性、保護個資措施及執行情形、防範個資侵害及確保安全性措施及執行情形等。 4.調整需要承擔損害賠償責任的適用範圍及門檻 為確保機關履行個資主體損害賠償責任,將需履行投保保險等義務之適用範圍由網路業者擴大至實體店面及公共機構等。同時,調整適用門檻,將年銷售額由5千萬韓元調整為10億韓元、個資主體數由1千人調整為1萬人,以減輕小型企業負擔。另亦明訂可豁免責任的對象包括:不符合CPO資格的公共機構,公益法人或非營利組織,及已委託給已投保保險之專業機構的小型企業。 PIPC另將公布一份指引草案,內容包括自動決策權利、CPO資格要求、公共機構個資保護評估標準、賠償責任保障制度等,並舉行說明會來收集回饋意見。

歐盟法院裁決:網站「預先選取同意」不構成ePrivacy Directive及GDPR合法有效的同意

  歐洲聯盟法院(CJEU)2019年10月1日對Planet49案(Case C-673/17)作出裁決。Planet49 GmbH為線上遊戲公司,用戶必須註冊並填寫姓名、地址等資料,點擊「參加」鍵後,會出現兩個選項框,一為「同意接收贊助商及合作夥伴的廣告訊息」,用戶必須勾選此一選項始可參加;另一選項框是「同意將用戶的Cookies用於廣告目的與分析」,此一選項已被預先勾選,而用戶可以取消勾選;在選項旁附有說明(如Cookie的用途等),並告知用戶可以隨時刪除所設置的Cookie。   歐盟法院針對《電子通訊隱私指令》(ePrivacy Directive, ePD)以及《一般資料保護規則》(General Data Protection Regulation, GDPR)進行闡明,重點如下: 一、ePD所要求對於Cookie儲存與使用的「同意」必須符合GDPR的「同意」原則,必須是當事人自願、具體、知情且明確的同意,本案「預先勾選同意」不構成有效同意。 二、「同意」必須特定對象,而不能藉由其他標的加以包裝、暗示,用戶點擊「參加遊戲」不能代表「Cookie的同意」。 三、ePD是對於用戶資料儲存與取得的保護,不論是否涉及「個人資料」均有ePD的適用,而必須取得用戶同意。 四、對於Cookie的使用必須清楚揭露,包括Cookie用途、運作期間、第三方是否有機會取得此一資訊等,以確保用戶確實了解其所為「同意」的內容與範圍。

TOP