美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/04/29)
引註此篇文章
你可能還會想看
日本最高法院新判決裁定日立需支付前員工發明報酬一億六千萬餘日圓

  日本最高法院最近裁定,日立( Hitachi )必須支付一億六千三百萬日圓(約四千五百萬台幣)給取得三項光碟讀取技術發明專利的前工程師米澤成二( Seiji Yonezawa )。一九九六年退休的米澤,於一九七三到一九七七年間,將其開發出來的三項有關光碟讀取技術發明專利移轉給任職的日立公司,當時他僅獲日立支付二百三十萬日圓酬勞,米澤嫌酬勞太少而提起訴訟,要求日立支付二億八千萬日圓酬勞。   東京地方法院於二○○二年作成的裁定,認定日立因該專利在日本國內所獲利益約兩億五千萬日圓,依米澤的貢獻度百分之十四計算,命令日立支付約三千五百萬日圓。但在日立上訴至東京高等法院的第二審,高院於二○○四年裁定,加上日立在英美等六個外國取得專利所獲利益約共十一億八千萬日圓,扣除已支付金額,日立應再支付約一億六千三百萬日圓酬勞給米澤。米澤原本訴請日立支付發明報酬兩億八千萬日圓,此案在最高法院駁回日立提起的上訴後判決定讞。   根據日本特許法(專利法)規定,受雇人取得發明專利時,企業需支付相對報酬予發明人,不過對於報酬之合理性,受雇人及雇用人近年來迭有爭議並訴諸司法解決。雖然日本國會在 2004 年 5 月 28 日 通過專利法修正案,進一步使報酬之計算要件更加具體、明確化,日本專利局也隨後在 2004 年 11 月公布「新受雇人發明制度之程序個案研究」( The Case Studies of the Procedures under the New Employee Invention System ),以問答方式闡釋新修正之發明人報酬規定之意義與適用方法,並尋求一個較為合理的標準,提供受雇人與雇用人間訂定報酬金時之參考。   然而,境外專利權是否應該列入報酬金之計算,新法則未規定,故此問題仍然存在,對此下級法院的判決不一,日本最高法院最近做出確定在海外取得的專利亦得支付相對報酬之裁決,這項司法裁定,勢必會影響到擁有國外專利的眾多日本企業。

美國重啟核電廠興建,並鼓勵小型核能反應爐創新技術研發

  美國雖將能源列為國家長期的能源政策目標,自1990年代後期,亦投入核能的安全性、環境建置及研發補助等,但最近因將重點放在其他替代性能源的開發,因此在核能方面的計畫稍微減少,尤其自1979年美國三哩島核電廠(Three-Miles Island Nuclear Generating Station)發生事故後,美國三十年來未再興建任何核電廠。但由於核能發電的高效率與不會排放二氧化碳的低污染,因此美國政府將之列為重點發展項目,強調美國政府的能源政策是要發展任何可能的能源,包括合核能,以提升在全球潔淨能源的競爭優勢。   美國總統歐巴馬表示,為了維持能源供需的穩定,以及避免氣候的惡劣變遷,有必要重啟美國核能產業,持續提高核能的供應量。因此於2011年12月經核子管理委員會(Nuclear Regulatory Commission)通過、2012年2月再次於投入核電廠的興建,於喬治亞洲Vogtle核電廠核准興建兩座新的核能反應爐,並透過成本分擔協議(cost-share agreement)投入2億美元,協助設計認證及許可。   此外,並於同年3月宣布投入4. 5億美元於五年內支持兩座自製的小型核能反應爐(small modular nuclear reactor,SMR)的設計、認證及核准,希望能輸出這些自製的反應爐,提升全球潔淨能源的競爭力。這些反應爐約只佔核能廠的三分之一面積,具有安全的建築設計,小型反應爐能在工廠內製造,並運輸到定點安裝,能節省成本及建造的時間。且其最理想的地方在於其體積小,能使用在小型智慧電網級一些無法容納大型反應爐的地方,其運用能更有彈性,能增加經濟效益。   國政府希望透過與私人企業的合作,帶領美國在全球核能科技及製造的領先地位。因此希望能源部希望此計畫能經核子管理委員會的許可,此一小型核能反應爐的計畫總金額為9億美元,透過與私人企業成本分擔的協議,其中50% 由國會撥款,另50%則由私人企業投資,並於2022年商業化,取得在全球潔淨能源的競爭優勢地位。

澳洲主管機關起訴Google違法誤導客戶同意使用個資

  2020年7月澳洲競爭及消費者委員會(Australian Competition and Consumer Commission, ACCC)正式對Google提告,針對Google於2016年的一項個資改變政策的內容,以誤導的方式取得用戶同意,而擴大使用個資範圍的行為。   於2016年,Google希望透過在其帳戶中所取得的個資,連結到用戶在非Google網頁中的瀏覽紀錄,如此Google將能夠依據這些資訊,更準確的在其他網站中投放廣告,以提升廣告費收入。為結合用戶於Google及其他網站的資料,Google需更改原本的個資隱私政策,然而事實上Google並沒有實際取得用戶對於此項改變的同意,反而以類似服務改進的通知:「我們為您的帳戶加入了一些可選擇性的功能,讓您能更好掌控Google所蒐集的資訊及使用方式,同時允許Google向您展示相關的廣告」等文字,誤導用戶藉以徵得用戶對個資政策改變的同意。   雖然Google承諾於2022年後,逐步移除Chrome瀏覽器中第三方Cookie的啟用,此動作將會阻止其他網站透過網路,追蹤到Google用戶的瀏覽紀錄,但由於目前Google還是依據用戶的瀏覽紀錄,針對用戶的特定偏好投放廣告來賺取收益,因此這種廣告模式短期內不太可能有所改變。若ACCC在這次與Google的訴訟中勝訴,那表示未來業者對於取得客戶同意(包括收集使用個資)的方式,從原本習慣使用概括性描述並隱藏使用個資真正目的等用語,來取的客戶同意的模式將有所改變。

紐西蘭IT專家組織2012年5月發布雲端運算實務準則

  紐西蘭最為歷史悠久的IT專家組織(Institute of IT Professionals NZ)於2012年5月發布雲端運算實務準則(Cloud Computing Code of Practice),藉此彌補實務上缺乏雲端運算標準與實務指針的問題;本準則為自願性遵循規範,以紐西蘭為市場的外國雲端業者、及紐西蘭的業者皆可適用之,並可向公眾宣示其已遵行此準則,然倘若未遵行而為遵行之宣示,則屬誤導或詐欺行為而觸犯公平交易法(Fair Trading Act 1986)。本準則有四個主要目標:1. 促進紐西蘭雲端產業的服務標準;2. 確立應揭露(disclosure)的標準;3. 促進雲端服務提供者與用戶間就資料保護、隱私與主權等事項的揭示;4.強化紐西蘭雲端運算產業的整合性。     依據此準則,雲端業者的資訊揭露範圍至少應包含業者基本資料、資訊所有權、管理及保護、與服務提供之適當管理措施等。在資訊所有權層面,業者應表明是否對所上載的資料或資訊主張所有權;而當用戶透過雲端服務利用或傳輸的資料而儲存於其他上游業者的網路或系統時,業者應確認其資料所有權之歸屬。     在資料管理與保障層面,業者應表明遵從何種資訊安全標準或實務,其已向美國雲端產業聯盟(Cloud Security Alliance)進行STAR登記,或者已通過其他標準的驗證;此外應表明儲存資料伺服器之一處或多處所在地。再者,業者亦須表明服務關係繼續中或終止後,業者或客戶對於客戶所擁有資料之存取權限。     在服務提供的適當管理措施上,包含業者的備份(Backup)程序及維護措施,皆應為揭露,使用戶得據以評估是否採取進一步的資料保護措施;此外包括服務的繼續性要求,如備援措施…等,亦應為揭露;又鑒於雲端服務有地理多樣性(Geographic Diversity)的特質,業者應使用戶知悉其提供服務、或營業活動的地點,以判斷此等服務可能適用的法權(Legal Jurisdiction)。     依據此準則,雲端業者亦可例如透過服務水準協議(Service Level Agreement)對個別用戶承諾特別的服務支援方案,以提供更好的服務品質。

TOP