美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/05/25)
引註此篇文章
你可能還會想看
南韓KCC課予廣電傳播業者進行數位轉換的法定義務

  為了促進地面廣播電視傳播數位化轉換進程,南韓通訊傳播委員會(Korea Communications Commission, KCC)於2009年6月4日公佈將強制進行HD節目(High-Definition program)改良與制定執行計畫。KCC於2009年6月31日公佈與廣電數位化轉換法令有關之命令修正草案公告,其中將對無法達到要求的廣電傳播業者課予罰鍰或不利益處分。   根據先前執行廣電數位化轉換法令之經驗,KCC提出了相關修正草案。該草案將課予廣電傳播業者進行HD節目製播改良之法定義務,且須改善數位傳輸環境,以使廣電數位化能順利在2012年年底完成。此外,業者必須提出每年的執行計畫報告與公開類比播送終止、實施數位化播送的情況,否則業者將受有不利益之行政處分,例如基地台許可執照將被廢止。   南韓於2008年2月針對廣電類比訊號之關閉制定特別法,並要求在2012年12月31日全面完成廣電傳播數位化。如今為了確保數位化進程可如期完成,強制廣電傳播業者進行相關數位化工作,整體效益有待觀察。

歐盟執委會接受英國電子書出版商 Penguin提出的協議內容

  2010年,蘋果(Apple Inc.)與法商Hachette、美商HarperCollins、美商Simon & Schuster、英商Penguin與德商Holtzbrinck/Macmillan等五家主要出版商訂定協議,改變電子書過往在市場上的銷售模式。過去電子書係由零售商(通常是網路書店)自行訂定銷售價格,而今蘋果與五家出版商透過協議,改由出版商決定電子書在網路書店的銷售價。   歐盟執委會於2011年3月對此展開反競爭(anti-competition)調查,認為這五家書商聯合蘋果公司限制零售書商定價的行為有違反競爭法之虞。根據歐盟運作條約(Treaty on the Functioning of the European Union, TFEU))第101條規定,事業間協議與一致性行為足以影響歐體會員國間交易,且以妨礙、限制或扭曲歐體共同市場競爭為效果或目的者,與共同市場不相容,應予禁止。   2012年9月,除Penguin外,其中四家出版商皆提出和解方案,承諾將終止與蘋果簽訂的代理協議,不再干涉電子書零售商調整電子書零售價格,此外,並同意未來五年內排除「最惠國(Most-Favoured-Nation, MFN)」條款的適用,該條款規定出版商與其他電子書銷售商如亞馬遜的訂價不得低於與蘋果的訂價。排除最惠國條款的適用意味著,未來出版商和零售商協議的電子書價格將能低於蘋果訂價。   英商Penguin日前與歐盟執委會達成協議,決定終止與蘋果公司關於電子書定價的契約,其承諾條件如下: 一、Penguin公司將終止和零售書商間的代理契約。 二、未來兩年內零售書商可自訂電子書價格與折扣,包含Penguin公司出版的書籍。 三、Penguin公司和零售書商的契約也將適用禁止價格最惠國條款,期限5年。   歐盟執委會接受Penguin公司所提出之承諾,並認為此舉將有助於恢復市場的有利競爭環境。本案終能落幕。

新加坡網路安全局發布人工智慧系統安全指南,以降低AI系統潛在風險

新加坡網路安全局(Cyber Security Agency of Singapore, CSA)於2024年10月15日發布人工智慧系統安全指南(Guidelines on Securing AI Systems),旨在強化AI系統安全,協助組織以安全之方式運用AI,降低潛在風險。 該指南將AI系統生命週期分成五個關鍵階段,分別針對各階段的安全風險,提出相關防範措施: (1)規劃與設計:提高AI安全風險認知能力,進行安全風險評估。 (2)開發:提升訓練資料、模型、應用程式介面與軟體庫之供應安全,確保供應商遵守安全政策與國際標準或進行風險管理;並辨識、追蹤及保護AI相關資產(例如模型、資料、輸入指令),以確保AI開發環境安全。 (3)部署:適用標準安全措施(例如存取控制、日誌記錄),並建立事件管理程序。 (4)運作與維護:持續監控AI系統的輸入和輸出,偵測異常與潛在攻擊,並建立漏洞揭露流程。 (5)壽命終期:應根據相關行業標準或法規,對資料與模型進行適當之處理、銷毀,防止未經授權之存取。 CSA期待該指南發布後,將有助於預防供應鏈攻擊(supply chain attacks)、對抗式機器學習攻擊(Adversarial Machine Learning attacks)等安全風險,確保AI系統的整體安全與穩定運行。

日本全球首度針對物聯網技術創立新的專利分類

  近年來,物聯網(Internet of Things, IOT)技術快速發展,隨著大勢所趨掀起一波專利申請熱潮。申請量增加的同時,亦代表相關技術的智財權使用者對於該領域的專利資訊需求大幅增加。然而,目前全球還沒有與此領域相關的專利分類系統協助大眾搜尋這些技術資訊。   有鑑於此,日本特許廳(Japan Patent Office,簡稱JPO)在今(2016)年11月14日針對物聯網技術領域全球首創新的專利分類ZIT。自2017年起,將可透過JPO的J-PlatPat系統利用此專利分類,檢索及分析物聯網相關的專利資訊。此專利分類能夠協助專利申請者更有效地檢索相關先前技術,亦能同時讓相關業者及專業人士了解當前物聯網技術的發展趨勢。   JPO不僅針對日本當地,亦努力與其他專利局合作。在世界五大專利局(簡稱IP5):包含歐洲專利局(European Patent Office,簡稱EPO)、韓國智慧財產局(Korean Intellectual Property Office,簡稱KIPO)、中國大陸知識產權局(the State Intellectual Property Office of the People’s Republic of China,簡稱SIPO)、美國專利商標局(The United States Patent and Trademark Office,簡稱USPTO)及JPO的專利局首長會議,以及世界智慧財產權組織(World Intellectual Property Organization,簡稱WIPO)的國際會議上,JPO積極鼓勵各國多加使用ZIT專利分類。   因應日本政府今年提出第四次産業革命戰略,瞄準三大核心技術其中亦包含了物聯網技術,JPO現在首創新的專利分類ZIT,更能提升物聯網的相關技術研發,為物聯網產業劃下重要里程碑。

TOP