美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/06/25)
引註此篇文章
你可能還會想看
美國制訂「促進政府資訊開放」行政命令及推動「藍色按鈕倡議」計畫

  美國歐巴馬總統於2013年5月9日正式簽署「促進政府資訊開放並利機器讀取」行政命令(Executive Order 13642–Making Open and Machine Readable the New Defaut for Government Information),推崇聯邦政府過去釋出氣候、全球定位系統(GPS)等資訊對於私部門產業創新及新創事業(entrepreneurship and star-up)之正面影響,盼未來所有新增加的政府資料在資訊安全和隱私權雙重確保之前提下,將開放以可供機器可讀取之格式給公共大眾,帶動整體經濟正面循環發展。之前,美國推動聯邦政府資料開放政策,重要者為白宮科學技術政策辦公室(Office of Science and Technology Policy, OSTP)於2009年3月份啟動「開放政府倡議」(Open Government Initiative),民眾可透過「Data.gov」入口網站 ,取得高價值、機器可讀取之聯邦政府資料。   近年來,在公部門政府政策鼓勵導引下,不同的產業也逐漸發展出適用於特定產業的共同互通性標準(sectoral interoparability)。以醫療衛生領域為例,從2010年開始,歐巴馬總統乃宣布「藍色按鈕倡議」(Blue Button Initiative),病患得透過特定網頁(web-based)簡易下載其健康資訊(health information),並可供重複利用的格式下;同時,患者也可以選擇將該資訊分享給健康照護提供者(health care provider)、保險公司和信任的第三者(trusted third parties)。該倡議更挑戰軟體開發者(developer)在藍色按鈕的基礎上,開發更多的Apps軟體,使當事人更容易去管理掌控自身健康的狀況。在能源科技領域,近似於藍色按鈕倡議,白宮幕僚科技長Aneesh Chopra於2011年9月,也發起了「綠色按鈕倡議」(green button initaitive),挑戰美國境內大小事業單位(utilities)投入參與該倡議,研發一個機器可讀取之開放格式(a machine-readable open format),使消費者得透過連線網路重複近取之。   有鑒於網際網路開放的特性,且近年來來自外國網路攻擊不斷,於2013年2月份,NIST與國際間重要標準組織,如ISO、IEC和IEEE,首度就感應網絡(sensor networks)、機器對機器(M2M)和智慧聯網(IoT),提出一個跨界面之共通標準計畫(ISO/IEC/IEEE P21451-1-4 XMPP),該共通標準計畫內容包含: 封包傳輸(檢測)、全球獨特辨識、政策控制和加密,此共通標準得確保未來巨量資料領域資料近取之安全性 。

日本為防堵黃牛票6月正式施行票券不當轉賣禁止法

  日本在2019年6月14日正式施行「確保表演入場券流通正當性之禁止不當轉賣特定表演入場券相關法律」(特定興行入場券の不正転売の禁止等による興行入場券の適正な流通の確保に関する法律),簡稱票券不當轉賣禁止法(チケット不正転売禁止法),其以訂立專法之方式,來防止黃牛業者先大量取得票券,再以賺取高額差價之方式牟利。其重點包括: 禁止行為:(1)不當轉賣票券;(2)以不當轉賣為目的而讓售票券。 適用範圍:在日本國內所舉行,且得為不特定多數人得共聞共見之電影、歌劇、舞台劇、音樂、舞蹈及其他藝術或體育活動。 票券應記載事項: (1)發行人在販售時明確表示,禁止未經發行人同意而進行買賣轉讓,並應將禁止事項記載於票券上;(2)舉行表演之時間、地點及具入場資格者之指定座位;(3)發行人在販售時,需採取確認入場者或購票者之姓名和聯繫方式等必要措施,並應將確認事項記載於票券上。 不當轉賣定義:以有償轉賣未得票券發行人事前同意轉讓之票券為業,並以超過售價之價格進行販賣。   日本政府並針對2019年9月份在日本所舉辦之橄欖球世界杯及2020年在東京所舉辦之奧運會加強宣導該法令。我國熱門活動、演唱會也常面臨黃牛掃票,再高額轉售之問題。日本之立法模式,不失為我國參考借鏡之對象。

InterDigital於美國ITC再啟關稅法第337條調查

  美國著名非專利實施實體(Non-Practicing Entity, 以下簡稱NPE)公司-InterDigital(InterDigital Technology Corporation),於2013年1月31日以三星(Samsung)、諾基亞(Nokia)、華為(Huawei)及中興(ZTE)等公司侵害其7項3G及4G之無線通訊專利(U.S. Patent No.7190966、No.7286847、No.7616970、No.7941151、No.7706830、No.78009636、No.7502406)為由,向美國國際貿委員會(United States International Trade Commission, 以下簡稱USITC)提請依美國關稅法第337條啟動專利侵權調查(案號:337-TA-868)   InterDigital成立於1972年,主要研發領域聚焦於「無線語音及數據通訊系統」,所持有的專利組合涵蓋了現今2G、3G、4G及IEEE 802等相關主流技術。依據PatentFreedom於2013年1月的統計資料,InterDigital共持有2961項美國有效專利,於全球NPE中排名第四。作為典型的NPE,InterDigital本身並不自行使用所擁有的專利,而係以「授權予手持裝置製造商、半導體製造公司或其他設備製造商」作為主要商業營運模式。   因此,為確保專利能發揮最大運用效益,InterDigital會主動搜尋市場中潛在的侵權人,並透過法律訴訟手段,促使其支付授權金。其中,USITC的「關稅法第337條」調查程序,即為重要的策略手段之一,因其所需的審理時間較一般法院的民事訴訟程序為短,且於確認存在專利權侵害之情事後,其裁決效力可透過禁制令(Exclusion Order)或暫停及停止令(Cease And Desist Order)直接對被控侵權人的產品進口及銷售造成重大影響,故在為數不少的案件中,被告往往會選擇給付授權金以求停止關稅法337條之調查程序。   由於本案中遭調查的產品幾乎涵蓋了各廠商於市場中的主要產品(例如三星的Galaxy Note、Tab及S系列、Nokia Lumia系列、中興的4G移動熱點設備、華為的Activa 4G手機等),故引起了產業界的高度關注。針對本案,USITC已於2月4日宣布啟動為期16個月的侵權調查,並定於2014年6月4日前完成所有調查,其後續調查結果及本案如何發展,值得持續觀察。

韓國政黨提出法案,建議修改「海關法」禁止營業秘密侵權商品之進出口

據韓國媒體於2024年2月13日報導指出,越來越多韓國企業面臨因為營業秘密的外洩而導致企業虧損的問題,鑒於目前的韓國海關扣留制度(Customs Retention System)僅適用於對外公開的智慧財產權(如商標與專利),多方呼籲應將侵害企業內部營業秘密之侵權商品納入海關法的管制中,甚至有政黨提出法案,建議擴大海關法的適用範圍,禁止侵害韓國企業營業秘密的商品進出口。 該篇報導藉一起正在調查中的營業秘密侵害案件為例,涉案之韓國槍械零件製造商,以「前員工在職時,透過個人電子郵件與客戶進行業務往來,取得企業營業秘密資訊(包括設計圖),並於離職後,創設一間A企業並涉嫌出口利用獲得之營業秘密生產的侵權商品」為由,於2023年向該名離職員工提起訴訟,該案後經政府機關調查,最終於2024年2月底進行首次聽證會。 針對上述案件,國防產業相關人士(Defense Industry Insiders)指出,因為韓國海關僅得依法禁止專利、商標之侵權商品進出口,營業秘密的侵權商品在爭議案件調查期間仍可持續進出口。對此,韓國政黨提出了一項法案(下稱系爭法案),旨在修改海關法,從而允許海關扣留「侵害營業秘密的商品」以及「侵害國家指定的先進工業和國防技術的商品」。 該篇報導也指出,雖韓國海關局對於修法基本上持贊成態度,但也有相關疑慮,如:可能會因為海關扣留範圍的擴大被濫用於壓制競爭行為;相較於容易識別的商標侵權案,營業秘密的範圍很廣,界線模糊,可能造成海關難以立即識別侵權。 綜上,即使系爭法案有利於營業秘密侵權救濟,但仍有上述疑慮有待解決,故本議題仍值得持續關注。而本文仍建議相較於事後救濟,企業可參考資策會科法所發布之「營業秘密保護管理規範」,透過PDCA循環建置系統性營業秘密規範,協助企業從事前防範營業秘密侵權風險,始為企業長久經營之計。 本文同步刊登於TIPS網(https://www.tips.org.tw)

TOP