美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=57&tp=1 (最後瀏覽日:2026/05/25)
引註此篇文章
你可能還會想看
什麼是「商標的反向混淆誤認」?

  2008年,連鎖咖啡店85度C告85.1度C商標侵權,台北地院以85.1度C影響了85度C的商譽和正常收益,判賠新台幣47萬元。-這是商標侵權爭訟常見「商標混淆」的具體場景,也是所謂的「正向混淆」(Direct Confusion)。試想,現在主客易位,85.1度C 是間小店,耕耘許久仍沒沒無聞;而85度C推出即一炮而紅、門庭若市。85度C是後來者,他是否可以商標混淆為由,主張85.1度C影響了其商譽和正常收益?這個「後商標比前商標強勢」的假設就涉及「反向混淆」(Reverse Confusion)。   所謂「商標的反向混淆誤認」,按經濟部智慧財產局〈行政法院105年度判字第465號判決研析〉,係指:「後商標因較諸前商標廣為消費者所知悉,消費者反而誤以為前商標係仿冒後商標,或誤認為前商標與後商標係來自同一來源,或誤認兩商標之使用人間存在關係企業、授權、加盟或其他類似關係。」   美國於1976年之Big O Tire Dealers, INC. v. Goodyear Tire & Rubber Co.案首度在侵害商標權訴訟承認有反向混淆之適用。然而,由於美國採「使用主義」(First to use),商標之認定係以使用的先後判斷之。而我國採註冊主義,商標先後以申請註冊的時間判斷之。我國最高行政法院105年度判字第465號判決則明確表示商標法明文規範商標註冊申請乃採先申請主義,排除反向混淆理論之適用。

93年國人申請發明專利數量大幅成長28.39﹪ 創新研發成果明顯躍進

  93年專利申請統計資料顯示我國受理專利申請案總數、發明申請案數量、及國人發明申請案等指標,均呈現相當幅度成長,顯示我國過去幾年官方與民間投資創新研發成果有明顯成長。    93年專利、商標申請與核准統計出爐,全年專利新申請案件總數72,105件,較92年的65,742 件增加6,363件(9.68﹪),本國人申請案43,038件,外國人29,067件。其中屬技術強度較高的發明申請案件總數計41,930件,較前一年增加6,107件(17.05﹪);本國人發明申請案16,754件,較前一年大幅增加3,705件(28.39﹪),顯示我國產業研發技術成果有向上提昇的趨勢。93年專利發證數66,415件,比92年大幅增加24,333件(57.82﹪),此係因93年7月專利法修正實施,新型專利改採形式審查,縮短專利審查時程,及專利廢除異議制度改採繳費後公告同時發證的制度轉換短期影響。    93年商標申請案依類別統計為72,650件,比92年申請案件數65,907件,增加6,743件(10.23﹪),;93年商標公告註冊案計54,912件,較前一年74,572件減少19,660件(-26.36﹪);依類別計55,986件,均較前一年減少。不論是在申請或公告註冊數都是以本國人佔絕大多數。商標申請於92年底開始實施一申請案多類別制度,不同類別毋需另提出一獨立申請案,因此依類別統計數會比申請案件數多。

南韓個資保護委員會發布人工智慧(AI)開發與服務處理公開個人資料指引

南韓個資保護委員會(Personal Information Protection Commission, PIPC)於2024年7月18日發布《人工智慧(AI)開發與服務處理公開個人資料指引》(인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서)(以下簡稱指引)。該指引針對AI開發與服務處理的公開個人資料(下稱個資)制定了新的處理標準,以確保這些資料在法律上合規,且在使用過程中有效保護用戶隱私。 在AI開發及服務的過程中,會使用大量從網路上收集的公開資料,這些公開資料可能包含地址、唯一識別資訊(unique identifiable information, UII)、信用卡號等個資。這些公開的個資是指任意人可藉由網路抓取技術自公開來源合法存取的個資,內容不限於個資主體自行公開的資料,還包括法律規定公開的個資、出版物和廣播媒體中包含的個資等。由於公開資料眾多,在現實中很難在處理這些公開個資以進行AI訓練之前,取得每個個資主體的單獨同意及授權,同時,南韓對於處理這些公開個資的現行法律基礎並不明確。 為解決上述問題,PIPC制定了該指引,確認了蒐集及利用公開個資的法律基礎,並為AI開發者和服務提供者提供適用的安全措施,進而最小化隱私問題及消除法律不確定性。此外,在指引的制定過程中,PIPC更參考歐盟、美國和其他主要國家的做法,期以建立在全球趨勢下可國際互通的標準。 指引的核心內容主要可分為三大部分,第一部分:應用正當利益概念;第二部分:建議的安全措施及保障個資主體權利的方法;及第三部分:促進開發AI產品或服務的企業,在開發及使用AI技術時,注意可信任性。 針對第一部分,指引中指出,只有在符合個人資料保護法(Personal Information Protection Act, PIPA)的目的(第1條)、原則(第3條)及個資主體權利(第4條)規定範圍內,並滿足正當利益條款(第15條)的合法基礎下,才允許蒐集和使用公開個資,並且需滿足以下三個要求:1.目的正當性:確保資料處理者有正當的理由處理個資,例如開發AI模型以支持醫療診斷或進行信用評級等。2.資料處理的必要性:確保所蒐集和利用的公開資料是必要且適當的。3.相關利益評估:確保資料處理者的正當利益明顯超越個資主體的權利,並採取措施保障個資主體的權利不被侵犯。 而第二部分則可區分為技術防護措施、管理和組織防護措施及尊重個資主體權利規定,其中,技術防護措施包括:檢查訓練資料來源、預防個資洩露(例如刪除或去識別化)、安全存儲及管理個資等;管理和組織防護措施包括:制定蒐集和使用訓練資料的標準,進行隱私衝擊影響評估(PIA),運營AI隱私紅隊等;尊重個資主體權利規定包括:將公開資料蒐集情形及主要來源納入隱私政策,保障個資主體的權利。 最後,在第三部分中,指引建議AI企業組建專門的AI隱私團隊,並培養隱私長(Chief Privacy Officers, CPOs)來評估指引中的要求。此外,指引亦呼籲企業定期監控技術重大變化及資料外洩風險,並制定及實施補救措施。 該指引後續將根據PIPA法規修訂、AI技術發展及國際規範動向持續更新,並透過事前適當性審查制、監管沙盒等途徑與AI企業持續溝通,並密切關注技術進步及市場情況,進而推動PIPA的現代化。

FCC通過命令以促進飛機上網路服務

  為促進電信市場競爭與服務之普及,在2012年12月28日美國公佈FCC12-161命令,而透過該項命令,預計未來不論機組人員、亦或是旅客於商業客機、自用客機內,使用網路服務的比例將會提升。FCC認為此舉不僅可滿足消費者對無所不在(Ubiquitous)網路的需求外,亦可促後使經濟成長與創造就業機會。   其實,早於2001年,美國政府就透過同步軌道的方式(Geostationary-Orbit)開放網路服務,但在設置上必須設置多個地球站(earth station),而FCC所命名的Earth Stations Aboard Aircraft(ESAA),則延續過去設置於車輛、船舶之技術,在飛機外部安裝接收器,以和衛星固定業務(fixed satellite service)作為骨幹,使乘客手機透過例如Wifi技術取得網路服務;至於,在頻段的使用上,相較過去以非有害干擾為前提,ESAA則有明確之規定:下傳(downlink)頻率之選擇是依循車輛、船舶執行相同服務的規定、並考量將經過不同國域與領海,故選擇該10.95-11.2 GHz、11.45-11.7 GHz與11.7-12.2 GHz,以符合美國、國際頻譜配置;上傳(uplink)的頻率則是基於不受雙向干擾之情況下,選擇14.0-14.5 GHz頻段。   現階段,FCC為積極促進該業務發展,不僅允許航空公司與寬頻業者皆可提供服務外,亦建立一套管制架構,以保護飛航網路不受干擾、確保地面無線電服務能正常運作,並且,為減少行政資源與促進服務普及,FCC簡化業者申請流程,最多僅需原來時間的一半。雖然, FCC針對技術、執照的發放有詳細的規範,但尚未對旅客使用VOIP服務(Eg:Line、Skype)做任何規範,而這是FCC未來推廣該服務之隱憂。儘管如此,該服務推展確實可便利遊走各國間之旅客,但對於想在飛機上享受片刻寧靜的人而言,能普及使用Wifi可真是喜憂參半的消息。

TOP