美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用

  在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。

  美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論­­—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。

  與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。

  但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。

相關連結
相關附件
※ 美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=6621&no=67&tp=1 (最後瀏覽日:2026/06/27)
引註此篇文章
你可能還會想看
美國商務部發佈智財權活動對美國經濟影響之綜合報告

美國商務部發佈智財權活動對美國經濟影響之綜合報告 科技法律研究所 法律研究員 曾文怡 101年5月16日 壹、事件摘要   美國商務部於今年3月發佈一份委由其所屬之「經濟統計局(Economics and Statistics Administration,ESA)」和「美國專利商標局(United States Patent and Trademark Office,USPTO)」共同執行的調查報告:「智慧財產和美國的經濟:產業焦點(Intellectual Property and the U.S. Economy: Industries in Focus)」。   報告除界定所選研究標的313種行業別中,共75種被認定為「智財密集型行業(IP-intensive industries)」;而這些「智財密集型行業」為美國帶來至少4千萬筆就業機會、超過5兆美元產值,佔美國GDP高達34.8%。 貳、報告重點摘要 一、「智財密集型產業」的篩選   此報告採用美國USPTO相關的行政數據,用以確認(identify)最密集利用商標、專利所提供的保護之行業;著作權方面,則係以是否主要為創作或生產受著作權保護素材,加以認定。以標準統計方法用以確認(identify)哪些美國行業(industries)是最具專利、商標及著作權密集型(intensive),並統稱為「智財密集型產業」。 (一)以該行業平均每人擁有專利數認定專利密集型行業   美國使用各美國行業標準分類 (North American Industry Classification System, NAICS) 於2004-2008這五年間的專利總數與該行業的平均就業人口的比例來測量行業的專利密集型:   Measure of industry patent “intensity” = total patents over the five years in a NAICS category / average payroll employment by industry   就業人口能夠展現一個行業的大小,並確保各行業在比較時是公平的 (even playing field) 。最具專利密集型的行業並不是擁有最多專利,而是在該行業一個職位有最多專利 (patents per job) 。若專利/職位比例高於所有行業的平均值,則該行業將被認定為專利密集型的行業。 (二)以商標登記數統計資料認定商標密集型行業   有鑑於一個商標通常會同時登記於好幾個不同的類別下,因此在此統計的方式將以類別為單位,而非商標。美國使用了3種方式來認定商標密集型的行業 (three-pronged approach) : 1.平均每人擁有商標數密集的行業   比照專利的方式,以商標登記與行業就業人口比例來測量商標密集性,首先過濾出屬於上市公司的商標登記,並比對該公司公開資訊中 (Compustat 資料庫 ) 的主要產業及員工人數,因為Compustat資料庫有包含公司的NAICS行業類別,如此就可以取得行業的商標登記數及就業人口數並計算該行業之比例。 2.前50家商標登記最多企業 (Top 50 Trademark-Registering Companies)   利用USPTO發佈的前50家商標登記最多企業名單 ( 不同於第一種方式將包含上市與非上市公司 ) ,並利用付費的OneSource資料庫找出這些企業的 NAICS 行業類別,並統計各行業在前50家企業名單中出現的次數,一個行業出現超過5次以上將被認定為商標密集型。 3.隨機取樣 (Random Sample of Trademark Registrations)   從2010年所有在登記的商標隨機抽樣300件,其中196件為美國公司申請登記,針對這196家企業試圖找出其NAICS行業類別,行業類別若有超過5筆商標登記,將被視為商標密集型。   上述三種方式總共產出60個商標密集型行業,同時使用三種方式係希望能夠彌補一種方式可能有的缺點,例如商標密集型方式可能會低估某些產業或忽略到較小型或沒有上市的企業,這部分由第二種及第三種方式試圖彌補。   最後被認定出為商標密集型的行業也與Interbrand的品牌排行作比較 (Best Global Brands in 2010) ,以確認被認定為最具品牌價值的企業是否屬於商標密集型的行業,此研究找出品牌排行中的企業的NAICS行業類別,並與之前被認定為商標密集型的行業作比對,發現具相當的重疊性。 二、以WIPO核心著作權產業標準界定著作權密集型行業   美國有關著作權產業的界定,主要根據WIPO於2003年發佈之「著作權產業經濟貢獻調查報告(Guide on Surveying the Economic Contribution of the Copyright-based Industries)」以及 Stephen Siwek 發表之「著作權產業對美國經濟之影響報告(Copyright Industries in the U.S. Economy)」。亦即,報告採用WIPO所界定之「核心著作權產業(core copyright industries)」作為其認定何謂「著作權密集產業」的基礎,再將單純只以銷售(distribution)受著作權保護客體為目的之行業加以排除。 三、「智財密集型產業」是驅動美國經濟發展的重要引擎   根據報告,「智財密集型產業」在2010年的產值超過5兆美元,佔美國GDP高達34.8%;同年「智財密集型產業」的貨物出口總金額約7億750萬美元,佔全部貨物出口總額的60.7%。另外,智財密集型的國際服務貿易相關數據資料雖有限,但研究者仍發現在2007年,智財密集型的國際服務貿易約佔全美民營企業服務貿易額的19%。 四、「智財密集型產業」提供至少 4 千萬個就業機會   2010年全美至少有4千萬筆工作,是直接或間接與「智財密集型行業」相關,佔所有工作機會的27.7%。其中直接相關者的從業人數約2,710萬人,佔所有工作機會18.8%;而與「智財密集型行業」間接相關的從業人數約1,290萬人。換句話說,每2個與「智財密集型行業」直接相關的就業機會,就帶來1個額外的工作機會。 五、「智財密集型產業」薪資待遇、教育水準優於其他行業   「智財密集型產業」的平均週薪在2010年為1,156美元,高出其他民營產業別的815美元約42%。其中又以專利及著作權密集產業的薪資成長幅度較高,專利密集行業的薪資從2005年的66%,成長到2010年的73%;著作權密集行業的薪資從2005年的65%,成長到2010年的77%。   而相對高的薪資待遇又與IP密集型行業的教育背景有關。據2010年的統計資料,超過42%的25歲從業人員係具有大專院校學歷,高於其他非IP密集型行業的34%。 參、事件評析 一、我國應建立智財密集行業界定標準並建立數據資料庫,以利掌握產業智財發展動向   智財法令可以保護發明者、創作者免於盜版之害,鼓勵其持續創新,維持競爭優勢,並確保智財權交易、流通市場得以順利運作。但智財保護的界線設定,也相對的影響創新、創意是否有足夠的發展空間,一套經過衡平設計的智財權,影響國家產業經濟甚鉅。   然而如何設計出衡平的法令,並非只須單純的以正義公理做邏輯推論,同時也須仰賴大量統計資料的數據分析,以調查實際運用情形,才能在智財保護體系分寸拿捏之際有所依據。美國商務部的報告開宗明義便指出,必須透過大量數據資料的分析,方能掌握智財在所謂的「智財密集型行業」所扮演的角色。   我國目前在建立智財相關數據資料庫面向,基礎建設不足,無法分析預估產業的發展趨勢及經濟特性,亦不能評估智財對於我國經濟的貢獻程度影響,肇致智財相關政策的立論說明欠缺實證,實應立即著手整備建置相關數據資料庫。 二、推動著作識別碼與存證登記並建立誘因,是評估我國著作權密集型產業經濟貢獻統計分析模式的核心措施   全球經濟發展重心已轉移到音樂、影視、遊戲等文化創意產業,權利別亦跳脫專利權而與著作權息息相關。從韓國等國家智財戰略的方向亦可發現,有賴政策擬訂與相關推動措施,實現以著作權為核心的產業結構。   但從報告中可看出,相較於專利、商標,著作權相關的數據資料較為不足。究其原因,或與著作權採創作保護主義,毋須進行註冊、登記程序有關。由於我國著作權法亦採創作保護主義,且未有存證登記管道,建議可參酌美國、韓國、中國大陸等著作權法與權利登錄有關之規定,並提供登錄者相關誘因,作為我國著作權產業相關統計指標及資料庫之基礎。   而除規劃推動著作物登記制度外,為降低網路侵權對產業經濟造成損害,應一併研議著作物來源識別機制,利用單一著作物內容識別碼,來協助交易雙方經由識別碼查證著作物之來源與權利歸屬,降低著作權授權之風險。同時開發追蹤非法重製物流通之系統,協助權利人進行侵權證據之蒐集與保全,以健全的著作權交易機制,作為發展我國文創軟實力之後盾。 三、確保研發創作者的智財受到有效保護,是促進創新活動、智財交易流通、帶動經濟發展的根本基礎   此報告於一開始即特別指出,專利、商標及著作權提供企業和個人創作者,將無形的發明、創意轉化為實質經濟利益之法律基礎,而一個國家的智財保護機制將連帶影響其整體經濟的商業活動,包括:提供驅動發明、創作的誘因、保護創新者免於未經授權之利用、促進技術市場之垂直分工、媒合資金與創新活動、透過併購及首次公開發行股票 (IPO) ,支援創業初期階段企業資產的流動性及成長、實現以技術授權為基礎的商業模式、促使技術移轉市場與技術及創意交易市場得以更有效率的運作。   為保護研發創作者的權益,國外已有許多國家採取積極主動的措施,例如:韓國為維護韓國業者著作權海外交易秩序及提升交易雙方的信賴,於2012年1月11日指定其所屬的韓國著作權委員會(Korea Copyright Commission)作為著作權認證業務之專責機關,負責推動著作權認證制度。於今年以輸出海外市場 ( 中國等 ) 之音樂、電影、電視劇等內容,作為第一階段著作權認證對象,並提供免手續費之優惠。韓國著作權委員會並設置數位著作交易所 ( 網站 ) ,著作 ( 權 ) 人可將其著作之權利相關資訊登錄至數位著作交易所的「著作權資訊管理系統 (Copyright Integrated Management System,簡稱 CIMS) 」上,CIMS就會給予該著作一組ICN識別碼,讓公眾便於取得授權。韓國文化體育觀光部與特許廳也分別開發有非法重製物及仿冒品之線上追蹤系統,由該二套系統主動蒐集、分析相關侵權資料後,協助權利人交由檢調相關單位採取管制措施。   但回頭檢視我國情況,同樣面臨降低著作權交易可能衍生紛爭之需求,卻沒有著作權官方存證管道,更遑論給予著作權認證制度與重製物及仿冒品之線上追蹤協助。未來著實應該借鏡韓國作法,規劃推動符合我國產業發展需求的著作權保護機制。 報告原文:The full report can be found online at http://www.uspto.gov/news/publications/IP_Report_March_2012.pdf

因應虛擬貨幣發展,日本內閣通過修法草案,允許創投基金得持有加密資產

日本經濟產業省(METI)2024年2月16日於官網公布,內閣已審議通過《產業競爭力強化法》(Act on Strengthening Industrial Competitiveness)、《投資事業有限合夥契約法》(Limited Partnership Act for Investment, LPS法)等法律修正案。修法目標係為驅動企業投資新創、促進新創事業發展,其中允許創業投資基金(Venture Capital Fund, VC)得持有加密資產(crypto assets)即為本次修法亮點之一。 根據本次《投資事業有限合夥契約法》修正案,加密資產將被增列到「投資事業有限合夥」(Investment limited partnership, Investment LPS)得收購和持有的資產清單中。實務上日本創投基金多依《投資事業有限合夥契約法》規定,採投資事業有限合夥之組織型態存在。故若修正案最終能落實,將使新創事業得以透過向創業投資基金發行加密資產之方式進行籌資,可以大幅提高「加密貨幣與區塊鏈領域」之Web3新創獲得國內創業投資基金投資的機會,有助於日本建立更強大的區塊鏈技術(Blockchain Technology)和去中心化金融(decentralized finance, DeFi)市場。 日本本次修法,同時兼顧保護投資者利益與金融創新,頗值得我國借鏡。我國金管會雖已相繼公布「虛擬通貨平台及交易業務事業防制洗錢及打擊資恐辦法」以及「管理虛擬資產平台及交易業務事業(VASP)指導原則」,惟相關規範尚未完成細節。金管會主委今年初(2024年1月30日)表示,將朝設置專法強化投資人保障及管理之方向進行委外研究,草案預計今年9月出爐。面對區塊鏈技術暨加密資產快速發展帶來的監理挑戰,我國應持續積極關注國際組織及各國主管機關之監理發展方向,以研擬合適之法制規範。

印度民航局發布無人機規則草案

  印度民航局(Directorate General of Civil Aviation,以下簡稱DGCA)在禁止公眾使用無人機多年後,終於在2017年11月1日發布無人機使用規則(草案),並於網站上公開徵求意見。民航局部長P Ashok Gajapathi Raju表示,草案將於接下來的30日內,與所有利益相關者進行交流,一旦協商完成,將會確定無人機監管框架。預計今年12月底前完成訂定無人機使用管理規範,包含商業用途無人機。   根據規則草案,無人機依照最大起飛重量將其分為五類,分別為: 奈米(nano)無人機:重量小於250克; 微型(micro)無人機:重量在250克和2公斤之間; 迷你無人機(mini):重量介於2公斤至25公斤; 小型無人機:重量25公斤至150公斤; 大型無人機:重量150公斤以上。   除了飛行能力不超過50英尺高度的奈米無人機,所有無人機必須依照DGCA規定取得識別碼(Unique Identification Number)。針對2公斤以上的無人機需有無人機操作員許可證(Unmanned Aircraft Operator Permit),任何無人機的遙控飛行員必須年滿18歲,且需受過規定的培訓。   另,基於安全考量,草案規定禁止飛行無人機之區域,例如:機場範圍半徑5公里內、國際邊界50公里範圍內、戰略區域500公尺以內的國家重地、人口稠密地區、影響公共安全或正在進行緊急行動的地區、移動式平台(如:汽車、飛機或輪船)、及國家公園和野生動物保護區等生態敏感區域(eco-sensitive areas)等,違規者將依印度刑法之規定起訴。

猴子自拍照著作權爭議;美國法院:動物無法擁有著作權

  2015年1月6日,美國聯邦地區法官裁定,猴子用照相機自拍,猴子無法取得自拍照的著作權。   英國攝影師Slater在四年前,讓黑冠猴Naruto使用其相機,成功的拍出了罕見的黑冠猴自拍照;而攝影師Slater後來把這些自拍照收錄在出版書中,並同時在網路上公開,並獲得廣大迴響。但之後維基百科(Wikipedia)收進免費圖片資源中,供大眾免費下載使用,Slater認為則認為這些照片的著作權已經被英國官方認可屬於Slater所開設的公司,此認可應適用於全世界。惟美國著作權局在2014年最新政策中,認為著作權登記僅適用「人類作品」,據此Naruto之自拍照並不受著作權保障。   而善待動物組織PETA(People for the Ethical Treatment of Animals)組織也加入了著作權爭奪戰局,其認為由Naruto所拍攝自拍照,其著作權應屬於Naruto,但由於Naruto不懂如何行使權利,故由PETA代為管理著作權,相關收益均會用於保護黑冠猴,並且向舊金山聯邦法院提出告訴。美國聯邦法院則在2016年1月6日判決,目前著作權法仍未將保護範圍擴張至動物作品上,故Naruto並未擁有該自拍照著作權,自無PETA代掌著作權可能;PETA接獲判決後表示會提出上訴。

TOP