在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。
美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。
與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。
但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。
日本內閣府在2020年7月17日發布「2020年統合創新戰略(統合イノベーション戦略2020,下稱創新戰略2020)」政策文件。創新戰略為內閣府轄下綜合科學技術與創新會議(総合科学技術・イノベーション会議)依據日本科學技術基本計畫,自2018年起固定於每年度發布。其目的係自全球性的觀點出發,提出含括科研創新之基礎研究至應用端的整體性策略。本年度創新戰略著眼於COVID-19疫情流行與世界各地大規模災害頻仍下,日本科研與創新政策所面臨的課題以及應採取的對策,並擴大科研領域,納入人文社會科學。 創新戰略2020指出,因COVID-19疫情影響,醫療體系、社經生活與研發活動皆受到程度不等的衝擊,包含零接觸經濟興起、社交方式改變與實體研究室關閉等。與此同時,美中科技對抗、GAFA數位壟斷爭議、極端氣候與天然災害等國內外情勢變遷快速。在此背景下,日本的首要課題為建構不間斷且強韌的醫療、教育、公共事業等社會服務體系,維繫國內外社會的鏈結。為此,應透過加速數位化,促成創新活動,同時強化研發能量,實現以人為本的「Society5.0」之社會。 基此,創新戰略2020提出了以下四項具體對策: (1)建立足以應對疫情困境、具韌性的社會經濟體系:在公衛醫療體系,進行疫苗與醫療儀器之研發,並運用數位科技傳遞訊息;因應科研創新與產學合作受疫情影響停擺,給予及時資助,如培育年輕創業者、提供推動引導研發補助(開発研究促進助成金,通稱Gap Fund)等;推動教育、研究、物流等各領域的數位化,同時自經濟安全保障的觀點,強化供應鏈韌性。 (2)創新創造:透過官民合作,實踐智慧城市的構想;同時持續推動「STI for SDGs路線圖(STI for SDGsロードマップ)」政策;藉由實踐研究誠信(研究インテグリティ),加強與國際網路合作;另一方面,應發展post 5G與Beyond 5G等前瞻數位基礎技術,並持續建置各領域的資料流通基礎設施。 (3)強化科研與創新之研究能量:建立能充分吸引年輕人才挑戰、進行創新研發的研究環境,同時成立基金以建構世界級的研究基礎設施;以充分活用大學研發成果為目標,檢討智財制度發展的願景;結合人文社會科學領域研究,並活用射月型研發(ムーンショット型研究開発)制度,發展社會問題解決方案。 (4)重要科技發展項目:於基礎技術層次,包含AI、生化科技、量子技術、材料等,對此應優先投入研發、培育相關人才;於應用科學層次,則包含防災、防疫、資安、能源、健康醫療、航太、糧食、農漁產業等。
猴子自拍照著作權爭議;美國法院:動物無法擁有著作權2015年1月6日,美國聯邦地區法官裁定,猴子用照相機自拍,猴子無法取得自拍照的著作權。 英國攝影師Slater在四年前,讓黑冠猴Naruto使用其相機,成功的拍出了罕見的黑冠猴自拍照;而攝影師Slater後來把這些自拍照收錄在出版書中,並同時在網路上公開,並獲得廣大迴響。但之後維基百科(Wikipedia)收進免費圖片資源中,供大眾免費下載使用,Slater認為則認為這些照片的著作權已經被英國官方認可屬於Slater所開設的公司,此認可應適用於全世界。惟美國著作權局在2014年最新政策中,認為著作權登記僅適用「人類作品」,據此Naruto之自拍照並不受著作權保障。 而善待動物組織PETA(People for the Ethical Treatment of Animals)組織也加入了著作權爭奪戰局,其認為由Naruto所拍攝自拍照,其著作權應屬於Naruto,但由於Naruto不懂如何行使權利,故由PETA代為管理著作權,相關收益均會用於保護黑冠猴,並且向舊金山聯邦法院提出告訴。美國聯邦法院則在2016年1月6日判決,目前著作權法仍未將保護範圍擴張至動物作品上,故Naruto並未擁有該自拍照著作權,自無PETA代掌著作權可能;PETA接獲判決後表示會提出上訴。
論政府資料探勘應用之個人資料保護爭議 微軟將針對美國政府是否對其在都柏林之主機具有管轄權提出上訴在2014年4月時,美國裁決法官James Francis就聯邦檢察官的申請,依據1986年的「電子通訊隱私法」(Electronic Communications Privacy Act, “ECPA”)第2703條第a項之規定,針對微軟客戶的e-mail對微軟公司發出了搜索令。然而,該搜索令所要求的e-mail資料儲存在微軟位於愛爾蘭都柏林的資料中心,因此微軟以美國政府對於愛爾蘭並無司法管轄權為由,拒絕配合執行該搜索令,並且對發出搜索令的法官提出異議。但是Francis法官認為這並不是「域外搜索令」(extraterritorial search warrants),並指出在網路互聯的世界中,重點是對資料的控制,而不是「電子財產」的所在位置,於是拒絕了微軟的異議。 於2014年7月,微軟向紐約曼哈頓地方法院再度針對該搜索令提出異議,主張如果美國法院依據「電子通訊隱私法」要求資訊服務提供者提供位於愛爾蘭主機的客戶電子郵件資料,應透過美國與愛爾蘭政府的「多邊司法互助協定(Mutual Legal Assistance Treaty,“MLTA”)」來進行。但地方法院做出以下的裁決:1.在網路世界,電子財產之地理位置不是絕對的;2. 「電子通訊隱私法」第2703條a項所稱之搜索令並不是傳統上的搜索令,而是「搜索令」與「傳票」性質混合的命令,功能是為了讓網路服務業者(Internet Service Provider, “ISP”)提供所擁有的資料給法院;3.國會應無意透過繁瑣的「司法互助協定」來取得位於海外的電子證據;據此,地方法院維持Francis裁決法官的裁決,並且判定微軟藐視法庭。 微軟隨後在2014年12月,以地方法院使用了錯誤的法律理由、沒有根據的推斷立法目的、疏漏重要判決先例的援引、逾越國會立法的優先權並且誤解了「網路流通」的概念等理由,向美國第二巡迴法院提出上訴。 目前蘋果、AT&T、思科、Verizon以及其他科技公司都支持微軟的上訴,認為如果認可美國政府對於本國公司在境外所設置的資訊主機有司法管轄權,將會嚴重衝擊美國以外國家的資料保護法。此案目前仍在法院審理中。