日本學術會議所屬「深化與推動開放科學檢討委員會(オープンサイエンスの深化と推進に関する検討委員会)」為深化與推動開放科學發展,於2020年5月28日發布建言(原文為提言)。本建言接續國際間提倡的「資料驅動型科學」、與日本Society5.0政策內「資料驅動型社會」構想,目的在於凸顯研究資料共享概念與共享平台的重要性,梳理現行措施下的問題,並提出政策與制度調適建議。 建言提出三項觀察。其一,研究論文投稿至期刊出版機關,論文尚未審查通過並發表前,論文本身與經整理之研究資料的著作財產權雖屬於原作者所有,出版機關原則會另與投稿作者約定,作者不得對外公開其研究成果與研究資料,目的在於避免未經審查通過的成果與資料散布,造成錯誤訊息流通。COVID-19疫情蔓延期間,美國國家衛生研究院(National Institutes of Health, NIH)、國立研發法人日本醫療研究開發機構(AMED)等研究資助機構,則依循過往大規模傳染病發生時的慣例,與期刊出版機關等達成協議並發表聲明,只要作者同意釋出,即允許有關論文發表前得先將研究成果與資料與WHO及外界共享,期待藉資料快速公開流通協助對抗疫情。這些措施體現了資料的重要性與共享可能性,但共享後,利用方新取得的資料應如何繼續以適切方式公開,則有賴資料的數位平台機制完備現行作法的不足。其二,資料本身非著作物,不直接受著作權法保護,各國法例亦較少另外賦予資料庫(database)法定權利。日本則在不正競爭防止法增訂「提供予特定對象資料(限定提供データ)」保護制度,定義非法取用原僅授權特定人使用之資料的行為,將落入不當競爭行為的範疇,強化營業與數位資料利用之法定權利保護。其三,近年來,日本公平交易委員會因應Google、Amazon可能運用資料蒐集達成市場壟斷的疑慮,重新檢討其反托拉斯政策,顯示資料利用亦可能牴觸反托拉斯法;歐盟一般資料保護規則(GDPR)的規範強度與密度較日本國內法為高,則讓資料利用涉及個資時,無法僅以日本個資法為標準。資料利用涉及多部法規,增加資料利用者合法使用的難度,從而降低研究者再利用研究資料的意願。 基於上述觀察,本建言提出以下法制與政策建議:(1)統整不正競爭防止法、個人資料保護法、著作權法等相關法規範,同時考量研究資料本身特性與社會應用途徑,作成指引供外界遵循;(2)國家應資助學術界或進行研發活動之機構,建構得長期蒐整、保存與共享研究資料之平台,協助實現跨領域或跨部門的研究資料融合利用與價值創造;(3)針對研究成果採用的原始樣本(如岩石、土壤、生物、物質等),以及人文社會科學領域研究的原始資料(如文書紀錄、書籍、技術等),建立永久保存之制度。
日本與歐盟間個人資料之國際傳輸歐盟委員會(European Commission)原則上禁止將歐盟境內的個人資料傳輸至境外,只有經歐盟委員會認定其個人資料保護機制達到歐盟認可標準的國家或地區例外,例如:瑞士、加拿大、以色列等。而日本未能進入前揭國家之列的主要原因,係日本之個人資料保護法未將政府部門納入規範對象。但是基於經濟全球化的需求,日本與歐盟自2017年第一季開始加速進行雙邊合意協商。 日本個人資料保護委員會公布,於2017年5月修正施行的個人資料保護法,已符合歐盟資料保護規則中准許進行境外傳輸的標準。其中包括以獨立的個人資料保護機關來確保必要的保全機制能確實執行等五點(新設立個人資料保護委員會、個人資料定義的明確化、個人料去識別化、非法販賣個人資料之處罰、其他)。 歐盟對此表示,雙邊對於個人資料保護之標準的差異性已經漸漸縮小,利於日本與歐盟間個人資料國際傳輸的環境也已經逐漸形成。目前於歐盟境內設立子公司或是設立法人的日本企業,預期2018年即能自由就歐盟境內雇員或顧客的個人資料,進行日本與歐盟間的國際傳輸。 由於歐盟關於個人資料之保護,為歐洲聯盟基本權利憲章(Charter of Fundamental Rights of the European Union)所明定,企業若非法進行個人資料境外傳輸,會被處以高額罰金,金額約相當於該企業一年內全球營業額總額的4%或2000萬歐元,兩者取其高者為上限;股東甚至也可能面臨被提起訴訟的風險。日本此次修法,對日本在歐盟境內的企業經營將帶來莫大的裨益。
數位基礎建設的挑戰與未來-以歐盟「如何掌握歐洲的數位基礎建設需求?」白皮書為中心數位建設在數位化浪潮以及AI來臨的年代,顯得非常重要,也是世界各國重視的議題之一,歐盟於2024年2月提出了「如何掌握歐洲的數位基礎建設需求?」(WHITE PAPER How to master Europe's digital infrastructure needs?)白皮書來匯集專家意見至6月30日止。 數位基礎建設所涵範圍甚廣,包含資訊科技所有的技術系統以及網際網路等等。如果沒有這些建設,將無法順利完成數位轉型及提升競爭力,況且人工智慧以及物聯網時代的到來,正在改變全球消費者的習慣,因此落實數位基礎建設佈建具有相當之必要性。白皮書開門見山地提到數位基礎建設的諸多優點,但要完成目標,需克服許多難題。 數位基礎建設的佈建需投入大量資金,更需仰賴公私協力才可順利達標,因此難題主要圍繞在企業實力以及是否能夠有相當之吸引力,促使企業投資者以龐大的金流支援,而企業投資者之目標以獲利為原則,因此如果要吸引大量投資人進場,必須提出成功施行並獲利的案例來拋磚引玉。白皮書內也提到,歐洲境內固網行動匯流尤其光纖及5G網路覆蓋率較世界各國來的低,且歐盟因為成員國眾多,缺乏單一的市場,難統籌規範,更何況歐盟對於複雜的數位基礎建設生態中,針對參與者沒有明確規範,諸如投入電子通訊網路建置之雲端供應商其權利義務關係,使得參與者無所適從,如何去克服這些絆腳石將會是歐盟的重大挑戰。 為克服數位基礎建設的難題,白皮書建議以三個支柱作為框架,其一為打造共同連結的運算網路系統(Connected Collaborative Computing)作為歐盟經濟體的中樞神經;其二為建立單一的數位市場,整合各國市場機制並建立完善法規制度;最後為所有數位基礎建設須安全且富有韌性,否則遭到攻擊,將會威脅歐盟各國。 數位化的時代,不僅可提提升運作效能,更能促進永續發展,然而工欲善其事,必先利其器,數位基礎建設為不可少之一環,鑒於我國推動數位建設佈建也可能面臨投資誘因的難題,歐盟白皮書所提到的建議以及後續的發展,或許值得我國持續關注。
美國醫療保健領域對新興資料儲存系統理論「資料湖泊」(Data Lake)的應用在現今資訊流通快速蓬勃發展的時代,巨量資料(Big Data)帶來效率與生產力等龐大效益已無庸置疑。相較於將資料以「資料倉儲」(Data Warehouse)模式儲存,「資料湖泊」(Data Lake)被廣泛視為巨量資料快速演進的下一步。 美國的醫療保健領域為因應巨量資料發展並提升醫療保健系統的透明度與有責性,美國醫療保險與補助中心(Centers for Medicare & Medicaid Services, CMS)於2013年底建立CMS虛擬研究資料中心(Virtual Research Data Center, VRDC),讓研究員能夠以安全有效率的方式取得並分析CMS的龐大醫療保健資料。此種資料倉儲模式會對進入的資料預先分類,並整合為特定形式以指導後續分析的方式。缺點在於為讓資料更易於分享,會進行「資料清理」(data cleaning)以檢測及刪除不正確資訊並將其轉換成機器可讀取格式,各資料版本會被強制整合為特別形式,但資料清理和轉換的過程會導致明顯的數據流失,對研究產生不利的限制。有鑑於此,為更有效益的應用巨量資料,Pentaho首席技術官James Dixon提出新的資料儲存理論—資料湖泊(Data Lake),此概念於2011年7月21日首先被討論於美國《富士比》雜誌中,目前在英美國家公部門和民間企業間已被熱烈討論。 與Data Warehouse最大不同在於Data Lake可包含「未被清理的資料」(unclean data),保持其最原始的形式。故使用者可取得最原始模式的資料,減少資源上處理數據的必要,讓來自全國各政府機關的資料來源更易於結合。Data Lake主要有四點特性:1.以低成本保存巨量資料(Size and low cost)2.維持資料高度真實性(Fidelity)3.資料易取得(Ease of accessibility)4.資料分析富彈性(Flexible)。儲存超過百萬筆病患資料的加州大學歐文分校醫療中心(UC Irvine Medical Center)即以Hadoop架構為技術建立了一個Data Lake,該中心能以最原始的形式儲存各種不同的紀錄數據直到日後需要被分析之時,可協助維持資料的來源與真實性,並得以不同形式的醫療數據進行分析項目,例如患者再住院可能性的預測分析。 但相對的Data Lake在安全性和檢視權限上也有一定的風險,尤其是醫療保健領域,因為這意味著病患的資料在個資生命週期裡隨時可被取得,因此資訊的取得應被嚴密控制以維持各層級的安全與保障,在建立安全的Data Lake之前,必須審慎考慮誰有資訊檢視權限以及透過什麼媒介取得Data Lake中的資料等問題。