論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心
資訊工業策進會科技法律研究所
蔡立亭
2020年12月25日
科學研究以提升全人類之福祉為本,醫療健康研究資料的共享,有助於促進整體科學研究的量能。為促進由政府支持之科學資料與研究發現的近用,美國政府原則上肯定科學之發展與資料之留存、近用相關,資料之公開不僅應遵守法律之限制,尚應注意資料之生命週期,並訂定時限;受政府資助之研究,所產出之資料以免費近用為原則,政府之政策亦應考量國際合作之實際情況[1]。申言之,科學研究資料的近用,有助於提升科學發展,政府於制定共享政策的同時,亦應一併考量國際合作的情況,並以免費近用為原則,研議資料公開策略。
為增進科學資料的效益,美國國家衛生研究院(National Institutes of Health,簡稱NIH)設置科學政策辦公室(Office of Science Policy,簡稱OSP)制定完整的政策,領域擴及生物安全、基因檢測、基因資料共享、人類受試者保護、NIH的組織與管理,和受NIH資助研究的成果與價值;藉由廣泛的分析與報告,提出新興政策建議[2]。在科學資料共享的層面,NIH聚焦於「基因與健康」和「科學資料管理」,生物醫學研究的進展,取決於科學資料的近用;共享科學資料,有助於驗證研究結果,研究者整合資料以強化分析,提升難以生成資料的再次應用,加速研究進展[3]。NIH藉由資料的管理,促進科學資料的近用,以驗證並共享研究成果。
為輔助資料之開放共享,NIH公告資料管理與共享政策(NIH Policy for Data Management and Sharing,以下簡稱DMS政策),目的為促進由NIH資助或進行研究的科學資料共享[4]。DMS政策將科學資料定義為:「在科學社群普遍接受記錄事實的素材,研究發現能反覆的驗證,不論該資料是否用以支持學術出版物。科學資料並不包含實驗室筆記、初步分析、完整的個案報告表、科學報告的草稿、未來的研究計畫、同儕評論、與同事的溝通、物理實體,例如實驗室標本[5]。」。換言之,並非僅以該資料是否能佐證學術出版物為科學資料之認定基準,而係以該科學資料是否屬事實之記載,和研究成果能否反覆驗證為判斷。
另,NIH、NIH研究院、中心、辦公室已有資料預期的共享,如:科學資料的共享、相關標準、資料庫的選擇、時限,適用並於計畫中呈現;若不適用則研究員應在計畫中提出資料共享與管理的方式,NIH並建議資料的管理與共享應實踐FAIR(Findable、Accessible、Interoperable、Reusable)原則,共享的資料類型,首先為一般性的描述、估計在研究中生成或使用的科學資料,次為列出後設資料等有助於解釋科學資料的文件;NIH鼓勵科學資料盡快共享,不遲於資料的出版或執行期間[6]。申言之,即使各該研究計畫不適合既有的共享策略,於計畫提案時,研究團隊仍應研擬適合共享與管理的方式,並以FAIR原則為依準。
研究團隊提供的科學研究資料,將儲存於由政策或資助方指定的資料庫。NIH提出推薦的資料庫列表[7],並描述理想的儲存資料庫特色為:「具有獨特且永久的識別碼、具有長期持續管理資料的計畫、設置後設資料、整理資料並保證品質、免費並簡易的近用、廣泛且可估計的重複使用、明確的使用指引、安全性與完整性、機密性、共通格式、引用機制,及資料保留策略[8]」。由此觀之,資料庫的設計應易於科學資料的檢索;並在資料的近用上,維護資料之安全、完整、機密等。
NIH共享資料之實際應用上,為共享基因研究資料,NIH於2014年提出基因資料共享政策(Genomic Data Sharing Policy,以下簡稱GDS政策),包含NIH資助指南與契約;NIH的GDS政策適用於所有NIH資助的研究,生成之大規模人類或非人類之基因資料,將應用於後續的研究[9]。藉此能有效率的推動基因研究向前邁進。
GDS政策課予研究者提供基因資料的義務;研究者近用基因資料,亦應遵守基於研究使用控制近用資料(Controlled-Access Data)的條款[10]。研究人員受NIH核准後,方能將NIH控制近用的資料,應用於第二次研究(secondary research)[11]。由NIH資料近用委員會(Data Access Committee)審查,研究員近用資料並須遵守基於研究使用控制近用資料的條款[12]。另,基因摘要結果(Genomic Summary Results,以下簡稱GSR)隸屬於NIH政策[13],並依據GDS政策目的,將GSR定義為由研究者提供的摘要統計(summary statistics),非敏感性的資料列入NIH指定的資料庫中[14]。換言之,NIH以對控制近用資料的應用核准,在資料之限制近用與科學發展間,取得平衡。
為回應COVID-19,加速治療與疫苗的研發,NIH的資料共享與管理政策,緩解全球科學社群開放共享科學資料的需求,該政策並建立資料共享為研究過程的基礎成分[15]。綜上所論,將資料共享內化於研究過程中,有助於全球同步更新研究的進程,共同面對全人類之科學挑戰。
[1] NATIONAL SCIENCE AND TECHNOLOGY COUNCIL, COMMITTEE ON SCIENCE, SUBCOMMITEE ON INTERNATIONAL ISSUES, INTERAGENCY WORKING GROUP ON OPEN DATA SHARING POLICY, Principles For Promoting Access To Federal Government-Supported Scientific Data And Research Findings Through International Scientific Cooperation (2016), 1, 整理自Principles, at 5-8, https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/NSTC/iwgodsp_principles_0.pdf (last visited December 14, 2020).
[2]About Us, Welcome to NIH Office of Science Policy, NIH National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/about-us/ (last visited December 7, 2020).
[3]NIH Data Management and Sharing Activities Related to Public Access and Open Science, NIH National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/scientific-sharing/nih-data-management-and-sharing-activities-related-to-public-access-and-open-science/ (last visited December 10, 2020).
[4]Final NIH Policy for Data Management and Sharing, NIH National Institutes of Health Office of Extramural Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html (last visited December 11, 2020).
[5]Final NIH Policy for Data Management and Sharing, NIH National Institutes of Health Office of Extramural Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html (last visited December 12, 2020).
[6]Supplemental Information to the NIH Policy for Data Management and Sharing: Elements of an NIH Data Management and Sharing Plan, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-014.html (last visited December 13, 2020).
[7]資料庫列表請參見以下網址:Open Domain-Specific Data Sharing Repositories, NIH National Library of Medicine, https://www.nlm.nih.gov/NIHbmic/domain_specific_repositories.html (last visited December 24, 2020).
[8]Supplemental Information to the NIH Policy for Data Management and Sharing: Selecting a Repository for Data Resulting from NIH-Supported Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-016.html (last visited December 13, 2020).
[9]NIH Genomic Data Sharing, National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/scientific-sharing/genomic-data-sharing/ (last visited December 15, 2020).
[10]NIH Genomic Data Sharing Policy, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-14-124.html (last visited December 17, 2020).
[11]NIH Genomic Data Sharing Policy, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-14-124.html (last visited December 17, 2020).
[12]id.
[13]NIH National Institutes of Health Turning Discovery into Health, Responsible Use of Human Genomic Data An Informational Resource, 1, at 6, https://osp.od.nih.gov/wp-content/uploads/Responsible_Use_of_Human_Genomic_Data_Informational_Resource.pdf (last visited December 17, 2020).
[14]Update to NIH Management of Genomic Summary Results Access, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-19-023.html (last visited December 17, 2020).
[15]Francis S. Collins, Statement on Final NIH Policy for Data Management and Sharing, National Institutes of Health Turning Discovery Into Health, https://www.nih.gov/about-nih/who-we-are/nih-director/statements/statement-final-nih-policy-data-management-sharing (last visited December 14, 2020).
日本著作權法在2018年修正時,在第35條針對教育相關資通訊(利用網路進行線上教學與傳送預複習資料)之權利對應規定進行增修。修正前,利用人在每次利用時,均需獲得個別權利人之同意並支付授權金;而修正後,僅需一站式的支付補償金即可,無須得到權利人之許可。 然而本條規定原訂於2021年4月施行,但因為新冠肺炎疫情蔓延影響,許多學校、教學機構因停課而使得線上教學之需求提高。日本文化廳為防止感染並考量停課措施有可能長期化,宣布將文學作品、論文及新聞記事等作為線上教學教材,自本月開始無須得著作權人之許可即可使用,亦即將修正施行日期大幅提前。 而作為日本著作權人補償金分配窗口之「教學目的公眾放送補償金管理協會」,也在今年(2020年)4月6日決定本年度相關作品之補償金以特例無償之方式處理。依據上開規定,本年度的線上教學,不論是文學或是音樂等作品,均無須取得著作權人之同意,即可免費使用。
調查指出:美國民眾對無線電視數位化缺乏準備美國審計部(Government Accountability Office, GAO)就無線電視數位化轉換一事進行調查並於2008年6月10日公布報告。該調查報告發現,雖然超過8成民眾對無線電視數位化有所認知,但亦有許多民眾認知有誤。 此外,該調查報告亦指出,收看無線電視之民眾中,45%尚未購買機上盒以因應無線電視數位化;反之並不需要為數位化進行準備之民眾(如收看有線電視或衛星電視者),卻有30%表示已經做好無線電視數位化之因應措施。在此同時,仍有部分低功率電視台將不會全面數位化,故接收無線電視之民眾可能必須備有同時可接收類比與數位訊號之設備,方能夠維持其無線電視的收視。 為鼓勵民眾購買數位機上盒,美國國家電信與資訊管理局(National Telecommunications and Information Administration, NTIA)稍早已經發出80萬張折價券,但僅有不到一半的折價券被使用,至於尚未被使用的折價券亦已逾期而無法使用。 除機上盒的準備外,隨著訊號數位化,無線電視台的訊號強度及受干擾程度也將有所改變,故無線電視台需調整電台或天線的位置,以避免部分地區民眾在數位化後無法收看清晰的影像。美國通訊傳播委員會之工程師指出,約有1%的民眾可能會有前述困擾,但截至目前為止,仍有部分電視台受限於經費問題而尚未有所因應。
歐盟執委會發表數位政府有助於因應COVID-19疫情之說明歐盟執委會(European Commission, EC)於2020年3月24日發表新聞稿,說明在COVID-19疫情期間,各國政府要求人民保持社交距離甚或自我隔離;人民無法會面互動下,數位政府政策成為維持正常生活的解套方式。歐盟於新聞稿中重申先前建構「歐盟內部市場電子交易之電子身分認證與信賴服務規則」(REGULATION EU No 910/2014 OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL of 23 July 2014 on electronic identification and trust services for electronic transactions in the internal market and repealing Directive 1999/93/EC,以下簡稱 eIDAS)、電子識別(electronic identification, eID)以及發展信任服務(trust services)的必要性,例如電子戳記(eTimestamps)、電子圖章(eSeals)、電子簽章(eSignatures)、網站認證(Website authentication)等均屬之。歐盟公民無須離開住宅,即可和公部門互動。 除了公部門,信任服務可以支援歐盟企業(特別是疫情嚴重地區的中小型企業)遠端執行業務,維持業務連續性。例如金融服務對交易、認證、安全性及防洗錢等領域發展數位化:eID識別客戶身分、整合同一客戶的海外金融帳戶服務、遠端驗證防洗錢要求;電子簽章可與客戶遠端簽署金融服務契約;電子註冊交付服務(electronic registered delivery service)則作為安全交換重要文件或契約之機制。 在零售業而言,安全的電子交易對於線上業務尤為重要。例如eID可對購買酒類等管制商品或藝術品等高價商品之消費者進行更嚴格的身分檢查;電子簽章和電子戳記則強化文件及流程追蹤機制,降低追蹤成本。 在運輸部門,以汽車共享服務為例,eID可用於證明客戶的身份,提供安全登錄,並允許客戶進行遠端車輛解鎖。而貨運及物流產業,若在不同營運商運送之間遇有延遲,則電子戳記可使責任歸屬更加明確。另外,對重要文件使用電子圖章,可證明文件完整性、有效性並減少對紙本文件的依賴,並降低疫情期間會面之風險。
世界經濟論壇發布《人工智慧公平性和包容性藍圖》白皮書世界經濟論壇(World Economic Forum, WEF)於2022年6月29日發布《人工智慧公平性和包容性藍圖》白皮書(A Blueprint for Equity and Inclusion in Artificial Intelligence),說明在AI開發生命週期和治理生態系統中,應該如何改善公平性和強化包容性。根據全球未來人類AI理事會(Global Future Council on Artificial Intelligence for Humanity)指出,目前AI生命週期應分為兩個部分,一是管理AI使用,二是設計、開發、部署AI以滿足利益相關者需求。 包容性AI不僅是考量技術發展中之公平性與包容性,而是需整體考量並建立包容的AI生態系統,包括(1)包容性AI基礎設施(例如運算能力、資料儲存、網路),鼓勵更多技術或非技術的人員有能力參與到AI相關工作中;(2)建立AI素養、教育及意識,例如從小開始開啟AI相關課程,讓孩子從小即可以從父母的工作、家庭、學校,甚至玩具中學習AI系統對資料和隱私的影響並進行思考,盡可能讓使其互動的人都了解AI之基礎知識,並能夠認識其可能帶來的風險與機會;(3)公平的工作環境,未來各行各業需要越來越多多元化人才,企業需拓寬與AI相關之職位,例如讓非傳統背景人員接受交叉培訓、公私協力建立夥伴關係、提高員工職場歸屬感。 在設計包容性方面,必須考慮不同利益相關者之需求,並從設計者、開發者、監督機關等不同角度觀察。本報告將包容性AI開發及治理整個生命週期分為6個不同階段,期望在生命週期中的每個階段皆考量公平性與包容性: 1.了解問題並確定AI解決方案:釐清為何需要部署AI,並設定希望改善的目標變量(target variable),並透過制定包容性社會參與框架或行為準則,盡可能實現包容性社會參與(特別是代表性不足或受保護的族群)。 2.包容性模型設計:設計時需考慮社會和受影響的利益相關者,並多方考量各種設計決策及運用在不同情況時之公平性、健全性、全面性、可解釋性、準確性及透明度等。 3.包容性資料蒐集:透過設計健全的治理及隱私,確定更具包容性的資料蒐集路徑,以確保所建立之模型能適用到整體社會。 4.公平和包容的模型開發及測試:除多元化開發團隊及資料代表性,組織也應引進不同利益相關者進行迭代開發與測試,並招募測試組進行測試與部署,以確保測試人群能夠代表整體人類。且模型可能隨著時間發展而有變化,需以多元化指標評估與調整。 5.公平地部署受信任的AI系統,並監控社會影響:部署AI系統後仍應持續監控,並持續評估可能出現新的利益相關者或使用者,以降低因環境變化而可能產生的危害。 6.不斷循環發展的生命週期:不應以傳統重複循環過程看待AI生命週期,而是以流動、展開及演變的態度,隨時評估及調整,以因應新的挑戰及需求,透過定期紀錄及審查,隨時重塑包容性AI生態系統。 綜上,本報告以包容性AI生態系統及生命週期概念,期望透過基礎設施、教育與培訓、公平的工作環境等,以因應未來無所不在的AI社會與生活,建立公司、政府、教育機構可以遵循的方向。