論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心

論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心

資訊工業策進會科技法律研究所
蔡立亭
2020年12月25日

  科學研究以提升全人類之福祉為本,醫療健康研究資料的共享,有助於促進整體科學研究的量能。為促進由政府支持之科學資料與研究發現的近用,美國政府原則上肯定科學之發展與資料之留存、近用相關,資料之公開不僅應遵守法律之限制,尚應注意資料之生命週期,並訂定時限;受政府資助之研究,所產出之資料以免費近用為原則,政府之政策亦應考量國際合作之實際情況[1]。申言之,科學研究資料的近用,有助於提升科學發展,政府於制定共享政策的同時,亦應一併考量國際合作的情況,並以免費近用為原則,研議資料公開策略。

  為增進科學資料的效益,美國國家衛生研究院(National Institutes of Health,簡稱NIH)設置科學政策辦公室(Office of Science Policy,簡稱OSP)制定完整的政策,領域擴及生物安全、基因檢測、基因資料共享、人類受試者保護、NIH的組織與管理,和受NIH資助研究的成果與價值;藉由廣泛的分析與報告,提出新興政策建議[2]。在科學資料共享的層面,NIH聚焦於「基因與健康」和「科學資料管理」,生物醫學研究的進展,取決於科學資料的近用;共享科學資料,有助於驗證研究結果,研究者整合資料以強化分析,提升難以生成資料的再次應用,加速研究進展[3]。NIH藉由資料的管理,促進科學資料的近用,以驗證並共享研究成果。

  為輔助資料之開放共享,NIH公告資料管理與共享政策(NIH Policy for Data Management and Sharing,以下簡稱DMS政策),目的為促進由NIH資助或進行研究的科學資料共享[4]。DMS政策將科學資料定義為:「在科學社群普遍接受記錄事實的素材,研究發現能反覆的驗證,不論該資料是否用以支持學術出版物。科學資料並不包含實驗室筆記、初步分析、完整的個案報告表、科學報告的草稿、未來的研究計畫、同儕評論、與同事的溝通、物理實體,例如實驗室標本[5]。」。換言之,並非僅以該資料是否能佐證學術出版物為科學資料之認定基準,而係以該科學資料是否屬事實之記載,和研究成果能否反覆驗證為判斷。

  另,NIH、NIH研究院、中心、辦公室已有資料預期的共享,如:科學資料的共享、相關標準、資料庫的選擇、時限,適用並於計畫中呈現;若不適用則研究員應在計畫中提出資料共享與管理的方式,NIH並建議資料的管理與共享應實踐FAIR(Findable、Accessible、Interoperable、Reusable)原則,共享的資料類型,首先為一般性的描述、估計在研究中生成或使用的科學資料,次為列出後設資料等有助於解釋科學資料的文件;NIH鼓勵科學資料盡快共享,不遲於資料的出版或執行期間[6]。申言之,即使各該研究計畫不適合既有的共享策略,於計畫提案時,研究團隊仍應研擬適合共享與管理的方式,並以FAIR原則為依準。

  研究團隊提供的科學研究資料,將儲存於由政策或資助方指定的資料庫。NIH提出推薦的資料庫列表[7],並描述理想的儲存資料庫特色為:「具有獨特且永久的識別碼、具有長期持續管理資料的計畫、設置後設資料、整理資料並保證品質、免費並簡易的近用、廣泛且可估計的重複使用、明確的使用指引、安全性與完整性、機密性、共通格式、引用機制,及資料保留策略[8]」。由此觀之,資料庫的設計應易於科學資料的檢索;並在資料的近用上,維護資料之安全、完整、機密等。

  NIH共享資料之實際應用上,為共享基因研究資料,NIH於2014年提出基因資料共享政策(Genomic Data Sharing Policy,以下簡稱GDS政策),包含NIH資助指南與契約;NIH的GDS政策適用於所有NIH資助的研究,生成之大規模人類或非人類之基因資料,將應用於後續的研究[9]。藉此能有效率的推動基因研究向前邁進。

  GDS政策課予研究者提供基因資料的義務;研究者近用基因資料,亦應遵守基於研究使用控制近用資料(Controlled-Access Data)的條款[10]。研究人員受NIH核准後,方能將NIH控制近用的資料,應用於第二次研究(secondary research)[11]。由NIH資料近用委員會(Data Access Committee)審查,研究員近用資料並須遵守基於研究使用控制近用資料的條款[12]。另,基因摘要結果(Genomic Summary Results,以下簡稱GSR)隸屬於NIH政策[13],並依據GDS政策目的,將GSR定義為由研究者提供的摘要統計(summary statistics),非敏感性的資料列入NIH指定的資料庫中[14]。換言之,NIH以對控制近用資料的應用核准,在資料之限制近用與科學發展間,取得平衡。

  為回應COVID-19,加速治療與疫苗的研發,NIH的資料共享與管理政策,緩解全球科學社群開放共享科學資料的需求,該政策並建立資料共享為研究過程的基礎成分[15]。綜上所論,將資料共享內化於研究過程中,有助於全球同步更新研究的進程,共同面對全人類之科學挑戰。

 

 

[1] NATIONAL SCIENCE AND TECHNOLOGY COUNCIL, COMMITTEE ON SCIENCE, SUBCOMMITEE ON INTERNATIONAL ISSUES, INTERAGENCY WORKING GROUP ON OPEN DATA SHARING POLICY, Principles For Promoting Access To Federal Government-Supported Scientific Data And Research Findings Through International Scientific Cooperation (2016), 1, 整理自Principles, at 5-8, https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/NSTC/iwgodsp_principles_0.pdf (last visited December 14, 2020).

[2]About Us, Welcome to NIH Office of Science Policy, NIH National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/about-us/ (last visited December 7, 2020).

[3]NIH Data Management and Sharing Activities Related to Public Access and Open Science, NIH National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/scientific-sharing/nih-data-management-and-sharing-activities-related-to-public-access-and-open-science/ (last visited December 10, 2020).

[4]Final NIH Policy for Data Management and Sharing, NIH National Institutes of Health Office of Extramural Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html (last visited December 11, 2020).

[5]Final NIH Policy for Data Management and Sharing, NIH National Institutes of Health Office of Extramural Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html (last visited December 12, 2020).

[6]Supplemental Information to the NIH Policy for Data Management and Sharing: Elements of an NIH Data Management and Sharing Plan, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-014.html (last visited December 13, 2020).

[7]資料庫列表請參見以下網址:Open Domain-Specific Data Sharing Repositories, NIH National Library of Medicine, https://www.nlm.nih.gov/NIHbmic/domain_specific_repositories.html (last visited December 24, 2020).

[8]Supplemental Information to the NIH Policy for Data Management and Sharing: Selecting a Repository for Data Resulting from NIH-Supported Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-016.html (last visited December 13, 2020).

[9]NIH Genomic Data Sharing, National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/scientific-sharing/genomic-data-sharing/ (last visited December 15, 2020).

[10]NIH Genomic Data Sharing Policy, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-14-124.html (last visited December 17, 2020).

[11]NIH Genomic Data Sharing Policy, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-14-124.html (last visited December 17, 2020).

[12]id.

[13]NIH National Institutes of Health Turning Discovery into Health, Responsible Use of Human Genomic Data An Informational Resource, 1, at 6, https://osp.od.nih.gov/wp-content/uploads/Responsible_Use_of_Human_Genomic_Data_Informational_Resource.pdf (last visited December 17, 2020).

[14]Update to NIH Management of Genomic Summary Results Access, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-19-023.html (last visited December 17, 2020).

[15]Francis S. Collins, Statement on Final NIH Policy for Data Management and Sharing, National Institutes of Health Turning Discovery Into Health, https://www.nih.gov/about-nih/who-we-are/nih-director/statements/statement-final-nih-policy-data-management-sharing (last visited December 14, 2020).

 

 

相關連結
相關附件
※ 論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心 , 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?no=64&tp=1&d=8586 (最後瀏覽日:2023/10/04)
引註此篇文章
你可能還會想看
FDA發佈人工智慧/機器學習行動計畫

  美國食品藥物管理署(U.S. Food & Drug Administration, FDA)在2021年1月12日發布有關人工智慧醫療器材上市管理的「人工智慧/機器學習行動計畫」(Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD) Action Plan)。該行動計畫的制定背景係FDA認為上市後持續不斷更新演算法的機器學習醫療器材軟體(Software as Medical Device, SaMD),具有極高的診療潛力,將可有效改善醫療品質與病患福祉,因此自2019年以來,FDA嘗試提出新的上市後的監管框架構想,以突破現有醫療器材軟體需要「上市前鎖定演算法、上市後不得任意變更」的監管規定。   2019年4月,FDA發表了「使用人工智慧/機器學習演算法之醫療器材軟體變更之管理架構—討論文件」(Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine earning (AI/ML)-Based Software as a Medical Device (SaMD) - Discussion Paper and Request for Feedback)。此一諮詢性質的文件當中提出,將來廠商可在上市前審查階段提交「事先訂定之變更控制計畫」(pre-determined change control plan),闡明以下內容:(1)SaMD預先規範(SaMD Pre-Specification, SPS):包含此產品未來可能的變更類型(如:輸入資料、性能、適應症)、變更範圍;(2)演算法變更程序(Algorithm Change Protocol, ACP):包含變更對應之處理流程、風險控制措施,以及如何確保軟體變更後之安全及有效性。   根據「人工智慧/機器學習行動計畫」內容所述,「事先訂定之變更控制計畫」構想被多數(包含病患團體在內)的利害關係人肯認,並於相關諮詢會議當中提出完善的細部建言。FDA將根據收到的反饋意見,於2021年以前正式提出有關人工智慧/機器學習上市後監管的指引草案(Draft Guidance),並持續研究提高演算法透明度、避免演算法偏見的方法。

美國第二大連鎖商信用卡資料外洩

  美國第二大連鎖商塔吉特(Target)在12月19日正式發出郵件通知客戶,表示公司資訊系統因遭駭客入侵,從2013年11月27日至12月15日期間內的刷卡記錄可能遭竊,約莫共4千萬筆,遭竊內容包含姓名、卡號、卡片到期日和卡片驗證碼。目前美國的塔吉特連鎖店推出全面9折的優惠來挽回消費者的信心,並對資料外洩的個別民眾提供免費的信用監督作為補償。   每當資安事件發生時,所有防毒軟體公司及資安管理服務都會跳出來大肆評論,並宣稱這是因為沒有購買自家資安服務或產品的關係,但在塔吉特事件,此番事後諸葛的批判方式顯然不再行得通。   塔吉特的資訊系統先前接受過檢驗,完全符合「支付卡產業資料安全標準(PCI DSS)」,有專家評析不太可能是在銷售點管理(POS)設備上(指擁有收銀、進銷存作業功能的機器)植入惡意軟體,比較可能是從授權與結算的交換系統竊取資料。   塔吉特的信用卡資料外洩事件,引發了一連串的訴訟案件及犯罪調查,目前加州提起了兩件團體訴訟、奧勒岡州一件,損害賠償額估計高於5百萬美元;另外,目前至少有四州的州檢察長(Attorney General)展開了聯合調查,直接要求塔吉特配合提出信用卡資料遭竊事件的相關資訊,民眾和調查機關最關注的在於塔吉特何時得知資料遭竊事件的發生、花了多久時間進行應變以及是否有盡到立即通知當事人的義務。同時間,從塔吉特流出去的數百萬筆信用卡和簽帳卡資料已經開始在黑市中販售每筆價格20至100美元不等。

OECD發布《數位化推進資料治理以促進增長和福祉》、《資料治理政策制定之數位化指南》報告

2023年5、6月經濟合作暨發展組織(Organisation for Economic Cooperation and Development, OECD)在邁向數位化計畫(Going digital Project)下陸續公布53個國家地區科學技術創新政策(science, technology and innovation policy)指標。OECD另一方面也提供許多政策工具供各政府參考,如2022年12月發布《數位化推進資料治理以促進增長和福祉》(Going Digital to Advance Data Governance for Growth and Well-being),並出版《資料治理政策制定之數位化指南》(Going Digital Guide to Data Governance Policy Making),協助應對轉型為數位治理時的潛在益處與風險。 《數位化推進資料治理以促進增長和福祉》指出,數位工具發展使資料蒐集、處理的效能大幅增加,邊際成本快速下降,為經濟、社會注入新驅動力。OECD觀察到COVID-19疫情危機中,各國政府藉多樣的資料有效追蹤疾病並做出相應對策;然而,也出現資料治理不當案例,如有勞動中介機構不慎在資料應用時加深性別勞動的不平等。因此,資料成為治理的戰略資產同時也需詳加了解資料多樣化的特性,在資料跨領域產製、流通與利用的過程中一併考量其益處與風險。 《資料治理政策制定之數位化指南》則點出三個發現,並提供相應策略做為各國政府治理參考。第一,關切資料開放同步產生的益處與風險,建議應確立風險管理的文化並建置透明且開放的資料生態系,以增加使用者的能動性,俾利人們自覺主動利用資料。其次,治理框架應平衡生態系中利害交疊的人民、企業團體、政府各部門等,藉契約範本、行為準則等機制確保決策各環節中利害關係人的參與機會和框架的一致性。第三,資料的邊際成本雖一再降低,然而進入門檻、後續管理的負擔仍重,政府應持續激勵資料的基礎建設投資,促進市場競爭並解決後進者的阻礙。

淺談我國能源關鍵基礎設施資通訊安全法制建構之重要性--以歐盟及德國智慧電表布建發展為例

TOP