論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心

論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心

資訊工業策進會科技法律研究所
蔡立亭
2020年12月25日

  科學研究以提升全人類之福祉為本,醫療健康研究資料的共享,有助於促進整體科學研究的量能。為促進由政府支持之科學資料與研究發現的近用,美國政府原則上肯定科學之發展與資料之留存、近用相關,資料之公開不僅應遵守法律之限制,尚應注意資料之生命週期,並訂定時限;受政府資助之研究,所產出之資料以免費近用為原則,政府之政策亦應考量國際合作之實際情況[1]。申言之,科學研究資料的近用,有助於提升科學發展,政府於制定共享政策的同時,亦應一併考量國際合作的情況,並以免費近用為原則,研議資料公開策略。

  為增進科學資料的效益,美國國家衛生研究院(National Institutes of Health,簡稱NIH)設置科學政策辦公室(Office of Science Policy,簡稱OSP)制定完整的政策,領域擴及生物安全、基因檢測、基因資料共享、人類受試者保護、NIH的組織與管理,和受NIH資助研究的成果與價值;藉由廣泛的分析與報告,提出新興政策建議[2]。在科學資料共享的層面,NIH聚焦於「基因與健康」和「科學資料管理」,生物醫學研究的進展,取決於科學資料的近用;共享科學資料,有助於驗證研究結果,研究者整合資料以強化分析,提升難以生成資料的再次應用,加速研究進展[3]。NIH藉由資料的管理,促進科學資料的近用,以驗證並共享研究成果。

  為輔助資料之開放共享,NIH公告資料管理與共享政策(NIH Policy for Data Management and Sharing,以下簡稱DMS政策),目的為促進由NIH資助或進行研究的科學資料共享[4]。DMS政策將科學資料定義為:「在科學社群普遍接受記錄事實的素材,研究發現能反覆的驗證,不論該資料是否用以支持學術出版物。科學資料並不包含實驗室筆記、初步分析、完整的個案報告表、科學報告的草稿、未來的研究計畫、同儕評論、與同事的溝通、物理實體,例如實驗室標本[5]。」。換言之,並非僅以該資料是否能佐證學術出版物為科學資料之認定基準,而係以該科學資料是否屬事實之記載,和研究成果能否反覆驗證為判斷。

  另,NIH、NIH研究院、中心、辦公室已有資料預期的共享,如:科學資料的共享、相關標準、資料庫的選擇、時限,適用並於計畫中呈現;若不適用則研究員應在計畫中提出資料共享與管理的方式,NIH並建議資料的管理與共享應實踐FAIR(Findable、Accessible、Interoperable、Reusable)原則,共享的資料類型,首先為一般性的描述、估計在研究中生成或使用的科學資料,次為列出後設資料等有助於解釋科學資料的文件;NIH鼓勵科學資料盡快共享,不遲於資料的出版或執行期間[6]。申言之,即使各該研究計畫不適合既有的共享策略,於計畫提案時,研究團隊仍應研擬適合共享與管理的方式,並以FAIR原則為依準。

  研究團隊提供的科學研究資料,將儲存於由政策或資助方指定的資料庫。NIH提出推薦的資料庫列表[7],並描述理想的儲存資料庫特色為:「具有獨特且永久的識別碼、具有長期持續管理資料的計畫、設置後設資料、整理資料並保證品質、免費並簡易的近用、廣泛且可估計的重複使用、明確的使用指引、安全性與完整性、機密性、共通格式、引用機制,及資料保留策略[8]」。由此觀之,資料庫的設計應易於科學資料的檢索;並在資料的近用上,維護資料之安全、完整、機密等。

  NIH共享資料之實際應用上,為共享基因研究資料,NIH於2014年提出基因資料共享政策(Genomic Data Sharing Policy,以下簡稱GDS政策),包含NIH資助指南與契約;NIH的GDS政策適用於所有NIH資助的研究,生成之大規模人類或非人類之基因資料,將應用於後續的研究[9]。藉此能有效率的推動基因研究向前邁進。

  GDS政策課予研究者提供基因資料的義務;研究者近用基因資料,亦應遵守基於研究使用控制近用資料(Controlled-Access Data)的條款[10]。研究人員受NIH核准後,方能將NIH控制近用的資料,應用於第二次研究(secondary research)[11]。由NIH資料近用委員會(Data Access Committee)審查,研究員近用資料並須遵守基於研究使用控制近用資料的條款[12]。另,基因摘要結果(Genomic Summary Results,以下簡稱GSR)隸屬於NIH政策[13],並依據GDS政策目的,將GSR定義為由研究者提供的摘要統計(summary statistics),非敏感性的資料列入NIH指定的資料庫中[14]。換言之,NIH以對控制近用資料的應用核准,在資料之限制近用與科學發展間,取得平衡。

  為回應COVID-19,加速治療與疫苗的研發,NIH的資料共享與管理政策,緩解全球科學社群開放共享科學資料的需求,該政策並建立資料共享為研究過程的基礎成分[15]。綜上所論,將資料共享內化於研究過程中,有助於全球同步更新研究的進程,共同面對全人類之科學挑戰。

 

 

[1] NATIONAL SCIENCE AND TECHNOLOGY COUNCIL, COMMITTEE ON SCIENCE, SUBCOMMITEE ON INTERNATIONAL ISSUES, INTERAGENCY WORKING GROUP ON OPEN DATA SHARING POLICY, Principles For Promoting Access To Federal Government-Supported Scientific Data And Research Findings Through International Scientific Cooperation (2016), 1, 整理自Principles, at 5-8, https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/NSTC/iwgodsp_principles_0.pdf (last visited December 14, 2020).

[2]About Us, Welcome to NIH Office of Science Policy, NIH National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/about-us/ (last visited December 7, 2020).

[3]NIH Data Management and Sharing Activities Related to Public Access and Open Science, NIH National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/scientific-sharing/nih-data-management-and-sharing-activities-related-to-public-access-and-open-science/ (last visited December 10, 2020).

[4]Final NIH Policy for Data Management and Sharing, NIH National Institutes of Health Office of Extramural Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html (last visited December 11, 2020).

[5]Final NIH Policy for Data Management and Sharing, NIH National Institutes of Health Office of Extramural Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-013.html (last visited December 12, 2020).

[6]Supplemental Information to the NIH Policy for Data Management and Sharing: Elements of an NIH Data Management and Sharing Plan, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-014.html (last visited December 13, 2020).

[7]資料庫列表請參見以下網址:Open Domain-Specific Data Sharing Repositories, NIH National Library of Medicine, https://www.nlm.nih.gov/NIHbmic/domain_specific_repositories.html (last visited December 24, 2020).

[8]Supplemental Information to the NIH Policy for Data Management and Sharing: Selecting a Repository for Data Resulting from NIH-Supported Research, Office of The Director, National Institutes of Health (OD), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-21-016.html (last visited December 13, 2020).

[9]NIH Genomic Data Sharing, National Institutes of Health Office of Science Policy, https://osp.od.nih.gov/scientific-sharing/genomic-data-sharing/ (last visited December 15, 2020).

[10]NIH Genomic Data Sharing Policy, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-14-124.html (last visited December 17, 2020).

[11]NIH Genomic Data Sharing Policy, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-14-124.html (last visited December 17, 2020).

[12]id.

[13]NIH National Institutes of Health Turning Discovery into Health, Responsible Use of Human Genomic Data An Informational Resource, 1, at 6, https://osp.od.nih.gov/wp-content/uploads/Responsible_Use_of_Human_Genomic_Data_Informational_Resource.pdf (last visited December 17, 2020).

[14]Update to NIH Management of Genomic Summary Results Access, National Institutes of Health (NIH), https://grants.nih.gov/grants/guide/notice-files/NOT-OD-19-023.html (last visited December 17, 2020).

[15]Francis S. Collins, Statement on Final NIH Policy for Data Management and Sharing, National Institutes of Health Turning Discovery Into Health, https://www.nih.gov/about-nih/who-we-are/nih-director/statements/statement-final-nih-policy-data-management-sharing (last visited December 14, 2020).

 

 

相關連結
相關附件
※ 論科學資料之開放與共享—以美國國家衛生研究院之資料政策為核心 , 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8586&no=55&tp=1 (最後瀏覽日:2026/02/04)
引註此篇文章
你可能還會想看
加拿大政府提交予國會《人工智慧資料法案》

  加拿大政府由創新、科學和工業部長(Minister of Innovation, Science and Industry)代表,於2022年6月16日提交C-27號草案,內容包括聯邦的私部門隱私權制度更新,以及新訂的《人工智慧資料法案》(Artificial Intelligence and Data Act, 下稱AIDA)。如獲通過,AIDA將是加拿大第一部規範人工智慧系統使用的法規,其內容環繞「在加拿大制定符合國家及國際標準的人工智慧設計、開發與應用要求」及「禁止某些可能對個人或其利益造成嚴重損害的人工智慧操作行為」兩大目的。雖然AIDA的一般性規則相當簡單易懂,但唯有在正式發布這部包含絕大多數應用狀況的法規後,才能實際了解其所造成的影響。   AIDA為人工智慧監管所設立的框架包含以下六項: (1)方法 以類似於歐盟《人工智慧法案》採用的方式,建立適用於人工智慧系統具「高影響力」的應用方式的規範,關注具有較高損害與偏見風險的領域。 (2)適用範圍 AIDA將適用於在國際與省際貿易及商業行動中,設計、發展或提供人工智慧系統使用管道的私部門組織。「人工智慧系統」的定義則涵蓋任何「透過基因演算法、神經網路、機器學習或其他技術,自動或半自動處理與人類活動相關的資料,以產生結果、做出決策、建議或預測」的技術性系統。 (3)一般性義務 I 評估及緩和風險的措施 負責人工智慧系統的人員應評估它是否是一個「高影響系統」(將在後續法規中詳細定義),並制定措施以辨識、評估與減輕使用該系統可能造成的傷害風險或具有偏見的結果。 II 監控 對該「高影響系統」負責的人員應建立準則,以監控風險緩解措施的遵守情況。 III 透明度 提供使用管道或管理「高影響系統」運作的人員應在公開網站上,以清晰的英語揭露   i 系統如何或打算如何使用。   ii 系統所生成果的類型及它所做出的決策、建議與預測。   iii 為辨識、評估與減輕使用該系統可能造成的傷害風險或具有偏見的結果,而制定的緩解措施。   iv 法規明定應揭露的其他訊息。 IV 記錄保存 執行受規範活動的人員應遵守紀錄保存要求。 V 通知 若使用該系統將導致或可能導致重大傷害,「高影響系統」的負責人應通知部門首長。 VI 匿名資料的使用 從事法案所規定的活動及在活動過程中使用或提供匿名資料的人員,必須依據規範制定關於(a)資料被匿名化處理的方式(b)被匿名化資料的使用與管理,兩方面的措施。 (4)部長命令 部門首長可以透過命令要求(a)製作紀錄(b)從事審計或聘請一位獨立的審計師執行(c)成立一個專責執行審計程序的組織(d)成立一個在有理由相信「高影響系統」之使用可能造成急迫重大傷害風險時負責進行終止或准許的組織。 (5)行政管理 AIDA為部門首長制定一項,可指定其所管轄部門中一名高級官員為「人工智慧與資料專員」的權利,其職責在協助部門首長管理與執行AIDA。 (6)罰則 違反AIDA規範之罰則主要為按公司、個人之收入衡量的罰款。特定嚴重狀況如以非法方式取得人工智慧訓練用資料、明知或故意欺騙大眾造成嚴重或心理傷害或財產上重大損失,亦可能判處刑事監禁。

美國明尼亞波利斯市禁止政府部門使用人臉辨識技術

  美國明尼蘇達州明尼亞波利斯市的市議會鑑於人臉辨識技術有可靠性的疑慮,以及對有色人種有潛在的傷害,該議會於2021年2月12日通過修正《明尼亞波利斯條例》(Minneapolis Code of Ordinances)關於資訊治理(Information Governance)的部分,新條例規定除有例外情形,禁止政府部門採購人臉辨識技術及使用從該技術獲得之資訊。明尼亞波利斯是繼波士頓、舊金山、奧克蘭等,新加入禁用人臉辨識技術的城市。   新條例是由該市市議會議員Steve Fletcher倡議,其指出市民擔心在未得其同意時使用人臉辨識技術進行監視,是否會侵害市民的隱私權。此外,根據研究亦顯示人臉辨識技術仍存在瑕疵,尤其是辨別婦女、兒童和有色人種的錯誤率相當高,而不正確的識別,恐怕讓弱勢者受到更不利的對待。   明尼亞波利斯市以明尼蘇達州《明尼蘇達政府資料應用法》(Minnesota Government Data Practices Act)中所定資料隱私原則,作為制定新條例的基礎,規定在蒐集有關個人資料時應考慮並重視個人隱私,包含僅在具備理由時始得蒐集資訊,並且就蒐集的內容與原因保持透明。再者,新條例要求在市議會設置專門的委員會,市政府應向該委員會提出書面報告,說明新條例遵守的情形,以及追蹤及報告違反的情形及賠償措施。惟隨著技術和情事的變化,政府部門可能有使用人臉辨識技術的需求,就此,新條例規定政府部門需向市議會解釋使用該技術的必要性、說明如何使用該技術及所獲取之資訊、對技術及所獲取之資訊進行監管的計畫,市議會依規定應召開公聽會。若例外情形符合消除歧視、保護隱私、透明與公眾信任的目標,市議會則可同意政府部門使用人臉辨識技術,或要求政府部門修正前述監管計畫,作為市議會同意的條件。

美國寬頻業者推動網路傳輸流量上限管理方案

  有鑑於網路使用人口中,不同使用者族群所消耗的傳輸量比例相差懸殊,美國寬頻業者於近來積極推動網路傳輸流量上限管理計畫,且繼Comcast與Time Warner等業者的初步嘗試後,美國最重要的網路服務提供者—AT&T,也宣布將開始進行客戶網路流量管理計畫。   這項嘗試計畫將以限制新的DSL用戶為起點,其所規定的每月下載與上傳流量上限,係依據客戶申請的寬頻方案有所不同,分別被限制在20G至150G (gigabytes)不定。超過的部分則將持續向使用者警告兩個月後,依每超過1G加收一美元的費用,向使用者收費。   至於提出此項管理方案的理由,據AT&T發言人表示,是因為網路頻寬的使用分佈過於不平均,高達46%的頻寬是5%的使用者在使用,而21%的頻寬更是只為極少數的1%用戶所使用,顯然太過集中。根據AT&T的傳輸上限規定,購買傳輸速度3M (megabits)的寬頻使用者,日後每月的傳輸量上限是60G,這大約等於是下載30部DVD畫質電影的傳輸量。   不過,也有分析師指出,現階段欲全面滿足使用者的頻寬需求,對網路服務提供者而言尚非極大的財務負擔,且管制流量上限的作法,可能對既有以「吃到飽」費率方案為基礎,所發展出來的網路應用服務模式,造成極大的衝擊,此亦也可能引發後續有關網路中立性的政策辯論。

CODEX增訂低量摻雜重組DNA植物成分之食品安全評估準則

  經過兩年的研議溝通,由國際食品標準委員會(Codex Alimentarius Commission,CODEX)生技衍生食品小組(Task Force on Foods Derived from Biotechnology,TFFBT)所研擬的「重組DNA植物成分低量摻雜之重組DNA植物來源食品安全評估準則之附件草案」(Draft Annex to the Guideline for the Conduct of Food Safety Assessment of Foods Derived from Recombinant-DNA Plants on Low-Level Presence of Recombinant-DNA Plant Material,LLP草案),終於日前送交CODEX大會決議通過。   關於植物來源食品內基改物質低量呈現(Low-Level Presence)的問題之所以受到國際間高度關切,其背景因素,其實是來自於全球各地域對於基因改造食品之食品安全審查進度狀態不一之情況使然。以最明顯的美國和歐盟為例,因為,對於植物來源食品而言,其所使用的植物原料,例如穀物、豆類、油菜種子等,在種植、運送至成品途中,尤其是在採收過程中,無可避免地均有可能會混雜到某些鄰近的合法基改植物原料;而目前國際現況是,許多在美國已通過食品安全評估之基改食品植物原料,在歐盟卻遲未獲得許可,而那些意外混雜了在美國為合法基改植物原料的食品,出口至尚未核准那些經混雜基改原料食品之國家時,則會因此被拒絕進口,而形成貿易上阻礙。   針對此問題,自2006年起,TFFBT特別召集成立一個工作小組,由美國出任小組主席,並與德國及泰國擔任共同主席,負責研擬LLP草案,以提供一套較簡易評估程序,專門針對這些混雜了低量的在出口國家已經合法、但在進口國家尚未通過食品安全檢驗之重組DNA植物成分食品之情形,提俱一套安全評估方法供進口國家政府參考,藉此,一方面確保這些摻雜低量重組DNA食品之安全性,另方面也不致令進口者因其產品含有低度摻雜而銷耗掉太過的貿易利益。   LLP草案對於摻雜低量重組DNA成份之進口國家而言,其較重要具實質意義的部份,係在於資料庫之建立、共享資訊之快速使用(rapid access)等機制的導入。研議期間,工作小組即表示會與相關國際組織聯繫,搭配建立適當之資訊資料庫。而負責籌設該資料庫的國際糧農組織(FAO)則表示,其除將運用其已建立的「國際食品安全及動植物健康入口網」(International Portal on Food Safety, Animal and Plant Health,IPFSAPH)外,並計劃與經濟合作發展組織(OECD)進行合作,引用「OECD生物追蹤產品資料庫」(OECD BioTrack Database)內依CODEX「重組DNA植物來源食品安全評估準則」(Guideline for the Conduct of Foods Safety Assessment of Foods Derived from Recombinant-DNA Plants (CODEX Plant Guideline),CODEX植物準則)所蒐羅之資訊,彙集各類相關資訊為一整合網站,並開放給公眾使用。

TOP