2025年12月,日本人工智慧安全研究所(AI Safety Institute,下稱AISI)與日本獨立行政法人情報處理推進機構(Information-technology Promotion Agency Japan,下稱IPA)共同發布《資料品質管理指引》(Data Quality Management Guidebook)。此指引旨於協助組織落實資料品質管理,以最大化資料與AI的價值。指引指出AI加劇了「垃圾進,垃圾出(Garbage in, Garbage out)」的難題,資料品質將直接影響AI的產出。因此,為確保AI服務的準確性、可靠性與安全性,《資料品質管理指引》將AI所涉及的資料,以資料生命週期分為8個階段,並特別強調透過資料溯源,方能建立透明且可檢核的資料軌跡。
1.資料規劃階段:組織高層應界定資料蒐集與利用之目的,並具體說明組織之AI資料生命週期之各階段管理機制。
2.資料獲取階段:此步驟涉及生成、蒐集及從外部系統或實體取得資料,應優先從可靠的來源獲取AI模型的訓練資料,並明確記錄後設資料(Metadata)。後設資料指紀錄原始資料及資料歷程之相關資訊,包含資料的創建、轉檔(transformation)、傳輸及使用情況。因此,需要記錄資料的創建者、修改者或使用者,以及前述操作情況發生的時間點與操作方式。透過強化來源透明度,確保訓練資料進入AI系統時,即具備可驗證的信任基礎。
3.資料準備階段:重點在於AI標註(Labeling)品質管理,標註若不一致,將影響AI模型的準確性。此階段需執行資料清理,即刪除重複的資料、修正錯誤的資料內容,並持續補充後設資料。此外,可添加浮水印(Watermarking)以確保資料真實性與保護智慧財產權。
4.資料處理階段(Data Processing):建立即時監控及異常通報機制,以解決先前階段未發現的資料不一致、錯漏等資料品質問題。
5.AI系統建置與運作階段:導入RAG(檢索增強生成)技術,檢索更多具參考性的資料來源,以提升AI系統之可靠性,並應從AI的訓練資料中排除可能涉及個人資料或機密資訊外洩的內容。
6. AI產出之評估階段(Evaluation of Output):為確保產出內容準確,建議使用政府公開資料等具權威性資料來源(Authoritative Source of Truth, ASOT)作為評估資料集,搭配時間戳記用以查核參考資料的時效性(Currentness),避免AI採用過時的資料。
7.AI產出結果之交付階段(Deliver the Result):向使用者提供機器可讀的格式與後設資料,以便使用者透過後設資料檢查AI產出結果之來源依據,增進透明度與使用者信任。
8.停止使用階段(Decommissioning):當資料過時,應明確標示停止使用,若採取刪除,應留存刪除紀錄,確保留存完整的資料生命週期紀錄。
日本《資料品質管理指引》強調,完整的資料生命週期管理、強化溯源為AI安全與創新的基礎,有助組織確認內容準確性、決策歷程透明,方能最大化AI所帶來的價值。而我國企業可參考資策會科法所創意智財中心發布之《重要數位資料治理暨管理制度規範(EDGS)》,同樣強調從源頭開始保護資料,歷程存證與溯源為關鍵,有助於組織把控資料品質、放大AI價值。
本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
歐洲專利局(European Patent Office,下簡稱EPO)於2020年11月發布了裁定撤銷歐洲專利EP2771468的書面理由。EP2771468是the Broad Institute of Massachusetts Institute of Technology(以下簡稱Broad Institute)持有的一項關於CRISPR(clustered, regularly interspaced, short palindromic repeats)技術的專利。2020年1月,EPO的上訴委員會(Board of Appeal,下簡稱BoA)裁定在該專利的優先權要求被駁回後,專利應予以撤銷。 CRISPR是相對簡單但功能強大的基因編輯工具,使科學家能夠更改DNA序列並修飾基因功能。它具有改變醫學、診斷、治療和預防多種疾病的潛力,已被用於開發診斷試劑盒,可用於檢測傳染病,例如Covid-19。該技術預估在未來五年的價值將超過50億美元。 一般而言,專利申請日是評估專利有效性的日期,但有的專利可能會要求已揭露該發明之較早專利申請的申請日作為優先權日。在本案裡,專利的優先權日期尤為重要,因為還有許多其他機構和研究人員聲稱在Broad Institute之前就已經發現CRISPR技術。 在2018年,EPO的異議庭(Opposition Division)認為EP2771468專利無權享有部分專利的優先權。因為其主張優先權的美國專利臨時案共有四名申請人,但在EPO提交專利時,有一位申請人未包含其中。因此,異議庭認為,該專利不能主張美國專利的優先權,導致EP2771468因為在申請日前有其他公開文獻而喪失新穎性。 Broad Institute提出上訴,但BoA駁回了上訴,並指出需要所有申請人在初始申請和後續申請中都列出才能享有優先權。 由於優先權制度是在申請專利保護時常會運用的布局手段,後續在運用優先權時,應特別注意申請人的一致性,避免因優先權無法主張而影響專利的有效性。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」
加拿大發布國家智財戰略強化國際競爭力2018年4月26日世界知識產權日(World Intellectual Property Day),加拿大政府發布新的國家智財戰略。透過提昇加拿大企業的智財意識與加強智財服務業者監管,促進加拿大的創新生態體系。這次加拿大的智財戰略以法制、意識與工具為三大重點,內容涵括推動修法消除法制障礙、推動國民智財意識提昇、提供智財交易平台等工具給企業運用。其中法制障礙特別強調加拿大政府將立法防止國外專利蟑螂惡意運用智慧財產權的行為,以保障其企業在國際的競爭力。 其實臺灣在2012年由於產業面臨國際競爭,行政院就制定有「國家智財戰略綱領」,針對智財透過創造、運用流通、保護及人才等面向,擬訂戰略重點執行為期4年的智財行動計畫,目標引導產學研提升智財競爭力。今年智財行動計畫已執行完畢,但未來前瞻發展仍需擬定我國智財發展的戰略,沒有戰略性的布局與智財保護,政府投注再多經費,也無法幫助企業增加在國際市場上的競爭力。 期待臺灣政府部門能夠參考國際上,包括加拿大的智財戰略做法,廣納產業、學界更多的好意見,規劃我國智財政策接下來的10步棋該怎麼下。
美國國際消費電子展研討會討論有關打擊專利蟑螂議題 <開原碼條例>建置醫療資源共享架構UCLA醫學中心以開放原始碼軟體Zope建置資訊系統,展開一項稱為「治療成效開放式架構」(OIO, Open Infrastructure for Outcomes) 的計畫,構築起未來醫療資訊系統的新基石。讓治療成效的資訊,能在一個共通的平台架構上進行資源分享。 長期以來,醫療資訊系統面臨的挑戰主要來自於下列三個面向:一、如何讓資訊系統提供令人滿意的服務功能,以取代將醫療記錄登載在紙張上的傳統方式。二、資訊系統的需求經常會改變,如何快速因應系統的改變需求。三、如何與其他醫療團隊夥伴,共同分享資料與工具。 OIO計劃透過資訊共享可加速醫療研究。開放式架構計畫的主要目的,並不是用來要求臨床工作者與醫療研究中心分享病歷資料,而是提供一個分享管理工具的機制,讓使用者能夠利用這些管理工具,進行資料的收集與分析,並和特定的診療研究人員進行溝通,而透過系統安全的機制,在過程當中並不會讓其他人得知資料內容。不過,如果有人想要進行管理工具或資料的進一步加值利用,僅需額外投入相當小的成本。 另外, 開放式架構計畫的設計極具彈性,除了目前所專注的治療成效資訊統計之外,其系統概念也可以用來管理客戶資訊、進銷存資訊、會計資訊等。整個系統開發環境是針對使用者而設計,而非程式人員,並且以網頁應用程式來實作,力求操作的便利性,目的之一是讓使用者能夠動手創造出自己所需的表格資料。另一方面,設計上也面對來自於法律與技術層面的挑戰,例如取得病患的同意及對系統的信任感,促使這套系統在實作時,必須能夠提供高度的修改彈性與安全性。 由於 OIO 在設計上,包含低成本、高效益、使用者導向、架構具有彈性等特色,並以開放源碼開發模式來鼓勵使用者測試及提供回饋意見,目前的應用效果持續擴大中。