日本發布《資料品質管理指引》，強調歷程存證與溯源，建構可信任AI透明度

2025年12月，日本人工智慧安全研究所（AI Safety Institute，下稱AISI）與日本獨立行政法人情報處理推進機構（Information-technology Promotion Agency Japan，下稱IPA）共同發布《資料品質管理指引》（Data Quality Management Guidebook）。此指引旨於協助組織落實資料品質管理，以最大化資料與AI的價值。指引指出AI加劇了「垃圾進，垃圾出（Garbage in, Garbage out）」的難題，資料品質將直接影響AI的產出。因此，為確保AI服務的準確性、可靠性與安全性，《資料品質管理指引》將AI所涉及的資料，以資料生命週期分為8個階段，並特別強調透過資料溯源，方能建立透明且可檢核的資料軌跡。

1.資料規劃階段：組織高層應界定資料蒐集與利用之目的，並具體說明組織之AI資料生命週期之各階段管理機制。

2.資料獲取階段：此步驟涉及生成、蒐集及從外部系統或實體取得資料，應優先從可靠的來源獲取AI模型的訓練資料，並明確記錄後設資料（Metadata）。後設資料指紀錄原始資料及資料歷程之相關資訊，包含資料的創建、轉檔（transformation）、傳輸及使用情況。因此，需要記錄資料的創建者、修改者或使用者，以及前述操作情況發生的時間點與操作方式。透過強化來源透明度，確保訓練資料進入AI系統時，即具備可驗證的信任基礎。

3.資料準備階段：重點在於AI標註（Labeling）品質管理，標註若不一致，將影響AI模型的準確性。此階段需執行資料清理，即刪除重複的資料、修正錯誤的資料內容，並持續補充後設資料。此外，可添加浮水印（Watermarking）以確保資料真實性與保護智慧財產權。

4.資料處理階段（Data Processing）：建立即時監控及異常通報機制，以解決先前階段未發現的資料不一致、錯漏等資料品質問題。

5.AI系統建置與運作階段：導入RAG（檢索增強生成）技術，檢索更多具參考性的資料來源，以提升AI系統之可靠性，並應從AI的訓練資料中排除可能涉及個人資料或機密資訊外洩的內容。

6. AI產出之評估階段（Evaluation of Output）：為確保產出內容準確，建議使用政府公開資料等具權威性資料來源（Authoritative Source of Truth, ASOT）作為評估資料集，搭配時間戳記用以查核參考資料的時效性（Currentness），避免AI採用過時的資料。

7.AI產出結果之交付階段（Deliver the Result）：向使用者提供機器可讀的格式與後設資料，以便使用者透過後設資料檢查AI產出結果之來源依據，增進透明度與使用者信任。

8.停止使用階段（Decommissioning）：當資料過時，應明確標示停止使用，若採取刪除，應留存刪除紀錄，確保留存完整的資料生命週期紀錄。

日本《資料品質管理指引》強調，完整的資料生命週期管理、強化溯源為AI安全與創新的基礎，有助組織確認內容準確性、決策歷程透明，方能最大化AI所帶來的價值。而我國企業可參考資策會科法所創意智財中心發布之《重要數位資料治理暨管理制度規範（EDGS）》，同樣強調從源頭開始保護資料，歷程存證與溯源為關鍵，有助於組織把控資料品質、放大AI價值。

本文為資策會科法所創智中心完成之著作，非經同意或授權，不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。

本文同步刊登於TIPS網站（https://www.tips.org.tw）

相關連結

〈データ品質マネジメントガイドブック〉，AISI

你可能會想參加

※ 日本發布《資料品質管理指引》，強調歷程存證與溯源，建構可信任AI透明度，資訊工業策進會科技法律研究所， https://stli.iii.org.tw/article-detail.aspx?d=9449&no=57&tp=1 （最後瀏覽日：2026/06/26）

引註此篇文章