日本發布《資料品質管理指引》,強調歷程存證與溯源,建構可信任AI透明度

2025年12月,日本人工智慧安全研究所(AI Safety Institute,下稱AISI)與日本獨立行政法人情報處理推進機構(Information-technology Promotion Agency Japan,下稱IPA)共同發布《資料品質管理指引》(Data Quality Management Guidebook)。此指引旨於協助組織落實資料品質管理,以最大化資料與AI的價值。指引指出AI加劇了「垃圾進,垃圾出(Garbage in, Garbage out)」的難題,資料品質將直接影響AI的產出。因此,為確保AI服務的準確性、可靠性與安全性,《資料品質管理指引》將AI所涉及的資料,以資料生命週期分為8個階段,並特別強調透過資料溯源,方能建立透明且可檢核的資料軌跡。

1.資料規劃階段:組織高層應界定資料蒐集與利用之目的,並具體說明組織之AI資料生命週期之各階段管理機制。

2.資料獲取階段:此步驟涉及生成、蒐集及從外部系統或實體取得資料,應優先從可靠的來源獲取AI模型的訓練資料,並明確記錄後設資料(Metadata)。後設資料指紀錄原始資料及資料歷程之相關資訊,包含資料的創建、轉檔(transformation)、傳輸及使用情況。因此,需要記錄資料的創建者、修改者或使用者,以及前述操作情況發生的時間點與操作方式。透過強化來源透明度,確保訓練資料進入AI系統時,即具備可驗證的信任基礎。

3.資料準備階段:重點在於AI標註(Labeling)品質管理,標註若不一致,將影響AI模型的準確性。此階段需執行資料清理,即刪除重複的資料、修正錯誤的資料內容,並持續補充後設資料。此外,可添加浮水印(Watermarking)以確保資料真實性與保護智慧財產權。

4.資料處理階段(Data Processing):建立即時監控及異常通報機制,以解決先前階段未發現的資料不一致、錯漏等資料品質問題。

5.AI系統建置與運作階段:導入RAG(檢索增強生成)技術,檢索更多具參考性的資料來源,以提升AI系統之可靠性,並應從AI的訓練資料中排除可能涉及個人資料或機密資訊外洩的內容。

6. AI產出之評估階段(Evaluation of Output):為確保產出內容準確,建議使用政府公開資料等具權威性資料來源(Authoritative Source of Truth, ASOT)作為評估資料集,搭配時間戳記用以查核參考資料的時效性(Currentness),避免AI採用過時的資料。

7.AI產出結果之交付階段(Deliver the Result):向使用者提供機器可讀的格式與後設資料,以便使用者透過後設資料檢查AI產出結果之來源依據,增進透明度與使用者信任。

8.停止使用階段(Decommissioning):當資料過時,應明確標示停止使用,若採取刪除,應留存刪除紀錄,確保留存完整的資料生命週期紀錄。

日本《資料品質管理指引》強調,完整的資料生命週期管理、強化溯源為AI安全與創新的基礎,有助組織確認內容準確性、決策歷程透明,方能最大化AI所帶來的價值。而我國企業可參考資策會科法所創意智財中心發布之《重要數位資料治理暨管理制度規範(EDGS)》,同樣強調從源頭開始保護資料,歷程存證與溯源為關鍵,有助於組織把控資料品質、放大AI價值。

本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。

本文同步刊登於TIPS網站(https://www.tips.org.tw

相關連結
你可能會想參加
※ 日本發布《資料品質管理指引》,強調歷程存證與溯源,建構可信任AI透明度, 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=9449&no=645&tp=1 (最後瀏覽日:2026/05/20)
引註此篇文章
你可能還會想看
美國閒置頻譜發展近況

  為了讓業者間服務不受干擾,政府在規劃頻段時,皆會設置護衛帶(Guard Band),以維持服務品質。不過,隨著科技的進步,業者彼此干擾程度降低,頻譜的使用也較過去有效率,導致頻段常有閒置的情況。是故,FCC在2008年正式公告開放閒置頻譜(white space),透過業者無須取得執照,以增加頻譜的活用與增加民眾網路接取。美國在2009年完成無線電視數位化後,亦從700MHZ較低頻段留下成對5*5MHz,期望透過該頻段覆蓋率高特性,增加業者投資偏遠地區,使當地民眾享有網路帶來的便利性。   閒置頻譜的開放利用,雖可增加公益性與頻譜使用性,但亦存有干擾無線麥克風、行動電話與廣播服務等服務之虞。FCC為了兼顧各業者服務品質與頻譜有效運用,透過地理位址功能(geo-location capability),輔以成立數據資料庫的方式,藉由資訊透明減少頻譜開放後的互相干擾。今年FCC閒置頻譜的發展,3月允許全國可建置TV Band Devices,期以迅速活化頻譜利用;5月公告低功率的電台須登記資訊於數據資料庫,以避免服務受到干擾。6月,FCC宣佈Google通過測試,成為美國第三家數據資料庫業者,增加服務競爭性。部分輿論則是認為Google在擁有地圖與數據資料庫後,將會更致力在偏遠地區使用無需執照頻譜(Unlicensed Spectrum),此舉無疑是增加Google服務影響力。   政府具有規劃性開放的結果,已直接影響民間投入閒置頻譜的利用。目前,Google與微軟相繼於非經濟地區,建置「閒置頻譜」設備,期以將網路服務滲入美國各角落。西維吉尼亞大學(West Virginia University)宣佈將開發校園與周邊地區的閒置頻譜,已提供鄰近區域免費Wi-Fi服務。除此之外,亦有部分企業透過策略聯盟發展「圖書館Gigabit網路」計畫,期以透過無線電視頻段具備高涵蓋與穿透力之特性,使圖書館與附近地區皆可享受免費無線網路。該聯盟已於五月宣布選擇堪薩斯城(Kansas City)公共圖書館為試點區, 且持續公開徵求自願參與之圖書館。   綜上所敘,在業者服務彼此不受干擾為前提下,閒置頻譜的開放確實可活化使用效率與增加網路接取性。並且,輔以無線電視空白頻段之優勢,可以預見未來Wi-fi無論是網速亦或是穩定度,其品質將更為提升,使無所不在網路落實於社會每個角落。

英國資訊專員辦公室對連鎖藥局違反GDPR存放敏感個資作成裁罰首例

  英國資訊專員辦公室(Information Commissioner's Office, ICO)於2019年12月20日發布首宗依據歐盟一般資料保護規則(General Data Protection Regulation, GDPR)之裁罰。   本案源於英國藥物及保健產品管理局(Medicines and Healthcare products Regulatory Agency, MHRA)接獲投訴前往倫敦當地一家名為Doorstep Dispensaree Ltd之連鎖藥局進行藥品違規調查,卻意外發現其後院存放大量敏感個資文件,約五十萬個文件檔案皆未做任何資料檔案保護措施,上面更記載名字、地址、出生日期、NHS號碼、醫療資料及處方籤等患者之個人資料,旋即通報英國資訊專員辦公室展開調查。最終英國資訊專員辦公室以該藥局違反歐盟一般資料保護規則(General Data Protection Regulation, GDPR)第5條1項第f款、第24條第1項及第32條,裁罰275,000英鎊。其裁罰理由如下: 一、隱私政策並不符合要求,如未述明蒐集個人資料之類別,未訂定個資保存期限,當事人告知聲明不完備,無當事人權利行使等。 二、無適當安全維護措施 三、涉及敏感性個資,違法情狀嚴重 四、未積極配合調查 五、影響層面甚深,導致該藥局配合之上百家療養院,近千名當事人個資受損害。   此為英國資訊專員辦公室首宗依據歐盟一般資料保護規則確定裁罰之案例且涉及敏感性個資,有其指標性。除此之外,英國航空與萬豪酒店之個資外洩案亦欲依GDPR進行裁罰,實值持續關注後續發展。

美國發布網路事件協調準則

  隨著網路技術的進步,資安事件亦日益加增,為了因應日趨頻繁的網路攻擊,美國總統歐巴馬於2016年7月26日發布了對於美國資安事件發生時聯邦部門間協調之指令(PRESIDENTIAL POLICY DIRECTIVE/PPD-41),該指令不僅提出聯邦政府對於資安事件回應的處理原則,並建立了聯邦政府各部門間對於發生重大資安事件時之協調指引。   指令中就資安事件及重大資安事件進行了定義:資安事件包含資訊系統漏洞、系統安全程序、內部控制、利用電腦漏洞的執行;而重大資安事件則指可能對國家安全利益、外交關係、美國經濟、人民信心、民眾自由或大眾健康與安全發生明顯危害的有關攻擊。 此外,就遭遇資安事件時,列舉出下列幾點作為聯邦政府因應資安事件時之原則:(A)責任分擔;(B)基於風險的回應;(C)尊重受影響者;(D)政府力量之聯合;(E)促進重建及恢復。   聯邦政府機關於因應資安事件時,需同時在威脅、資產及情報支援三方面上做相關之因應。其中司法部透過轄下聯邦調查局(Federal Bureau of Investigation, FBI)、國家網路調查聯合行動小組(National Cyber Investigative Joint Task Force, NCIJTF)負責威脅之回應;國土安全部(Department of Homeland Security, DHS)則透過轄下的國家網路安全與通訊整合中心(National Cybersecurity and Communications Integration Center, NCCIC)負責保護資產之部分,而情報支援部分,則由國家情報總監辦公室(Office of the Director of National Intelligence)下之網路威脅情報整合中心(Cyber Threat Intelligence Integration Center)負責相關事宜。如係政府機關本身遭受影響,則機關應處理該資安事件對其業務運作、客戶及員工之影響。另在遭遇重大資安事件時,為使聯邦政府能有效率因應,指令指出聯邦政府應就國家政策、全國業務及機關間為協調。此外,指令中亦指示國土安全部及司法部應建立當個人或組織遭遇資安事件時得以聯繫相關聯邦機關之管道。   該指令加強了現有政策的執行,並就美國機構組織上於資安事件與現行政策之互動做了進一步之解釋。

2005年為中國大陸電子商務法制年

  中國大陸於四月一日頒布實施「電子簽名法」後,將為電子交易、信用管理、安全認證、線上支付、稅收、以及隱私權保障等議題拉開序幕。雖然中國大陸對「公司法」、「票據法」、「證券法」與「拍賣法」均進行修訂並頒布新版本,然而卻未與「電子簽名法」銜接,也因此勢必進行後續修訂工作。    此外,為了加速立法進度,國務院辦公廳與國家發改會前後發布「關於加快電子商務發展的若干意見」與「電子商務專項通知」,信產部等部委的專項扶持基金並已開始接受電子商務企業的申請。同時,中國民生醫藥商務網的 CEO 表示,隨著中國大陸逐步開放外資進入電子商務、物流與線上支付等領域,中國電子商務企業必須盡快跨越誠信、支付、物流、稅收、盈利等五大面向,以贏得二次發展之歷史契機。

TOP