2025年12月,日本人工智慧安全研究所(AI Safety Institute,下稱AISI)與日本獨立行政法人情報處理推進機構(Information-technology Promotion Agency Japan,下稱IPA)共同發布《資料品質管理指引》(Data Quality Management Guidebook)。此指引旨於協助組織落實資料品質管理,以最大化資料與AI的價值。指引指出AI加劇了「垃圾進,垃圾出(Garbage in, Garbage out)」的難題,資料品質將直接影響AI的產出。因此,為確保AI服務的準確性、可靠性與安全性,《資料品質管理指引》將AI所涉及的資料,以資料生命週期分為8個階段,並特別強調透過資料溯源,方能建立透明且可檢核的資料軌跡。 1.資料規劃階段:組織高層應界定資料蒐集與利用之目的,並具體說明組織之AI資料生命週期之各階段管理機制。 2.資料獲取階段:此步驟涉及生成、蒐集及從外部系統或實體取得資料,應優先從可靠的來源獲取AI模型的訓練資料,並明確記錄後設資料(Metadata)。後設資料指紀錄原始資料及資料歷程之相關資訊,包含資料的創建、轉檔(transformation)、傳輸及使用情況。因此,需要記錄資料的創建者、修改者或使用者,以及前述操作情況發生的時間點與操作方式。透過強化來源透明度,確保訓練資料進入AI系統時,即具備可驗證的信任基礎。 3.資料準備階段:重點在於AI標註(Labeling)品質管理,標註若不一致,將影響AI模型的準確性。此階段需執行資料清理,即刪除重複的資料、修正錯誤的資料內容,並持續補充後設資料。此外,可添加浮水印(Watermarking)以確保資料真實性與保護智慧財產權。 4.資料處理階段(Data Processing):建立即時監控及異常通報機制,以解決先前階段未發現的資料不一致、錯漏等資料品質問題。 5.AI系統建置與運作階段:導入RAG(檢索增強生成)技術,檢索更多具參考性的資料來源,以提升AI系統之可靠性,並應從AI的訓練資料中排除可能涉及個人資料或機密資訊外洩的內容。 6. AI產出之評估階段(Evaluation of Output):為確保產出內容準確,建議使用政府公開資料等具權威性資料來源(Authoritative Source of Truth, ASOT)作為評估資料集,搭配時間戳記用以查核參考資料的時效性(Currentness),避免AI採用過時的資料。 7.AI產出結果之交付階段(Deliver the Result):向使用者提供機器可讀的格式與後設資料,以便使用者透過後設資料檢查AI產出結果之來源依據,增進透明度與使用者信任。 8.停止使用階段(Decommissioning):當資料過時,應明確標示停止使用,若採取刪除,應留存刪除紀錄,確保留存完整的資料生命週期紀錄。 日本《資料品質管理指引》強調,完整的資料生命週期管理、強化溯源為AI安全與創新的基礎,有助組織確認內容準確性、決策歷程透明,方能最大化AI所帶來的價值。而我國企業可參考資策會科法所創意智財中心發布之《重要數位資料治理暨管理制度規範(EDGS)》,同樣強調從源頭開始保護資料,歷程存證與溯源為關鍵,有助於組織把控資料品質、放大AI價值。 本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。 本文同步刊登於TIPS網站(https://www.tips.org.tw)
歐洲藥物管理局(EMA)加強與歐洲毒品與毒癮監控中心(EMCDDA)於精神性影響藥物和藥物濫用上的資訊交換合作2010年藥物主動監視法規(pharmacovigilance legislation)要求EMA和EMCDDA必須加強在藥物產品濫用(包含不合法藥品)的資訊交換合作關係,是以,EMA和EMCDDA於今年九月初於葡萄牙里斯本相互簽署了修訂工作協議(amended working arrangement),約定在新型精神性影響藥物與藥物濫用的面向上,加強相互間的資訊交流合作。 於EMA和EMCDDA所簽訂的修正工作協議中,雙方約定就下列領域深化資訊交換: 1.雙方需各自依照歐盟執委會2005/387/JHA決議和歐盟1235/2010號法規第28c(2)條,對於所擁有之新型精神性影響藥物與藥物濫用(包含不合法藥品)資訊進行交換合作; 2.資訊交換需透過通常基準的報告形式由EMCDDA送至EMA,並含括有關於藥物產品濫用、不合法藥物,以及新型精神性影響物質等相關資訊; 3.EMA必須通知EMCDDA有關於藥物產品濫用的有效導因(validated signals),同時,EMA必須提供EMCDDA有關於藥物產品濫用和新型精神性影響藥品市場核准狀況的細部資訊; 4.EMA對於選定藥物產品之風險管理計畫的界定,可考量是否需先行與EMCDDA作諮詢意見交換; 5.EMA和EMCDDA在歐盟執委會2005/387/JHA決議和歐盟1235/2010號法規第28c(2)條所設基礎的合作模式下,必須要特別注意確保人類或動物健康照護並無惡化的情事,同時應確保科學建議之潛在衝突於前階段將會被界定與管理; 6.EMA和EMCDDA兩者間諮詢的進行,必須避免非關於新型精神性影響物質風險評估之科學建議的潛在衝突; 7.對於任何額外合作計畫的執行,必須考量EMA和EMCDDA兩者的例行性工作規劃; 8.對於特定計畫需要額外資源時,必須經由EMA和EMCDDA共同同意,並將同意文件附於現階段的工作協議中; 9.EMA和EMCDDA可就其各自舉辦的會議相互邀請對方,並邀請對該會議有興趣的其他團體參與; 10.對於EMA和EMCDDA間實際的合作面向,將在工作協議既定架構下繼續發展。 除了前述的適用範圍外,EMA和EMCDDA的修訂工作協議,亦有就相互諮詢和秘密資訊等領域作出約定,以確保資訊交換係在符合雙方需求與不侵害個人基本權利的情況下進行。有鑑於EMA和EMCDDA希冀藉由資源互補的強化約定,來彌補自身於精神性影響藥物和藥物濫用領域的資訊不足缺陷,是否我國在相關醫療、藥品管制或是藥品商業化資訊需有跨機關的整合機制,以促使我國在醫療、醫藥資訊交換與流通,在不侵害個人基本權利的情況下,能夠發揮互益效用,則是我國有關單位必須審慎思考的問題。
Google數位圖書館計劃面臨著作權法爭議全球最大搜索引擎 Google公司於去年12月中宣布,已與美國紐約公共圖書館以及哈佛大學、史丹福大學、密西根大學、牛津大學合作,將數百萬冊藏書數位化讓網友免費瀏覽。此一計畫預計花十年時間建構,在2015年啟動,經費約估1億5000萬到2億美元之間 (The Google Print Program)。雖然此一構想極具創意,但是由於將館藏圖書數位化牽涉著作權爭議,因此由125家非營利學術出版機構組成的美國大學出版協會(AAUP)已針對若干疑點去函,希望Google能釐清著作權法上之疑慮,以利整體計劃之推動。 AAUP所持最重要依據係美國著作權法第107條有關合理使用之規定。AAUP質疑,以Google如此大規模,就圖書內容性質不加以區分,全面性的圖書數位化工程,恐怕無法符合著作權法所訂出的合理使用標準。蓋著作權法有關是否符合合理使用之界定標準,是以事實情況及個案之判別方式為主,故無法想像Google如何在未進行個別之判斷前,便能夠概括性的依此而主張其享有合法權利。事實上,Google之主張與法院實務界之認知存在極大落差。 此外, Google的數位圖書館計畫在許多細部執行事項上,仍存有許多疑點,導致原先欲加入的AAUP會員,無法確保圖書內容完成數位化後,對於以銷售書籍及授權為主要營收來源之出版社,恐會產生造成市場排擠效果之憂慮。 藉由數位技術雖然可以挑戰人類夢想的極限,但過程中涉及的法律層面問題,卻相當程度羈絆了夢想前進的速度。 Google的數位圖書館計劃再次印證了新興技術與現行法規不協調的窘況。就現有事實資料以觀,Google若未能與學術出版商妥善安排著作權引發之爭議,此一計畫未來是否能順利執行,恐怕存有極大疑問。
五年投資一百五十億 生醫科技島計劃啟動經過一年以上的準備,行政院科技顧問組六日宣布啟動「生醫科技島計畫」計劃。自今年起以五年投入一百五十億元預算,建立「國民健康資訊基礎建設整合建置計畫( NHII )」、「台灣人疾病及基因資料庫( Taiwan Biobank )」、及「臨床試驗研究體系」三大重點。未來除了減少健保成本一百億元以上,也希望協助業界創造數百億元市場商機。 生醫科技島計畫為國內所帶來的效益方面, NHII 將可減少醫療支出三%,共一百億元規模,至於促進民間投資及產業升級方面,預期五年內可帶動民間及政府投資四百億元以上;至於 Taiwan Biobank 方面,除了領先新加坡及中國大陸建立華人特定族群基因資料庫的供給中心,更可帶動國內的新藥開發、基因治療、藥物副作監測,及疾病篩檢及防治等醫藥發展。 行政院科技顧問組指出,其中 Taiwan Biobank 計劃因為涉及「科技對倫理、法律及社會( ELSI )」等議題有較多社會疑慮,將根據現有的醫事法及立法院正進行三讀的個人資料保護法立法精神,預計今年先進行五千人基因資料蒐集,待兩年後正式的基因資料保護相關法律定出新法後,將會加速完成二十萬人的資料蒐集。