2025年12月,日本人工智慧安全研究所(AI Safety Institute,下稱AISI)與日本獨立行政法人情報處理推進機構(Information-technology Promotion Agency Japan,下稱IPA)共同發布《資料品質管理指引》(Data Quality Management Guidebook)。此指引旨於協助組織落實資料品質管理,以最大化資料與AI的價值。指引指出AI加劇了「垃圾進,垃圾出(Garbage in, Garbage out)」的難題,資料品質將直接影響AI的產出。因此,為確保AI服務的準確性、可靠性與安全性,《資料品質管理指引》將AI所涉及的資料,以資料生命週期分為8個階段,並特別強調透過資料溯源,方能建立透明且可檢核的資料軌跡。
1.資料規劃階段:組織高層應界定資料蒐集與利用之目的,並具體說明組織之AI資料生命週期之各階段管理機制。
2.資料獲取階段:此步驟涉及生成、蒐集及從外部系統或實體取得資料,應優先從可靠的來源獲取AI模型的訓練資料,並明確記錄後設資料(Metadata)。後設資料指紀錄原始資料及資料歷程之相關資訊,包含資料的創建、轉檔(transformation)、傳輸及使用情況。因此,需要記錄資料的創建者、修改者或使用者,以及前述操作情況發生的時間點與操作方式。透過強化來源透明度,確保訓練資料進入AI系統時,即具備可驗證的信任基礎。
3.資料準備階段:重點在於AI標註(Labeling)品質管理,標註若不一致,將影響AI模型的準確性。此階段需執行資料清理,即刪除重複的資料、修正錯誤的資料內容,並持續補充後設資料。此外,可添加浮水印(Watermarking)以確保資料真實性與保護智慧財產權。
4.資料處理階段(Data Processing):建立即時監控及異常通報機制,以解決先前階段未發現的資料不一致、錯漏等資料品質問題。
5.AI系統建置與運作階段:導入RAG(檢索增強生成)技術,檢索更多具參考性的資料來源,以提升AI系統之可靠性,並應從AI的訓練資料中排除可能涉及個人資料或機密資訊外洩的內容。
6. AI產出之評估階段(Evaluation of Output):為確保產出內容準確,建議使用政府公開資料等具權威性資料來源(Authoritative Source of Truth, ASOT)作為評估資料集,搭配時間戳記用以查核參考資料的時效性(Currentness),避免AI採用過時的資料。
7.AI產出結果之交付階段(Deliver the Result):向使用者提供機器可讀的格式與後設資料,以便使用者透過後設資料檢查AI產出結果之來源依據,增進透明度與使用者信任。
8.停止使用階段(Decommissioning):當資料過時,應明確標示停止使用,若採取刪除,應留存刪除紀錄,確保留存完整的資料生命週期紀錄。
日本《資料品質管理指引》強調,完整的資料生命週期管理、強化溯源為AI安全與創新的基礎,有助組織確認內容準確性、決策歷程透明,方能最大化AI所帶來的價值。而我國企業可參考資策會科法所創意智財中心發布之《重要數位資料治理暨管理制度規範(EDGS)》,同樣強調從源頭開始保護資料,歷程存證與溯源為關鍵,有助於組織把控資料品質、放大AI價值。
本文為資策會科法所創智中心完成之著作,非經同意或授權,不得為轉載、公開播送、公開傳輸、改作或重製等利用行為。
本文同步刊登於TIPS網站(https://www.tips.org.tw)
世界智慧財產權組織(World Intellectual Property Organization, WIPO)於2020年12月7日發布2020年世界智慧財產權指標報告(World Intellectual Property Indicators 2020, WIPI 2020)。WIPI年度報告蒐研分析150個國家及地區的智財統計資料,作為商務人士、投資者、學界和創業家參考指標。該份報告顯示,全球的商標與設計專利的申請活動成長約5.9%和1.3%,然而受到了中國專利申請量下降的影響,2019年全球專利申請下降3%,這也是近10年來首度下降;若扣除中國不計,2019年全球專利申請數量成長2.3%。 該份報告除了彙整國際整體數據以外,依專利、商標、工業設計、植物品種、地理標示等不同主題分別統計。在專利部分,中國大陸國家知識產權局、美國專利商標局分別為收到專利申請提交數量之前兩名;接續為日本、韓國和歐盟。這五大智財當局合計占全球總數之84.7%。其中韓國、歐盟和美國申請數量均有成長,中國大陸申請數量下降達9.2%,亦為中國大陸24年來首度下降,報告說明其因為中國大陸改善申請案結構和申請品質之故,致中國大陸國內公民之申請量減少10.8%,而國外申請量仍保持成長。 另外在商標部分,受理申請數量最多之前六個國家分別為中國、美國、日本和伊朗和歐盟;而2018年到2019年間受理申請增加幅度最多者為巴西、越南、伊朗、俄國和土耳其。據估計,2019年全球有效商標註冊量為5820萬,較2018年成長15.2%,且中國就囊括約2520萬,其次為美國的280萬和印度的200萬。針對中國大陸商標和專利申請數量為世界之冠,引起全球關注,美國專利商標局(USPTO)亦在2021年1月13日發布研究報告,指出中國大陸商標和專利申請案數量可能源自政府補貼或其他非市場因素的影響;其中又以政府補貼為刺激商標與專利申請案件數增長的最大可能原因。而這些非市場因素的商標及專利申請案件可能誤導世界對中國大陸創新能力的評估。 在工業設計(Industrial designs)方面,2019年全球提交136萬件設計專利申請,其中104萬件為工業設計;而中國大陸的工業設計申請量就囊括約71萬件。若以類型區分,和家具有關的設計專利比例為全球9.4%,其次是服裝(8.1%)以及包裝和容器(7.3%)。植物品種(Plant varieties)部分,中國大陸智財當局於2019年收到了7834種植物新品種申請,較2018年成長36%,同時也占全球植物品種申請的三分之一以上。地理標示(Geographical indications)部分,截至2019年和葡萄酒及烈酒有關的地理標示約為全球地理標示的56.6%,其次是農產品/食品(34.2%)和手工藝品(3.5%)。
英國資訊委員辦公室首次對違反資料保護案件開罰英國資訊委員辦公室(Information Commissioner’s Office,ICO)於今(2010)年11月24日首次對違反資料保護案件開罰。 賀福郡理事會(Hertfordshire County Council)員工在今年6月兩度將載有高度敏感性資料的文件傳真予錯誤的收件人。ICO經調查後認定,由於賀福郡理事會未能防止兩次資料外洩事件發生,導致嚴重損害,而在首次外洩事件發生後,亦未採取足夠的預防措施避免類似情況發生,因此裁定十萬英鎊之罰鍰。 另一家發生資料外洩事件的人力資源服務公司A4e,則是因其員工將含有兩萬四千筆個人資料的筆記型電腦帶回家後遭竊,且包括個人姓名、出生年月日、郵遞區號、薪資、犯罪紀錄等相關資料並未加密。ICO認為,A4e並未採取適當措施避免資料外洩,且A4e允許其員工將未加密的筆記型電腦帶回家時,已知內含個人資料種類及數量,因此裁定六萬英鎊之罰鍰。 ICO表示,希望本次處罰能對於處理個人資料的機構有所警惕。 ICO今年4月被賦予裁罰權,至於裁罰的標準,則有裁罰指引(fine guidance)可參考。根據裁罰指引,若資料控制者(data controller)故意違反資料保護法(Data Protection Act),或可得而知可能違法之情形,卻未採取適當措施預防之,而可能造成相當損害時,ICO得處以相當罰鍰。
美國總統簽署有關監管數位資產的行政命令美國總統於2022年3月9日簽署有關監管數位資產的行政命令(Executive Order on Ensuring Responsible Development of Digital Assets),有鑑於加密貨幣(cryptocurrencies)在內的數位資產於過去大幅成長,自5 年前的 140 億美元市值快速增長到去年11月的 3 兆美元市值,並且有100 多個國家正在探索央行數位貨幣(Central Bank Digital Currency, CBDC)。為使美國政府有整體性的政策以應對加密貨幣市場的風險與數位資產及其基礎技術的潛在利益,該行政命令以消費者與投資者保護、金融穩定、打擊非法融資、增進美國競爭力、普惠金融、負責任的創新為六大關鍵優先事項。 為實現關鍵優先事項,行政命令中所採取的具體措施包含:(1)政府機關應合作來保護美國消費者與企業,以因應不斷成長的數位資產產業與金融市場變化; (2)鼓勵金融監管機構識別與降低數位資產可能帶來的系統性金融風險,制定適當的政策建議以解決監管漏洞;(3)與盟友合作打擊非法金融與國安風險,減輕非法使用數位資產所帶來非法金融與國家安全風險;(4)運用數位資產的技術,促進美國在技術與經濟競爭力上保持領先地位;(5)支持技術創新並確保負責任地開發與使用,同時優先考慮隱私、安全、打擊非法利用等面向;(6)鼓勵聯準會研究CBDC,評估所需的技術基礎設施與容量需求。
2005年我國對美專利申請件數落居外國申請人第4名在獲准件數方面,2005年我國人民向美國專利商標局申請獲准專利案件計5,993件,較上年減少16.84%,維持第3名,次於日本(31,834件)及德國(9,575件);向日本特許廳申請專利獲准案計2,305件,較上年增加24.33%,居所有外國人專利核准案件數第2名,次於美國;向歐洲專利局申請專利獲准案件計133件,較上年成長17.70%。 專利可反映一個國家或區域的創新活動,同時可展現該國或區域發揮知識力量,並將其轉換為有潛力的經濟產出的能力。專利獲准的條件是必須具新穎性、進步性及產業利用性,因此,專利的數量及其相關指標可說是衡量研究及發展(R&D)投入所獲產值的最佳工具。 根據智慧財產局最近發布之「2005年我國與美日歐專利申請暨核准概況分析」, 2005年我國向美國專利商標局、日本特許廳及歐洲專利局之申請與核准專利件數較往年雖有成長,但我國向美國申請專利件數已由2004年的居所有外國申請人之第3名下降為第4名,被南韓所超越,南韓的大幅成長值得關注。 美國依然是我國人民提出專利申請的主要國家,2005年我國人民向美國專利商標局申請專利案計16,617件,較上年增加10.36﹪,居所有外國人新申請案第4名。而南韓向美國專利商標局提出專利申請案自2003年之10,411件,成長至2004年之13,646件,2005年更以17,217件超越我國,攀至第3名。在日本方面,我國人民向日本特許廳申請專利每年超過3,000件,2005年排名第3,次於美國(9,177件)、韓國(5,990件);而在歐洲專利局方面,2005年我國人民共申請679件,有逐年增加趨勢,在亞洲國家中次於日本(21,461件)、南韓(3,853件)。