美國眾議院議員Mark Takano於2019年10月2日提出「刑事鑑識演算法草案」 (Justice in Forensic Algorithms Act),以建立美國鑑識演算法標準。依據該法第2條,美國國家標準與技術研究所(National Institute of Standard)必須建立電算鑑識軟體之發展與使用標準,且該標準應包含以下內容:
一、以種族、社會經濟地位、兩性與其他人口特徵為基礎之評估標準,以因應使用或發展電算鑑識軟體,所造成區別待遇產生之潛在衝擊。
二、該標準應解決:(1)電算鑑識軟體所依據之科學原則與應用之方法論,且於具備特定方法之案例上,是否有足夠之研究基礎支持該方法之有效性,以及團隊進行哪些研究以驗證該方法;(2)要求對軟體之測試,包含軟體之測試環境、測試方法、測試資料與測試統計結果,例如正確性、精確性、可重複性、敏感性與健全性。
三、電算鑑識軟體開發者對於該軟體之對外公開說明文件,內容包含軟體功能、研發過程、訓練資料來源、內部測試方法與結果。
四、要求使用電算鑑識軟體之實驗室或其他機構應對其進行驗證,包含具體顯示於哪個實驗室與哪種狀況下進行驗證。此外,亦應要求列於公開報告內之相關資訊,且於軟體更新後亦應持續進行驗證。
五、要求執法機關於起訴書或相關起訴文件上應詳列使用電算鑑識軟體之相關結果。
本文為「經濟部產業技術司科技專案成果」
「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。 在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。 英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。 技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
澳大利亞提出政府資料共享法案澳大利亞總理及內閣部(The Department of the Prime Minister and Cabinet,PM&C)之國家資料委員辦公室(Office of the National Data Commissioner)於2020年12月9日提交「澳大利亞資料可用性及透明度法案」(Data Availability and Transparency Bill 2020)至澳大利亞國會(Parliament of Australia),國會並已完成一讀及二讀 。 該法案旨在建立一個新的公部門資料共享方案,將原先未開放的公部門資料,透過本法案所設計的共享公部門資料相關管理制度,以促進公部門資料的可存取性及保障措施的一致性,藉此提高公部門資料透明度和大眾利用公部門資料的信心。 該法案所設計的資料共享機制,係由作為「資料保管者」(Data custodians)的各聯邦部門和州政府,自行或透過「被認證的資料服務提供者」(Accredited data service provider,下稱ADSP)共享其所保管的政府資料,使「被認證的利用者」(Accredited user,下稱利用者)得以利用之。 另外,該法案要求資料保管者必須在符合資料共享要件的情況下,才能共享資料,要件包含: 1、資料共享目的:係指該法案只允許資料保管者基於「提供政府服務」、「通知政府政策和計畫」、「研究與開發」等三個目的分享資料。倘涉及國家安全及犯罪調查等需要特殊監督利用機制的政府資料,則不包含在內。 2、資料共享原則:包含符合公共利益或道德評估之計畫;具備適合共享資格的人員;安全環境;資料最小化;合目的產出等五個原則。 3、資料共享協議:資料保管者與利用者之間,必須簽定「資料共享協議」,該法案有規定資料共享協議的應記載條款。 滿足上述要求時,該法案使原先被法律限制共享,或單純未積極開放的資料,都得以在利用者提出要求後,於符合要件及資訊保密相關法規後共享。反之,若不符合法案的要求,則不得共享資料,回復到原先的法律狀態,適用原先的資料保護框架。 最後,該法案授權獨立監管機構「國家資料委員」(National Data Commissioner),負責認證ADSP及可利用共享資料之利用者,並監管所有的資料共享計畫,以及提供諮詢、指導和倡導資料共享計畫的最佳方案。
違反荷蘭資料保護法,Google恐遭罰1500萬歐元Google為了提供客製化的廣告服務,利用搜尋引擎、Youtube、Gmail及其他服務,在事前未告知並取得使用者同意的情況下,蒐集人們的資料(包括搜尋紀錄、電子郵件、第三方網站軌跡資料、位置資訊及影片觀看紀錄等)。歐洲各國隱私監管機構對此表示憂心,認為Google恐將以前所未有的規模,掌握使用者的一舉一動,紛紛投入調查工作,並相繼認為Google確實已經違反其內國法。 荷蘭資料保護局(Data Protection Authority, DPA)主席Jacob Kohnstamm於2014年12月15日表示,使用者有權知悉他們在某一平台輸入的資料,其他平台也可以利用它們,並要求Google在合併不同服務所取得的個人資料前,應以跳出不同視窗等方式供使用者點選,俾以取得其明示同意(unambiguous consent),僅只透過一般隱私條款,並不足以提供當事人清楚且一致的資訊(clear and consistent imformation)。 DPA希望Google不要再考驗他們的耐心,並揚言對Google處以1500萬歐元罰鍰,除非它在2015年2月底前完成改善。但面對DPA的最後通牒,Google僅回應,他們已經大幅修正了隱私權政策,很遺憾DPA仍作出這樣的決定,但他們將儘快與歐洲各國隱私監管機構就後續修訂方案進行討論。
中國最大搜尋引擎簽署知識產權網路侵權協議創意產業之發展在中國,具有相當之重要性。在出版物、音樂、電影、電視和遊戲軟件開發等創意相關產業,已占中國GDP 5%以上。2016年4月中國最大的搜尋引擎公司「百度」與國際出版商版權保護聯盟(IPCC)簽署版權保護合作備忘錄。IPCC為多間國際出版公司參與的非營利性組織,由於侵權盜版行為再中國日益嚴重,IPCC積極的向中國國內的網路平台公司洽談合作意願。 中國百度為了減少網路侵權作品的擴散,透過技術在作品原創性、正版與維權上,開發防盜版系統及線上投訴管道。百度公司與IPCC透過定期的資訊交流,除了在版權保護上合作,雙方也將繼續針對搜尋內容之正版化合作,此舉提升百度搜尋引擎在內容上的豐富性,同時也意味著中國在知識產權上更向前了一步。 IPCC除了與百度簽署版權保護協議外,也針對網路上具有侵權之網站應列表與仿冒品之跨境執法問題上提出意見交流。另外在政策面上,針對涉及中國正在進行的著作權修法議題,包括著作權集中授權、藝術家之轉售權、著作權的例外與限制及音樂視聽著作權進行討論。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」