「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
美國聯邦商務部(Department of Commerce, DOC)下之工業及安全局(Bureau of Industry and Security, BIS)於2021年10月20日公布一暫行最終規則(interim final rule),對出口管制規則(Export Administration Regulation, EAR)進行修訂,其於商品管制清單(Commerce Control List)中增訂「可用於監視、間諜活動或其他破壞、拒絕、降低網路及其設備性能之工具」相關之出口管制分類編碼(Export Control Classification Number, ECCN)項目及說明文字,並增訂「授權網路安全出口(Authorized Cybersecurity Exports, ACE)」的例外許可規定(15 CFR §740.22),該暫行最終規則將於2022年1月19日生效。 被列入商品管制清單內的項目,原則上即不允許出口(或再出口、於國內移轉,以下同),惟透過ACE之例外許可,使前述項目可出口至大多數國家,僅在下列「再例外」情況需申請出口許可: 出口地為反恐目的地:出口目的地為15 CFR §740補充文件一所列類別E:1和E:2之國家時,須申請出口許可。 出口對象為國家類別D之政府終端使用者(Government end user):政府終端使用者係指能提供政府功能或服務之國家、區域或地方之部門、機關或實體,當政府終端使用者歸屬於國家類別D時,須申請出口許可。惟若類別D之國家同時被歸類於類別A:6(如賽普勒斯、以色列及台灣),在特定情況下,如為弱點揭露、犯罪調查等目的,出口予該國之電腦安全事件回應小組;為犯罪調查、訴訟等目的,出口可展現資訊系統上與使用者相關、對系統造成危害或其他影響活動之數位製品(digital artifacts)予警察或司法機關;或出口數位製品予前述政府,而該數位製品涉及由美國公司之子公司、金融服務者、民間健康和醫療機構等優惠待遇網路安全終端使用者(favorable treatment cybersecurity end user)擁有或操作資訊系統相關之網路安全事件時,不適用ACE之再例外規定,而不須申請出口許可。 終端使用者為國家類別D:1、D:5之非政府單位:結合上述第二點之說明,不論出口至國家類別D:1、D:5之政府或非政府單位,皆受ACE之「再例外」拘束,而須申請出口許可。僅當出口特定之ECCN網路安全項目予優惠待遇網路安全終端使用者、基於弱點揭露或網路事件回應之目的出口予非政府單位,或對非政府單位的視同出口(deemed export)行為,方不適用再例外規定,而不須申請出口許可。 終端使用者限制:已知或可得而知該物品將在未獲授權之情況下,被用於影響資訊系統或資訊之機密性、完整性或可用性時,須申請出口許可。
英國Tesco於網域名稱爭議中獲得勝利英國一家連鎖超市Tesco(中文譯名:特易購)於2006年3月8號「英國與威爾斯高等法院」的網域名稱爭議判決中獲得勝訴,該爭議起於Tesco之廣告連結商-Elogicom 公司,向替Tesco建置廣告連結註冊服務之TradeDoubler公司登記了「tesco-diets.co.uk」與「tescodvd.co.uk」兩個網域名稱;系爭域名非指向Elogicom公司所屬網頁,而僅直接指向Tesco網站,企圖以增加使用者連結至Tesco網站之數量賺取高額之廣告連結佣金。 Tesco對Elogicom公司主張商標權之侵害及搭便車,並請求移轉網域名稱;Elogicom則提起反訴請求給付佣金。該案法官認為Elogicom是利用「tesco」之名稱採取「釣魚」(fishing) 的方式,誘引不喜歡利用搜尋引擎而習慣於網路位址列鍵入猜測域名之網路使用者連結至其所設立之錯誤網站,藉由網站之自動連結功能跳頁至Tesco網站而賺取連結佣金,即使該公司並未使用該網站連結至與Tesco有營業競爭關係之網站,但仍因此利用Tesco之名賺取不正當利益並造成Tesco之商譽受到損害,判決Tesco勝訴並駁回Elogicom公司之反訴。
猶他州選民詳細資料遭網站公開,引起社會大眾關注據猶他州政府檔案存取及管理法(the Government Records Access and Management Act,簡稱GRAMA),該州選民註冊資料及投票歷史紀錄檔案屬於得公開資訊,據此,猶他州民得給付1,050元美金並填寫申請表,向政府申請取得全州選民數據庫之資料。 上開法令作為申請之依據,UTvoters.com創辦人Tom Alciere透過向該州政府申請並取得該州選民資訊後,建置該網站。透過該網站系統,任何人可查詢該州選民選舉資料。Tom Alciere指出,倘選民認為他們資訊被公布網站上並不合理,他們可以要求移除網站上的資訊,但這些資訊仍被記錄在該州數據庫中,且仍可被公開取得。 該州負責選舉主任委員Mark Thomas指出,倘能證明自身安全因資料遭公開而陷入危險,或具有某些情況如屬政府官員(例如州市長或參議員)等資料,基於安全考量,得移除數據庫之資料。 該州選民認為他們資料如同信用卡被竊一般的遭到洩漏,且不應被公開於網路;該州參議員Karen Mayne亦認為該不合理制度須做改變,政府一方面應鼓勵民眾參與投票,但非在過程中犧牲與公開選民的個人資料。 相關修正案之建議,限制該類資料僅能作為「政治」上的使用,且應排除與網路連結。若違反,則將面臨6個月以上有期徒刑及1,000美元以上之罰金。