「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
案件緣於Judith Vidal-Hall等三人對Google提告,主張Google規避蘋果公司Safari瀏覽器預設之隱私設定,在未取得用戶同意前,逕行使用cookies追蹤其網路活動,蒐集瀏覽器產生的資訊(the Browser-Generated Information, or ‘BGI’),並利用其對用戶發送目標廣告。原告認為這些作法可能使用戶的隱私資訊被第三人所探知,而且與Google保護隱私之公開聲明立場相違。此案於2015年3月27日由英國上訴審法官做成判決,並進入審理程序(裁判字號:[2015] EWCA Civ 311)。 本案主要爭點包含,究竟用戶因使用瀏覽器所產生的資訊是否屬於個人資料?濫用隱私資訊是否構成侵權行為?以及在沒有金錢損失(pecuniary loss)的情形下,是否仍符合英國資料保護法(Data Protection Act 1998)第13條所指損害(damage)的定義,進而得請求損害賠償? 法院於判決認定,英國資料保護法旨在實現「歐盟個人資料保護指令」(Data Protection Directive,95/46/EC)保護隱私權的規定,而非經濟上之權利,用以確保資料處理系統(data-processing systems)尊重並保護個人的基本權利及自由。並進一步說明,因隱私權的侵害往往造成精神損害,而非財產損害,從歐洲人權公約(European Convention of Human Rights)第八條之規定觀之,為求對於隱私權的保障,允許非財產權利的回復;倘若限縮對於損害(damage)的解釋,將會有礙於「歐盟個人資料保護指令」立法目的的貫徹。 法院強調,該判決並未創造新的訴因(cause of action),而是對於已經存在的訴因給予正確的法律定位。從而,因資料控制者(data controller)的不法侵害行為的任何損害,都可以依據英國資料保護法第13條第2項請求損害賠償。 本案原告律師表示:「這是一則具有里程碑意義的判決。」、「這開啟了一扇門,讓數以百萬計的英國蘋果用戶有機會對Google提起集體訴訟」。原告之一的Judith Vidal-Hall對此也表示肯定:「這是一場以弱勝強(David and Goliath)的勝利。」 註:Google 在2012年,曾因對蘋果公司在美國蒐集使用Safari瀏覽器用戶的個資,與美國聯邦貿易委員會(United States Federal Trade Commission)以2,250萬美元進行和解。
歐盟執委會發布2020歐洲創新計分板報告歐盟執委會(European Commission, EC)於2020年6月23日發布2020歐洲創新計分板報告(European Innovation Scoreboard 2020, EIS),其以「整體結構條件」(Framework conditions)、「投資」、「創新活動」和「影響力」(Impacts)四大指標評比歐盟成員國以及其他歐洲國家的研究與創新績效、創新環境等;各指標下再細分為10個次標和27個子標,例如人力資源、友善創新環境建構、政府部門研發創新支出、企業專業職能訓練、專利與商標申請、高科技產品出口等。 歐洲計分板將歐盟會員國創新表現分為四組,以2020年綜合創新能力分別為:(1)創新領導者(Innovation Leaders):包含丹麥、芬蘭、荷蘭、瑞典等國,為創新表現大於歐盟成員國平均創新度20%以上者;(2)優秀創新者(Strong Innovators):包含奧地利、比利時、法國、德國、葡萄牙等,創新表現大於歐盟成員國平均者;(3)中等創新者(Moderate Innovators):包含希臘、匈牙利、義大利、西班牙、波蘭等國,其創新表現小於歐盟平均者;以及最後一組(4)適度創新者(Modest Innovators):包含羅馬尼亞及保加利亞,為創新表現低於歐盟平均之50%。 此外,在各特定領域上,該報告亦有對不同國家進行排名。例如在創新研究體系領域,表現最好者為盧森堡、丹麥、荷蘭;中小企業帶領創新則以葡萄牙和芬蘭表現最佳;創新協力合作(Innovation linkages and collaboration)以奧地利、比利時、芬蘭最佳。而在全球綜合創新表現上,南韓為創新表現最佳,其向加入專利合作條約(Patent Cooperation Treaty, PCT)國家提交之專利申請數、商標申請數、設計專利申請數量最多,分別為世界其他先進國家的2-10倍不等(申請數量以每十億GDP為一單位計算);其次是加拿大、澳洲、日本、歐盟、美國與中國。歐盟已是第二年超越美國,並在其他主要競爭者中(美國、中國、巴西、俄羅斯、南非等)保持優先,唯優勢差距開始減少。此外,EIS跨年度分析評比,是以歐盟2012年創新表現為基準。報告中將歐盟2012年之創新表現預設為100,在2012-2019年間,中國的創新表現評分自79成長至97,而美國則在93-99間穩定變動;特別是2019和2020兩年,美國創新表現均維持在99,而無顯著之進步。故報告預測若依此趨勢,中國創新表現將在近年超越美國。
競業禁止新方向-「勞資雙方簽訂離職後競業禁止條款參考原則」