「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
美國華府行政管理與預算辦公室(Office of Management and Budget)頒布執行M-13-13 Open Data政策備忘錄之指導綱要(Supplemental Guidance on the Implementation of M-13-13 “Open Data Policy-Managing Information as an Asset”),目的在於澄清問題及提供執行細節以協助政府部門實施執行命令第13642號及M-13-13 Open Data政策備忘錄。透過實踐本指導綱要,各政府部門將能確保用以盤點、管理及開放資料的基礎設施之完備,進而開創因開放資料所產生之價值。 資料在依據本綱要進行盤點時,主管機關必須一併予以分級,其近用層級(Access Levels),區分為公開(Public)、限閱(Restricted Public)、非公開資料(Non-public)。資料公開前會經過完整之隱私權保護及資訊安全事項檢視,無違反相關法律和政策規範者,始釋出予大眾。 針對備忘錄之五項執行要求,本指導綱要即分為五項對應指導,介紹如下: 1.建立及維運大型資料盤點目錄:目的在使聯邦政府部門建立清楚且完整之資料資產目錄,而在製作盤點目錄後,必須持續改進、維護資料,並以擴展、豐富、開放三種面向來評估檢視盤點目錄之成熟度。 2.建立及維運公開資料清單:為增進資料查詢之容易度及可用性,各部門須篩選上述資料盤點目錄中屬於公開層級或可以被公開之資料,並建立及發布公開資料清單,作為盤點目錄之子目錄,使民眾得以知悉現有公開資料,及接續地將被公開之資料。各部門基於裁量權,亦可決定是否列入限閱或非公開資料資產,使民眾能知悉該筆資料之存在以及近用該資料之程序。 3.建立用戶參與資料釋出程序:此程序將提供資料用戶參與促進資料釋出及認定釋出之優先順序。由關鍵的資料用戶來幫助聯邦政府認定資料資產價值,而被認定最高價值之資料將優先、快速釋出。 4.當資料無法釋出時,須以文件證明:政府部門必須確認資料經過完整之隱私權保護及資訊安全事項檢視,無違反相關法律和政策規範者,才能公開資料。當認定資料涉及違反上述規範時,則須以文件證明其諮詢該政府部門中所設之法律顧問單位(Office of General Counsel)或同類單位後之決定,再依據三種資料近用資層級予以分類。 5.指導綱要中要求列出各部門應該負責管理資訊之窗口。 原定11月1日為完備上述基礎設施建置之最後期限,然為因應美國自10月1日起聯邦政府關門,特寬限延期至11月30日;在11月30日後,各部門將於每季報告執行進展,而部門開放資料之績效將被列為跨部門優先追蹤對象。
法國CNIL重罰微軟因搜尋引擎Bing違法運用cookie法國國家資訊自由委員會(Commission Nationale de l'Informatique et des Libertés, CNIL)基於cookie聲明(cookie banner)違反法國資料保護法(Act N°78-17 of 6 January 1978 on Information Technology, Data Files and Individual Liberties)裁罰微軟愛爾蘭分公司(Microsoft Ireland Operations LTD,下稱微軟)搜尋引擎Bing,並根據cookie蒐集資料間接產生的廣告收入、資料主題數量及處理的資料範圍定出6千萬歐元之罰鍰額度,且要求微軟應於3個月內限期改正,如逾期按日處以6萬歐元罰鍰。本案是繼2022年1月6日以來,CNIL以相同理由分別對Google與Facebook裁罰1.5億及6千萬歐元罰鍰後,再增1件科技巨頭因違法運用cookie遭受裁罰之案例。本案對我國隱私執法機關參酌於數位環境中,應就cookie聲明如何進行管理之理由與細節,具有參考價值。 而本案微軟之搜尋引擎Bing遭受裁罰之理由,主要可分為二面向: 一、未經使用者事前同意,逕於使用者設備中設置cookie 依法國資料保護法第82條規定,業者利用cookie或其他追蹤方式針對使用者終端設備上的資料進行讀取或寫入資料前,應盡告知義務並取得使用者同意。惟搜尋引擎Bing在使用者造訪網站時,未經使用者同意便設置一種具有安全及廣告等多種用途的cookie(MUID cookie)於其電腦設備,且當使用者繼續瀏覽網站時,將會另設置其他廣告cookie,然微軟亦未就此取得使用者同意。 二、拒絕設置cookie與給予同意之方式便利性應相同 在有效同意的標準與具體判斷上,由於搜尋引擎Bing的cookie聲明第一階層僅提供「接受」與「設定」兩類按鈕,並未提供「拒絕」按鈕,因此使用者同意或拒絕設置cookie之流程便利性有其差異,並未一致,如下說明: (一)使用者同意設置cookie 如使用者同意設置cookie,僅需於cookie聲明的第一階層點擊「接受」按鈕,即完成設置。 (二)使用者拒絕設置cookie 若使用者欲拒絕設置cookie,需於cookie聲明的第一階層點擊「設定」按鈕;其後進入第二階層,使用者可於各類型cookie選擇開啟或關閉,再點擊「保存設定」按鈕,始完成設置。 是以使用者拒絕同意設置cookie與給予同意之方式,兩者的便利性並未一致。又因第二階層顯示默認未設置cookie,恐導致使用者誤以為網站並未設置cookie,故CNIL認為此種同意欠缺自願性而屬無效者。
法國通過具爭議性的iTune法法國眾議院與參議院於 2006 年 06 月 30 日 通過倍受爭議的 iTune 法,其主要理念在闡述著作權法的設計應該要防止將音樂著作消費者侷限在僅能利用特定設備聽取音樂的藩籬中,而目前 iTunes 提供的音樂格式僅可利用 iPod 設備播放,明顯違反此一理念。 眾議院原先通過之條文要求歌曲必須可以在任何設備上播放,但此一規範受到蘋果公司反對,認為如此規定將降低音樂檔案的安全性,而造成「鼓勵盜版」的結果。參議院為此修改規範內容,於規定中設計小部分空間賦予廠商可以運用 DRM 技術限制音樂於特定設備播放之音調;且若廠商獲得著作權人 ( 唱片公司及著作人 ) 之同意,仍得限制特定音樂格式僅得於特定設備中播放 ( 如: iTunes 的情況 ) 。 社會主義與綠黨之國會議員目前正針對此一規範提出違憲主張,若該主張無法成立,法國將成為歐洲訂定此一規範之先驅,預料其他歐洲國家將可能跟隨法國之腳步進行規範,如此情勢可以從挪威消費者保護官晚近作出之決議,認為 DRM 技術已破壞競爭法則,必須加以修正,以及其他國家包括丹麥、瑞典之類似決議窺知一二。
歐盟執委會發布2021歐洲創新計分板報告歐盟執委會(European Commission, EC)於2021年6月21日發布2021歐洲創新計分板報告(European Innovation Scoreboard 2021, EIS),其以「整體架構條件」(Framework conditions)、「投資」、「創新活動」和「影響力」(Impacts)四大評比指標,其下再細分為12個次標和32個子標,次標例如人力資源、企業創新、就業影響力等;子標則例如政府部門研發創新支出、企業專業職能訓練、專利與商標申請、高科技產品出口等。相較於2020年創新計分板報告的10個次標和27個子標,本次新增2個次標為列屬在「投資」下的資通訊運用(Use of information technologies),以及在「影響力」下的環境永續。資通訊使用廣度又可分為(1)企業是否提供教育訓練以提升員工的資通訊技能、(2)是否聘用資通訊專家。而環境永續下又可細分為(1)資源生產力(Resource productivity)、(2)產業排放PM2.5狀況、(3)環境相關技術發展狀況;以上即為今年新增的5項子標。 歐洲計分板依前述指標將歐盟會員國創新表現分為四組,2021年綜合創新能力分別為:(1)創新領導者(Innovation Leaders):包含瑞典、芬蘭、丹麥、比利時,為創新表現大於歐盟成員國平均創新度,且超過25%以上者;(2)優秀創新者(Strong Innovators):包含荷蘭、德國、盧森堡、奧地利、法國等,創新表現大於歐盟成員國平均但不超過25%者;(3)中等創新者(Moderate Innovators):包含義大利、馬爾他、西班牙、葡萄牙等國,其創新表現小於歐盟平均者;以及最後一組(4)新興創新者(Emerging Innovators):包含匈牙利、波蘭、羅馬尼亞等,為創新表現低於歐盟平均之70%。其中第四組新興創新者為新名稱,以取代2020年的適度創新者(Modest Innovators),且今年共有7個國家落入第四組,相比2020年的2個國家還要增加許多。 此外,在各特定領域上,該報告亦有對不同國家進行排名。例如在數位化領域,表現最好者為丹麥、芬蘭、荷蘭。在企業投資部分,以德國、瑞典和比利時為最佳。而在全球綜合創新表現上,歐盟綜整OECD和世界銀行的數據分析,南韓為創新表現最佳,其次才是加拿大、澳洲、美國、日本和歐盟。歐盟於2020年之創新排名領先美國,但在2020年到2021年之間,美國之中小企業產品與流程創新大幅增長至2020年的兩倍,故創新排名從第6進步到第4。