「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
歐盟執委會(European Commission,下稱執委會)於2020年底提出數位服務法(Digital Services Act,DSA)以及數位市場法(Digital Market Act,DMA),而歐洲議會(European Parliament)最終於2022年7月5日以壓倒性的多數決通過上述法案,待歐盟理事會(Council of the European Union)核准通過後,法案將在公告於歐盟官方公報(EU Official Journal)後20天生效,並分別依規定時間開始適用。歐盟理事會已於2022年7月18日率先核准通過DMA,並正進行登載公報相關程序,DMA將於生效日起六個月後開始適用。以下將簡述兩法案主要內容: 1.數位服務法(DSA):主要係處理線上非法內容、不實資訊以及其他社會風險等散播問題。依DSA,數位服務提供者於其服務或交易平台應針對涉及侵害基本權之非法內容即時採取反制措施、強化平台交易者之查核並提高可追溯性、增加平台的透明度及有責性,並應禁止具誤導性及部分特定類型之定向廣告,如針對兒童的廣告或以敏感資訊為基礎的廣告等。 2.數位市場法(DMA):要求大型的主流線上平台於數位市場擔任「守門人」(gatekeeper),以確保消費者有公平的交易環境。守門人應與第三方交互使用服務,並使商業用戶得存取於其平台所生之資料,且不得:在其平台的檢索(index)與索引(crawl)相關排名中自我偏好(self-preferencing)自身產品及服務、令使用者難以卸載預先安裝之軟體或應用程式、以廣告為目的利用使用者個資。值得注意的是,執委會得對違反DMA規定之守門人處以其最高全球總營收10%的罰鍰,累犯者之罰鍰上限將提高至年度營收的20%。
Mcdonald’s 品牌資產保衛策略麥當勞公司已申請McDonald’s 與Logo- M用於咖啡,更於九月份將其所販售的研磨咖啡與咖啡豆,以 “Mc Café” 申請商標註冊,意味著未來這間全球最大的漢堡連鎖店,將於店內甚或超市販售『麥當勞咖啡』。『如同大部份的企業,我們註冊許多商標用以保護我們的品牌資產!』麥當勞發言人 Danya Proud表示這並非奇聞。 近幾年,麥當勞成功的因素在於擴展它們的飲料事業,引進優質咖啡與水果冰沙,而選擇在全球速食連鎖店成長緩慢的時候,進入袋裝咖啡市場,亦是個創新手法。 星巴克的商標申請亦侵略性的跳脫普遍存在的咖啡廳而進入零售市場,一九九八年即開始自行經營袋裝咖啡事業,今年七月販售於超市、藥妝店、量販店的咖啡市占率更由25.6 %提升至28.2 %。 其實,麥當勞早在五年前即以 “Mc Café”,擴張咖啡與特色飲料事業,而此些利潤遠高於原本的速食餐點,且間接促使許多顧客駐足停留店內,也許是眼看Dunkin` Donuts於超市與自家甜甜圈店強力販售袋裝咖啡,讓麥當勞思考複製此模式。然而此舉也可能僅止為預防手段,如果麥當勞無意進入袋裝咖啡市場,“Mc Café ”商標也可以防止競爭者以『麥當勞品牌』販售咖啡。
美眾議院擬立法要求ISP業者留存用戶資訊八位美國眾議員於2007年2月6日連署提出新法案,擬賦予司法部門首長更大的權限要求網路服務提供者(ISP)記錄用戶的網路活動並留存特定的用戶資訊。草案提交眾議院審議後,隱私保護機構紛紛表達反對立場。 此次由德州眾議員Lamar Smith主導的新法案「the Internet Stopping Adults Facilitating the Exploitation of Today's Youth Act of 2007(簡稱SAFETY Act)」中,ISP業者必須保留的用戶資料,最低限度需包括用戶姓名、地址、電話及IP位址;至於用戶資料的留存期間,則將交由美國司法部決定。以現況而言,多數ISP業者所保存的用戶資訊均在半年以下;然而美國司法部部長Alberto Gonzales曾於2006年9月公開倡議ISP業者資料留存期間,應以兩年為宜。 此外,草案亦要求ISP業者發現其所提供的服務存在兒童色情情事時,應主動通報主管機關,否將面臨15至30萬美元的罰金;若其有意地助長兒童色情的流傳,更可能面臨最高10年的徒刑。 批評者如「民主及科技中心」(Center for Democracy and Technology;CDT)表示,此法案不啻為對憲法修正條文第一條的威脅,毫無限制的授權更可能肇致用戶資料的留存期間成為司法首長個人得以專擅決策之事項。
執法部門無搜索令要求提供手機位置記錄並未違憲美國聯邦第六巡迴上訴法院於2016年4月13日就U.S. v. Timothy Ivory Carpenter & Timothy Michael Sanders案作出判決,裁定執法機關在未取得搜索令的情況下要求出示或取得手機位置記錄,並不違反憲法增修條文第4條。美國憲法增修條文第4條規定:「人人具有保障人身、住所、文件及財物的安全,不受無理之搜索和拘捕的權利;此項權利,不得侵犯;除非有可成立的理由,加上宣誓或誓願保證,並具體指明必須搜索的地點,必須拘捕的人,或必須扣押的物品,否則一概不得頒發搜索令。」 本案事實係聯邦調查局取得兩名涉及多起搶劫案之嫌疑人的手機位置,而根據手機位置之相關資料顯示,於相關搶案發生之時間前後,該二名嫌疑人均位於事發地半英哩至兩英哩的範圍內,故該二名嫌疑人隨後被控多項罪名。在肯認與個人通訊相關之隱私法益的重要性的同時,聯邦第六巡迴上訴法院認為,「縱使個人通訊之內容落於私領域,但是為了將該些通訊內容自A地至B地所必須之資訊,則非屬私領域之範疇。」聯邦第六巡迴上訴法院拒絕將憲法增修條文第4條的保護延伸至像是個人通訊或IP位址等之後設資料(metadata),其原因在於,蒐集此等資訊或記錄並不會揭露通訊的內容,因此本案之嫌疑人就聯邦調查局所取得之資訊並無隱私權之期待。法院認定,此等行為不同於自智慧型手機取得資訊,因為後者「通常而言儲存了大量有關於特定使用人之資訊。」 2015年11月9日,美國聯邦最高法院拒絕審理Davis v. United States案,該案係爭執搜索令於執法部門要求近用手機位置資料時之必要性。加州州長Jerry Brown於2015年10月亦簽署加州電子通訊法(California Electronic Communications Act, CECA),該法禁止任何州政府的執法機關或其他調查單位,在未出示搜索令的情況下,要求個人或公司提供具敏感性之後設資料。