「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
在今(2021)年1月21日,歐洲數個科技公司、非營利組織與研究機構等民間單位共同發起「現今資料主權」聯盟(Data Sovereignty Now,DSN),宣布將向歐洲各級決策者施加壓力,以確保資料(data)之控制權掌握在生成資料的個人和組織手中。該聯盟認為歐盟執委會應採取決定性之措施,對於在歐洲所生成之資料,應以資料主權原則為基礎,以確保生成資料之個人和組織對其有控制權,以利數位經濟。 而在2020年12月初,澳洲政府首開全球先例提出一新法案,要求Google與Facebook等平台應向澳洲在地媒體支付新聞內容費用,要求雙方進行協商,商討在其平台上顯示之新聞內容所應支付之費用,倘無法達成協議,則由政府之仲裁員決定應支付之金額。此法案引發Google與Facebook高度反彈,不惜以不繼續在澳洲提供服務或停止連結(link)當地媒體之新聞報導作為反擊,要求澳洲政府撤回或修改該法案;然DSN聯盟則認為,Google與Facebook利用其市場主導地位來向澳洲政府施加壓力,正是濫用其資料壟斷權(data monopoly)與壟斷地位之典型例子,為防止科技巨擎將來繼續以此方式勒索政府之唯一方法,即是恢復使用者與平台間之「數位利益平衡」。而Google似有讓步之跡象,根據路透社報導,Google分別已與兩家當地媒體達成協議,將各支付每年3000萬澳幣之費用。該法案是否會如期通過,進而改變或影響此類大型平台與各國政府間資料主權之角力關係,值得持續關注。
歐盟食品管理局擬建立風險評估外部專家資料庫近年來,由於(European Food Safety Authority, 簡稱EFSA)對GM產品之管理並未能進行足夠之科學分析,同時,亦過份仰賴業者所提供之數據資料等原因,而造成歐盟某些會員國家對EFSA所作出之評估報告於公正及客觀性方面產生質疑;甚至,歐洲食品業者亦對目前EFSA是否將會因為專家人力不足而導致整體風險評估能力下降之問題表示關切。一位EFSA官員指出:我們需要更多科學專家來協助處理與風險評估有關之事務。 其次,隨著各界因對GMO產品不當之批判與歐洲整體食品安全評估工作量增加等因素,EFSA於日前決定,欲透過建立一外部專家資料庫(External Expert Database),來協助其風險評估工作之執行並促進評估專家招募過程之透明化,以達成免除外界對於歐洲食品安全評估過程疑慮之目的。不過,這些將提供協助之專家,並不會因此而真正成為EFSA科學評估小組成員(其將被視為是由人民主動對該小組執行評估工作提供協助)。除EFSA擬徵求歐盟境內專家學者外,未來其亦將邀請歐盟以外其他國家並在該領域為重要研究先驅之專家提供協助,以增加風險評估之品質與客觀性。 再者,綠色和平組織歐洲發言人Mark對於EFSA現階段執行之工作狀況也表示意見並指出:目前EFSA是在一種配備不良(ill-equipped)之狀態下,來勉強執行其所執掌之事務;不過,更讓人感到憂心者,則是由EFSA科學評估小組所做出科學性之意見,於不同會員國家間或於歐盟以外其他國家其是否仍將會被完全採納之問題。有鑒於此,相關人士認為:應再次強化EFSA於風險評估方面之能力! 最後,一位非政府機組織專家也提醒:僅單純地透過專家庫之建立,其實,並不能圓滿地解決當前EFSA於決策機制中所遭遇之困難;而只有當EFSA在未來欲邀請外部專家提供協助與支援時,一併將資金及相關政策配套措施納入考量後,才是此問題真正解決之道。
世界智慧財產權組織發表2020年全球創新指數報告世界智慧財產權組織(World Intellectual Property Organization, WIPO)於2020年9月2日發表「2020年全球創新指數報告」(Global Innovation Index 2020, GII 2020),報告中比較131個經濟體之最新全球創新趨勢。GII為一年一度發行之報告,除了比較不同經濟體的創新指數外,每年會挑選不同創新議題進行深度研究,2020年研究主題為「誰投資創新?」(WHO WILL FINANCE INNOVATION?)。 GII的報告評比,區分為七大指標分別為:組織機構(Institutions)、研發與人力資源(Human capital and research)、基礎建設(Infrastructure)、市場成熟度(Market Sophistication)、企業成熟度(Business sophistication)、知識技術產出(Knowledge and technology outputs)以及創意產出(Creative outputs)。其下再區分為21個次標和80個小標例如政府效能(Government effectiveness)、法規範環境建構(Regulatory environment)、教育支出占GDP比例、外國學生比例、R&D支出占GDP比例、生態永續度、高科技出口、資通訊服務出口等。2020年評比全球創新指數最高的10個國家排名分別為:瑞士、瑞典、美國、英國、荷蘭、丹麥、芬蘭、新加坡、德國和南韓,均為高所得國家;這也是南韓第一次躋身進入前10名。 另外報告中亦說明,2020年COVID-19大流行引發前所未有的經濟停滯。在COVID-19爆發之前,研發支出成長明顯快於全球GDP成長,創業投資(Venture capital)和IP應用達到高峰,但疫情發生的現階段全球經濟成長大幅度下降。然而經濟成長停滯之下,突破性技術創新的潛力仍在繼續存在,例如許多仍保有現金流的大型ICT企業仍持續推動數位創新,製藥技術與生物科技產業的研發支出大量增加,健康產業研發也受到重點關注。此外,COVID-19危機亦會促進傳統產業(例如旅遊、教育和零售等)之創新,以及改變企業在本地或全球之生產工作組織方式。而在各國政府為忙於制定緊急救濟計畫(emergency relief packages),以緩解地域封鎖所造成的負面影響和經濟衰退的同時,這些緊急救濟計畫對新創公司之融資多半不夠明確,到目前為止,各國政府並沒有創新研發作為當前刺激經濟計畫中的優先事項(priority)。 報告中針對「誰投資創新?」之主題,統計數據顯示創新金融(Innovation finance)雖然受疫情影響有所下降,但金融體系尚屬健全。惟資助新創企業的資金正在枯竭(drying up),北美、亞洲和歐洲地區的創業投資交易也急劇下降,幾乎看不到首次公開發行(IPO)。即使是倖存下來的新創公司,其盈利能力和對創投者(Venture Capitalist)的吸引力也在下降。也因為疫情影響,創投者減少對創新、小型和多元化的新創事業提供資金,取而代之關注所謂的「大型交易」(mega-deals),也就是資助大型企業的發展,並將投資領域轉向健康、線上教育(online education)、大數據、電子商務和機器人科技。此外,報告中亦說明近期創投多半集中在可以短期得到報酬的創新事業,例如資通訊軟體及服務、消費性產品服務、金融商品等,取得創投機構大量資金。相較之下,若研發較為複雜的前瞻科學技術,反而取得之資金較少;同時COVID-19惡化此現象,使研發期較長之產業和企業面臨更嚴峻的財務限制。
中國要求互聯網企業隨著消費者擔憂程度提高應加強數據隱私在越來越多消費者擔心部分企業以進行大數據研究名義竊取、交易或透露個人資料之行為,侵犯消費者隱私情況下,中國政府已要求互聯網企業加強對個人資料之保護;這並非中國當局第一次要求互聯網企業加強數據隱私保護,中國消費者協會(China Consumers Association, CCA)亦曾示警,中國大量智慧型手機應用程式正在蒐集過多個人資料,包括但不限於用戶位置、聯絡人清單及手機號碼。 中國互聯網金融協會(National Internet Finance Association of China, NIFA)於 11月初發表聲明提及:「未經消費者同意,會員組織不得蒐集、利用或向第三方提供消費者個人資料。」、「所有會員機構都應承擔保護個人資料之個人責任。如發生問題,應立即予以改善並報告給協會……消費者風險警示亦應加強。」,該協會亦向所有會員機構提出警告,對數據隱私之改善措施應承擔個人責任。 中國互聯網企業讚揚AI工具可使用海量數據以增強消費者體驗之優點,然它們不得不靈活應對消費者對如何蒐集與利用個人資料日益增長之焦慮,而中國政府目前正起草制定有關個人數據隱私保護法律,以解決日常生活伴隨著多方數位體驗而生之敏感問題。