「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
美國貿易代表辦公室(the Office of the United States Trade Representative,簡稱USTR)於11月5日公布泛太平洋夥伴協議官方版本,並待各成員國國會同意。其中第18章是有關智慧財產權受到爭議較多。其涉及層面包括商標、地理標示、著作權及相關權利、網路服務提供者、資料專屬保護、專利連結、發明專利、工業設計、智慧財產權執行等等。其重點如下: (1)商標:TPP規定不得以視覺可感知的標識作為申請商標註冊的要件。 (2)地理標示:TPP要求提供適當及公開的程序來保護地理標示。 (3)著作權及相關權利:其中最重要者為將著作、表演或錄音物的著作權保護期間,延長至70年。 (4)網路服務提供者:TPP要求對ISP業者提供法律誘因,免除其可能擔負的共同侵權責任,鼓勵其與著作權人合作,共同遏止網路侵權。 (5)資料專屬保護:TPP要求對農藥或醫藥品提供資料專屬保護,保護期間為新化學性農藥至少10年;新成分新藥至少5年;已知藥品之新適應症、新複方或新投藥方法之臨床資料至少3年;新生物藥品至少8年或5年(併同其他有效保護市場機制)。 (6)專利連結:TPP要求建立專利連結制度。 (7)發明專利制度:其中較為重要者為TPP規定優惠期期間為本國申請案申請日前1年,且不限制公開的行為態樣。對於審查不合理遲延者,應補償其專利期限。 (8)工業設計:TPP要求應提供物品部分設計之保護。 (9)智慧財產權保護的執行:TPP規定法院有權判決敗訴方負擔訴訟及律師費用費用;透過行政、司法及海關等層面採取迅速保全措施等等。
FCC提出推動10年國家寬頻計畫2009年2月美國總統歐巴馬簽署美國振興經濟方案,釋出72億美元擴展寬頻網路連結應用,以網路開放為前提,要求聯邦通訊委員會提出國家寬頻計劃。美國聯邦通訊委員會(FCC )在2010年3月12日公布將推動一項歷時十年的遠大計畫,希望透過建立高速網際網路,重塑美國媒體與科技優先順序的概念。該計畫預定2010年3月16日送交國會。 這項計畫反映美國正視寬頻網路正逐漸成為取代電話與廣播電視業的普通媒介,工作重點在於強化網際網路存取方便性。該項計畫的重點包括補助網際網路提供者佈建偏遠地區的網路服務、拍賣頻譜以供無線寬頻設備使用,以及發展新型態的有線電視與上網功能之全面式機上盒。 此一計畫牽涉數百億美元的聯邦經費,但FCC認為,應可透過拍賣頻譜自給自足。此外,該計畫中的部分建議,尚須國會採取行動與業者支持才能落實,至於使用者恐怕要在數年後才能看到效果。 目前美國在使用寬頻與高速上網等方面落後包括亞洲國家在內的許多國家,約超過30%的美國人無法上網,原因是負擔不起或是沒有意願使用。而FCC的計畫希望能將美國打造成一個完全網路連結的環境,透過還有待矽谷研發的無線裝置讓民眾能快速上網取得健保資訊、進行網路學習,以及進行警民連線。 不過,FCC必須審慎處理既有業者上網費率與品質的問題,此外,不少電視業者以供公眾利益為由反對,並抗拒交回頻譜,以及認為這樣計畫將會導致訊號覆蓋及干擾的問題。
OECD發布《數位化推進資料治理以促進增長和福祉》、《資料治理政策制定之數位化指南》報告2023年5、6月經濟合作暨發展組織(Organisation for Economic Cooperation and Development, OECD)在邁向數位化計畫(Going digital Project)下陸續公布53個國家地區科學技術創新政策(science, technology and innovation policy)指標。OECD另一方面也提供許多政策工具供各政府參考,如2022年12月發布《數位化推進資料治理以促進增長和福祉》(Going Digital to Advance Data Governance for Growth and Well-being),並出版《資料治理政策制定之數位化指南》(Going Digital Guide to Data Governance Policy Making),協助應對轉型為數位治理時的潛在益處與風險。 《數位化推進資料治理以促進增長和福祉》指出,數位工具發展使資料蒐集、處理的效能大幅增加,邊際成本快速下降,為經濟、社會注入新驅動力。OECD觀察到COVID-19疫情危機中,各國政府藉多樣的資料有效追蹤疾病並做出相應對策;然而,也出現資料治理不當案例,如有勞動中介機構不慎在資料應用時加深性別勞動的不平等。因此,資料成為治理的戰略資產同時也需詳加了解資料多樣化的特性,在資料跨領域產製、流通與利用的過程中一併考量其益處與風險。 《資料治理政策制定之數位化指南》則點出三個發現,並提供相應策略做為各國政府治理參考。第一,關切資料開放同步產生的益處與風險,建議應確立風險管理的文化並建置透明且開放的資料生態系,以增加使用者的能動性,俾利人們自覺主動利用資料。其次,治理框架應平衡生態系中利害交疊的人民、企業團體、政府各部門等,藉契約範本、行為準則等機制確保決策各環節中利害關係人的參與機會和框架的一致性。第三,資料的邊際成本雖一再降低,然而進入門檻、後續管理的負擔仍重,政府應持續激勵資料的基礎建設投資,促進市場競爭並解決後進者的阻礙。
歐盟研究揭示研發策略新方向 將以氣候變遷、能源、健康與中小企業為主軸歐盟執委會於6月公布新的一般策略架構(Common Strategic Framework,CSF),在歐盟第七期研究架構計畫(FP7)於2013年告一段落後,CSF鎖定的研發策略方向仍會繼續,然此同時也引發一些不同的意見。為此執委會於6月間邀集產官學研進行討論,並於6月底揭示了新的計畫—Horizon 2020—。 歐盟執委會早於2011年初即發佈歐盟競爭力白皮書,揭櫫了未來新一期研究架構計畫之政策方向,其對於現有政策結構與資助機制有不小的衝擊。 新的CSF以氣候變遷、能源、健康與中小企業為研發資助之主軸,而為瞭解並蒐集各界包括大學、國有研究機構、各國政府以及企業界的意見,執委會於今年2月間發布了意見徵詢綠皮書以預先蒐集各界意見。根據執委會的規劃,新的CSF除要求教育體系應跟隨業界研發人才需求的腳步外,更鼓勵中小企業未來投入創新活動,因為執委會發現,歐洲的企業研發投資經費總額,僅有日本和南韓的一半。 歐盟執委會表示,氣候變遷、能源、健康與中小企業為未來研究資源資助與投入的方向,以呼應歐洲民眾的期待。此外,針對目前計畫所存在的行政效率不彰、缺乏透明性及計畫遲延等問題,也將列入未來改善重點,為此,歐洲議會已於6月進行FP7期中檢討時通過解決方案,日後將靠各國分別於歐盟及國家層級的計畫執行與管理中落實。 Horizon 2020計畫將於2014至2020年間斥資800億歐元於研發與工作機會的創造,以提升歐盟競爭力,後2013時期(post-2013)歐盟則將致力於化解計畫執行的分歧,確實協調各國投入新計畫的步調一致性。