「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
中國大陸網路安全法於去(2016)年11月通過,於今(2017)年6月1日正式施行,該法主要係為了保障網路安全,維護網路空間主權與國家安全、社會公共利益,保護公民、法人和其他組織的合法權益,為第一個國家層級處理網路安全問題的法律,旨在確保維護網路空間的國家主權、保護使用者個資、防範網路攻擊及網路詐騙。 中國大陸網路安全法共七章79條,包括第一章總則、第二章網路安全支持與促進、第三章網路運行安全、第四章網路訊息安全、第五章監測預警與應急處置、第六章法律責任、第七章附則。其規範重點之一為關鍵資訊基礎設施正式納入網路安全保護範圍內,關鍵資訊基礎設施之定義不僅包括電力、運輸和金融等傳統關鍵行業,還包括法律規定涉及民生的其他基礎設施,表示任何關鍵資訊基礎設施相關廠商、供應商等外國公司,以及擁有大量中國大陸訊息的廠商,都有可能成為中國大陸網路安全法監管、執法調查、強制執行的主要對象。 中國大陸網路安全法亦要求關鍵資訊基礎設施相關廠商將個資與重要數據資料在地化,或是將這些數據資料傳輸至國外前,必須經過相關的監管機構進行自我安全評估或先加以批准。
歐盟訂定新規範 管理傳統草藥品上市近年來,歐洲市場對傳統草藥的接受程度逐漸上升。傳統草藥銷售市場在歐盟成員國正在快速成長,其中從中國進口的傳統中藥數量更以倍數上升。目前歐洲市場上的天然植物藥約略可分為三大類:第一類是處方藥,用於治療危重病症的植物藥針劑也包括在內;第二類是非處方植物藥;第三類是保健製藥,可在保健食品店購買。歐盟去年通過的傳統草藥品指令(EU Directive on Traditional Herbal Medicinal Products)自2005年10年31日起,已全面生效適用於歐盟地區。該指令為傳統植物來源藥品於歐盟境市場內銷售,開啟了依照簡化查驗程序上市的途徑,但也限制了部分草藥品的上市可能。 其中較具衝擊性的是:傳統使用要件之認定嚴格。根據指令第16c(1)條,此一傳統使用歷史必須是30年以上,且其中至少有15年是在歐盟境內的使用歷史,方可考慮其安全性及療效。「傳統使用」仍須有相關文獻及專家證明其:(1)已使用相當年限之客觀事實、(2)具有安全性與療效之可信度,因此,簡化程序並無法適用於”偏方”之傳統草藥。而「必須是在歐盟境內至少有15年的使用歷史紀錄或資料」,更大大限制了在1990年前尚未進入歐盟會員國的草藥品,將可能因此被擠出歐盟市場。 該指令規定了七年的緩衝限期,可讓歐盟會員國調整不符合簡化查驗程序申請資格、但在該指令生效前已在各會員國市面上銷售的草藥品。
「巨量資料應用」當工業的製造生產過程經過一連串自動化、產量化以及全球化之變革歷程之後,智慧工廠的發展已經成為未來各國的重點目標。生產力4.0的設計中,巨量資料(Big Data)是重要的一環,以製造業為例,傳統上將製造生產取得的數據僅用於追蹤目的使用,鮮少做為改善整體操作流程的基礎,但在生產力4.0推進之後,則轉變為如何藉由巨量資料來提升生的效率、利用多元資源的集中化與分類處理,並經過分析取得改善行動方式,使生產最佳化,再結合訂單需求預期分析,依市場變化調整製造產量,達成本控制效果。 在我國104年9月公布之「2015行政院產力4.0科技發展方案」,亦提及智慧機械、智慧聯網、巨量資料、雲端運作等技術開發,使製造業、商業服務業、農業產品服務等,提升其附加價值。除此之外,經濟部積極規劃佈建巨量資料自主技術研發能力並且促成投資,落實應用產業智慧化與巨量資料產業化之目標。然而,巨量資料的應用因涉及大量的資料蒐集與利用,因此,未來應著重於如何將資料去辨識化,顧及隱私與個人資料之保護。目前,針對此部分,法務部將研擬個人資料保護法修正案,制訂巨量資料配套法規。
InterDigital於美國ITC再啟關稅法第337條調查美國著名非專利實施實體(Non-Practicing Entity, 以下簡稱NPE)公司-InterDigital(InterDigital Technology Corporation),於2013年1月31日以三星(Samsung)、諾基亞(Nokia)、華為(Huawei)及中興(ZTE)等公司侵害其7項3G及4G之無線通訊專利(U.S. Patent No.7190966、No.7286847、No.7616970、No.7941151、No.7706830、No.78009636、No.7502406)為由,向美國國際貿委員會(United States International Trade Commission, 以下簡稱USITC)提請依美國關稅法第337條啟動專利侵權調查(案號:337-TA-868) InterDigital成立於1972年,主要研發領域聚焦於「無線語音及數據通訊系統」,所持有的專利組合涵蓋了現今2G、3G、4G及IEEE 802等相關主流技術。依據PatentFreedom於2013年1月的統計資料,InterDigital共持有2961項美國有效專利,於全球NPE中排名第四。作為典型的NPE,InterDigital本身並不自行使用所擁有的專利,而係以「授權予手持裝置製造商、半導體製造公司或其他設備製造商」作為主要商業營運模式。 因此,為確保專利能發揮最大運用效益,InterDigital會主動搜尋市場中潛在的侵權人,並透過法律訴訟手段,促使其支付授權金。其中,USITC的「關稅法第337條」調查程序,即為重要的策略手段之一,因其所需的審理時間較一般法院的民事訴訟程序為短,且於確認存在專利權侵害之情事後,其裁決效力可透過禁制令(Exclusion Order)或暫停及停止令(Cease And Desist Order)直接對被控侵權人的產品進口及銷售造成重大影響,故在為數不少的案件中,被告往往會選擇給付授權金以求停止關稅法337條之調查程序。 由於本案中遭調查的產品幾乎涵蓋了各廠商於市場中的主要產品(例如三星的Galaxy Note、Tab及S系列、Nokia Lumia系列、中興的4G移動熱點設備、華為的Activa 4G手機等),故引起了產業界的高度關注。針對本案,USITC已於2月4日宣布啟動為期16個月的侵權調查,並定於2014年6月4日前完成所有調查,其後續調查結果及本案如何發展,值得持續觀察。