「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
美國環保署(United States Environmental Protection Agency, EPA)為限制汽車廢氣排放污染物對環境造成的危害,根據美國《潔淨空氣法》(Clean Air Act, CAA)的授權,於2023年4月12日提出《2027年式輕型、中型商用車車型污染物排放標準》(Multi-Pollutant Emissions Standards for Model Years 2027 and Later Light-Duty and Medium-Duty Vehicles),以及《重型商用車溫室氣體排放標準-第三階段》(Greenhouse Gas Emissions Standards for Heavy-Duty Vehicles – Phase 3)這兩件汽車廢氣排放新標準,期加速電動汽車(Electric Vehicle, EVs)發展、加速潔淨交通轉型。 《2027年式輕型、中型商用車車型污染物排放標準》以及《重型商用車溫室氣體排放標準-第三階段》分別針對2027年到2032年所出廠的輕型商用車、中型商用車以及重型商用車的汽車廢氣排放標準做出更嚴格的新規範,預計將成為美國迄今為止最嚴格的汽車廢氣排放標準。目標是到2032年時,輕型商用車行駛每英里二氧化碳平均排放量下降至82公克,溫室氣體排放量相較於2026年車型年標準將減少56%;中型商用車行駛每英里二氧化碳平均排放量下降至275公克,溫室氣體排放量相較於2026年車型年標準則將減少44%。至於重型商用車,以重型拖曳機(heavy-haul tractors)為例,將從2027年車型年行駛每噸英里二氧化碳平均排放量48克,到2032年時下降至41公克左右。 根據這兩件汽車廢氣排放新標準,並未禁止化石燃料汽車的製造或銷售、亦未規範要求電動汽車的年製造量或年銷售量要達多少數量或比率,而是為汽車限定更嚴格的廢氣排放標準,因此,仍無疑地將迫使汽車製造商減少販售化石燃料汽車、加速推動電動汽車生產的腳步以符合新的排放標準規定。環保署預測汽車製造商在為符標準所採的相應作法之下將會大幅提高電動汽車在新車的銷售比率:到2032年時,電動汽車將佔輕型商用車新車銷量的 67%、中型商用車新車銷量的46%。而此累計可望到2055年時減少約100億噸的二氧化碳排放,相當於美國2022年二氧化碳總排放量的兩倍多。將有效減少有害空氣汙染、並大幅降低因空氣汙染所致的罹病風險以及過早死亡等危險。 藉由新的排放標準,將逐步淘汰化石燃料汽車的生產,加速潔淨交通轉型,有效應對氣候危機並提高全國各社區空氣品質。
國防訓儲制將有重大變革,研發納入替代役行政院跨部會會議審查通過替代役條例修正草案,將研發役納入替代役,取代現行的國防訓儲制,惟研發替代役規劃內容並不等同於現行國防訓儲制,例如:國防訓儲限制預官申請,但研發替代役並未限制,此將使海外人才、海外小留學生等符合科技研發資格的碩博士,均可申請回台進入科技廠商服研發替代役。 此外,國防訓儲制在入伍短暫基礎訓練後,就如同後備軍人進入民間科高科技企業領一般工程師高薪,並享有分紅、配股,被外界抨擊為不公,未來研發替代役將改革這項缺點。將來申請服研發替代役者,在一年多的法定義務役期過後,超過的服役期限替代役男始可領取一般工程師薪水。 研發替代役役期除一年四個月法定義務役外,最長可申請延長三年,但期限要報院核定,具有彈性。至於科技大廠最關心的員額數量,仍將依內政部替代亦審議委員會審查各需用機關替代議員額需求要點第3點進行審查並視兵源調度,然員額可望逐年提升。 內政部並將進一步訂定研發替代役申請辦法,使海外人才可透過網路申請,預料研發替代役將可吸引海外學人歸國貢獻研發,對提升產業競力將有助益。替代役修正修正草案送行政院院會通過後,將送交立院審議,行政院表示會積極爭取法案在本會期過關,最快九十六年可實施。
PayPal 要求電子信箱服務提供業者封鎖未附有電子簽章的信件E-bay集團旗下的線上付款服務公司PayPal的代表律師Joseph E. Sullivan 於三月二十七日在倫敦舉辦的第五屆國際網路犯罪討論會議( International E-Crime Congress )中,提案要求電子信箱服務提供業者透過封鎖未附有電子簽章(Digital Signature)信件之方式,減少網路釣魚騙局(Phishing)的產生。該提案主要目的在透過電子信箱服務提供業者過濾垃圾郵件篩選系統( Spam Filters),以防堵看起來幾可亂真的網路釣魚郵件。雖然參與該國際網路犯罪討論會議的業者及政府機構並未對該提案達成共識,但是PayPal公司已和Google公司旗下的電子信箱服務Gmail達成協議,加強過濾垃圾郵件的篩選。 PayPal 是最常被詐騙集團利用偽裝郵件(Spoofing Emails)的受害公司之一,目前詐騙集團以偽裝公司郵件的技術進行網路釣魚,以騙取個人資料或帳號密碼來謀利。Paypal目前已使用數項電子簽章的安全技術,其中包括Yahoo!公司所研發的網域認證鑰匙(DomainKeys),該技術能有效地判斷寄件者的網域(Domain)是否為偽造及寄出信件是否來自偽造的網域。 目前網路釣魚的網站如雨後春筍般地出現,根據一份由國際業者及政府機構聯合提出之「反網路釣魚世界組織」(Anti-Phising World Group)報告指出,統計至今年一月份為止,全世界的詐騙網站已高達兩萬九千九百三十個。故PayPal特別對反制網路詐騙集團利用即可亂真的網路釣魚郵件,將上述提案於國際會議中提出討論 。
美國閒置頻譜發展近況為了讓業者間服務不受干擾,政府在規劃頻段時,皆會設置護衛帶(Guard Band),以維持服務品質。不過,隨著科技的進步,業者彼此干擾程度降低,頻譜的使用也較過去有效率,導致頻段常有閒置的情況。是故,FCC在2008年正式公告開放閒置頻譜(white space),透過業者無須取得執照,以增加頻譜的活用與增加民眾網路接取。美國在2009年完成無線電視數位化後,亦從700MHZ較低頻段留下成對5*5MHz,期望透過該頻段覆蓋率高特性,增加業者投資偏遠地區,使當地民眾享有網路帶來的便利性。 閒置頻譜的開放利用,雖可增加公益性與頻譜使用性,但亦存有干擾無線麥克風、行動電話與廣播服務等服務之虞。FCC為了兼顧各業者服務品質與頻譜有效運用,透過地理位址功能(geo-location capability),輔以成立數據資料庫的方式,藉由資訊透明減少頻譜開放後的互相干擾。今年FCC閒置頻譜的發展,3月允許全國可建置TV Band Devices,期以迅速活化頻譜利用;5月公告低功率的電台須登記資訊於數據資料庫,以避免服務受到干擾。6月,FCC宣佈Google通過測試,成為美國第三家數據資料庫業者,增加服務競爭性。部分輿論則是認為Google在擁有地圖與數據資料庫後,將會更致力在偏遠地區使用無需執照頻譜(Unlicensed Spectrum),此舉無疑是增加Google服務影響力。 政府具有規劃性開放的結果,已直接影響民間投入閒置頻譜的利用。目前,Google與微軟相繼於非經濟地區,建置「閒置頻譜」設備,期以將網路服務滲入美國各角落。西維吉尼亞大學(West Virginia University)宣佈將開發校園與周邊地區的閒置頻譜,已提供鄰近區域免費Wi-Fi服務。除此之外,亦有部分企業透過策略聯盟發展「圖書館Gigabit網路」計畫,期以透過無線電視頻段具備高涵蓋與穿透力之特性,使圖書館與附近地區皆可享受免費無線網路。該聯盟已於五月宣布選擇堪薩斯城(Kansas City)公共圖書館為試點區, 且持續公開徵求自願參與之圖書館。 綜上所敘,在業者服務彼此不受干擾為前提下,閒置頻譜的開放確實可活化使用效率與增加網路接取性。並且,輔以無線電視空白頻段之優勢,可以預見未來Wi-fi無論是網速亦或是穩定度,其品質將更為提升,使無所不在網路落實於社會每個角落。