美國白宮於2018年3月發布〈總統管理方案(President’s Management Agenda)〉,其中發展「聯邦資料戰略(Federal Data Strategy)」,將資料作為戰略資產,藉以發展經濟、提高聯邦政府效能、促進監督與透明度,為方案中重要之工作目標之一。「聯邦資料戰略」之架構上主要包括四個組成部分,以指導聯邦資料之管理和使用:1.使命宣言:闡明戰略之意圖與核心目的;2.原則:有十大恆定原則對於機關進行指導;3.實作規範:有四十項實作規範指導機關如何利用資料之價值;4.年度行動計畫:以可衡量之活動來實踐這些實作規範。
於2019年12月23日,〈2020年行動計畫〉之最終版正式發布,其將建立堅實之基礎,在未來十年內支持戰略之實踐。詳言之,〈2020年行動計畫〉之內涵主要包含三大部分與二十個行動:
〈2020年行動計畫〉確定機關之初步行動,其對建立流程、建立能力、調整現有工作以更好地將資料作為戰略資產至關重要。未來之年度行動計畫將會在〈2020年行動計畫〉之基礎上進一步發展出針對聯邦資料管理之協調方案。
本文為「經濟部產業技術司科技專案成果」
大倫敦政府(Greater London Authority, GLA)在今(2016)年3月公布「城市資料策略」(City Data Strategy),以發展「城市資料市集」為核心的「數位倫敦」(Data for London) 計畫,希望與合作夥伴共同推展「城市資料市集」,以節省資金、培育創新、推動經濟成長,並迎接可能之挑戰。 「數位倫敦」將城市資料分為開放資料(Open Data)、民間企業資料(Private Data)、商業資料(Commercial Data)、感知資料(Sensory Data),及公眾來源資料(crowded-sourced data)等5個類型。此外,蒐集之資料類型及如何使用該等資料,亦為計畫的執行重點之一。 「數位倫敦」之實施計畫(Implementation Plan)分短、中、長期,以近期發布之短、中期的路徑圖而言,大倫敦政府計劃在2年內分 5個階段,從編制資料目錄,建立資料庫聯盟,利用雲端系統建置一能預測並開發、利用新資料來源之資料庫,並以「引用資料,而不複製資料」之原則,持續與公開來源社群及夥伴合作。 「城市資料市集」作為發展大倫敦基礎設施建設之一環,從資料蒐集、過濾檢測、資料庫平台管理、整合平台及服務,進而建立新商業模式,期將倫敦打造成世界首屈一指的智慧城市。
日本經濟產業省利用巨量資料(BIG DATA)及人工智慧(AI)開發及測試新的經濟指標日本經濟產業省利用網絡積累巨量資料(BIG DATA)及人工智慧(AI)技術,應用民營企業相關資訊,開發和測試新經濟指標,分別於2017年7月19日及2018年1月8日公開該指標。為達到及早準確掌握經濟動向,對巨量資料等新資料之利用期待越來越高,政府部門也將利用巨量資料及人工智慧技術等方法,針對統計技術進行改革,。 新開發之指標有:1.SNS×AI商業信心指數(SNS×AI景況感指数):乃是透過人工智慧抽取關於商業信心的網路文章,並進行情緒(正/負)評估計算指數,期待有效地估計以每日為頻率之商業信心。2.SNS×AI礦工業生產預測指數(SNS×AI鉱工業生産予測指数):利用人工智慧選取有關工作和景氣之網路相關文件,結合「開放數據」之統計等技術,並利用人工智慧「機械學習」之手法,來預測「工業生產指數」。3.銷售點資訊管理系統(POS,point-of-sale)家電量販店銷售趨勢指標(POS家電量販店動向指標):透過收集具有銷售點資訊管理系統(POS)的家用電子大型專賣店的銷售資料,期待可以掌握每一日之「銷售趨勢」。 新的指數與既存統計指數,如景氣動向指數、中小企業信心指數、工業生產指數、商業動態統計等,其調查週期、公布頻率等,既存指數每月調查公布,新指數則進步至每日調查或每週公布等,在計算及呈現頻率上較既有更為精細。日本政府並設立「Big Data-STATS」網站,以實驗性質公佈上述經濟指標,並廣泛收納民眾意見以提高新指標的準確性。
FCC同意基本型電子閱讀器可於一年期限內豁免於無障礙義務 合成資料(synthetic data)「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。 在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。 英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。 技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。