合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?no=57&tp=1&d=8532 (最後瀏覽日:2024/05/03)
引註此篇文章
你可能還會想看
國內版RoHS 將比照歐盟規定

  歐盟有毒物質禁用指令( RoHS )已自今年 7 月起上路,國際間陸續有其他國家跟進:目前為止,美國約有半數的州已通過相關法令,加州從明年起亦將開始實施;至於亞洲的日本已與歐盟同步實施、韓國將於明年 7 月上路;澳洲草案也已經出爐,至於實施日期則未定。   為與國際接軌,環保署也正積極推動國內版 RoHS ,目前法案名稱尚未確定,不過內容將會與國際接軌,除限制電子電機等產品,不得含有鉛、汞、鎘、六價鉻、聚溴聯苯和聚溴二苯醚等六種有毒化學物質或限制其比率外,檢驗標準亦將比照歐盟,採用事後市場管理機制,亦即先放行產品進口,並採事後抽測方式檢驗,因為採事前市場管理,將造成貿易障礙,實施檢驗亦有困難。至於罰責方面則仍須商榷,環保署表示目前我國要先合併「廢棄物清理法」與「資源回收再利用法」的法源,預定在年底前召開公聽會並送行政院審查,最快也要等明年立法院第一會期通過後才會實施。

美國參議院通過幹細胞研究加強法案,惟仍難逃被布希總統否決之命運

  美國參議院近日就是否開放聯邦經費挹注於胚胎幹細胞研究進行激辯,並於 17 日通過幹細胞研究加強法( Stem Cell Research Enhancement Act of 2005, HR 810) 及其他兩項亦涉及胚胎幹細胞研究的類似法案。其中最引人注目者為 HR 810 ,該法案允許以聯邦經費資助使用人工授精之剩餘胚或病患自願捐贈之胚胎,進行幹細胞研究。這些法案的通過顯示,美國參議院打算挑戰布希政府自 2001 年所立下禁止聯邦經費挹注於胚胎幹細胞研究的禁令。   其實早在去年五月,眾議院即以 238 票贊成、 194 票反對通過 HR 810 ,布希政府在眾議院通過 HR 810 後,隨即表示一旦本法在國會立法通過,將會動用否決權推翻此一法案。根據美國法律,法案唯有經參眾議院以三分之二以上多數通過,總統始不能否決之。日前參議院係以 63 票贊成、 37 票反對通過 HR 810 ,並未達三分之二多數通過,因此本法案未來恐難逃被布希總統否決的命運。白宮發言人業已表示,該法案強迫所有的美國納稅義務人出錢資助以故意破壞人類胚胎為基礎的研究行為,法案一旦送交總統,布希總統將會行使否決權,這將會是布希總統任內首度針對國會所通過的法案動用表決權。   儘管布希總統仍持一貫反對胚胎幹細胞研究的立場,不過,美國民眾卻有支持胚胎幹細胞研究的趨勢。一項最新民調顯示,每四名受訪者中,就有三名贊成將聯邦經費用於資助胚胎幹細胞的研究。隨著美國國會大選將於十一月中旬展開,預料胚胎幹細胞研究議題將會再度成為焦點。

歐盟執委會發起ERA vs CORONA行動計畫,加速研發創新合作對抗COVID-19

  歐盟執委會於2020年4月7日發起ERA vs CORONA行動計畫,透過歐洲研究區(European Research Area, ERA)全力支持歐洲科研合作、共享科學資訊,並給予歐洲研究團隊與企業充足的研發疫苗資金,用以對抗COVID-19。歐盟執委會已與各國達成共識,確認ERA vs CORONA行動計畫的10項優先行動: 協調各國研究與創新(Research and innovation, R&I)資金投入,專注研發新型冠狀病毒的疫苗與治療方法,加強創新合作模式以對抗疫情。 支持新型冠狀病毒患者的臨床管理,與歐盟大規模臨床實驗計畫。 將資金投入創新領域回應社會需求,關注疫情對社會經濟、醫療及資通訊技術應用、衛生系統及製造業的影響。 藉由Horizon 2020 增加對新創公司的研發財務支持;拓展歐洲創新委員會ePitching計畫(EIC ePitching),鼓勵公私夥伴共同尋求解決方案。 創造資金來源促進R&I行動,引導新創及中小企業申請國家及地方資金、私人基金會、投資歐洲計畫(Invest EU)等。 建立ERA Corona平台,提供研發資金相關的一站式服務,包括歐盟各國補助新型冠狀病毒R&I計畫的完整資訊。 設立新型冠狀病毒特設高階R&I工作小組,規劃歐盟中長期防疫措施。 加強研究基礎設施布建及跨國資料庫利用。 創建歐洲COVID-19研究資料共享平台 ,連接歐洲開放科學雲,允許快速共享研究資料及成果以加速研發、公平分享資訊。 舉辦泛歐黑客松(EU vs Virus)推動歐洲創新與社會交流。

美國產政研單位聯名向SEC請願,促請訂定企業應揭露其與氣候變遷有關的財務風險

  根據美國證券法規,上市公司、申請上市公司以及特定證券發行公司,應將其為符合美國聯邦、各州及地方環境法規所衍生,可能與公司之資本支出、營收與競爭地位有關之資料,向SEC提出並揭露予投資大眾;因為遵守相關環境法規而涉訟者,公司亦應揭露此等事實。除此之外,SEC規則亦要求,公司為符合環境法規所為之大規模資本支出,若可能對公司的清償能力產生重大影響,公司對於任何與之相關的已知發展趨勢、承諾的義務、事件或不確定性,亦應揭露之。   最近美國紐約州檢察長Andrew Cuomo向該州內五家能源公司發出傳票(subpoenas),要求這五家公司應各自分析其公司經營的氣候變遷風險,並將相關資訊揭露予投資大眾。此外,全美多個投資團體、十個州的財政官員以及環保團體亦聯名向美國證券交易委員會(Securities Exchange Commission, SEC)請願,促請SEC要求企業應該評估並揭露與氣候變遷有關的財務風險。請願者認為,氣候變遷相關資訊影響投資意願,亦為重要的公司資訊,故SEC應釐清,根據既有法規(即1934制定年的證券交易法)中的公司資訊揭露規定,公司亦應有揭露氣候變遷資訊之義務。   以上兩件事例的發展,隱含一個重要的跡象值得觀察,亦即未來美國SEC對於公司資訊揭露的管理,極可能涵蓋氣候變遷的風險資訊。雖然SEC目前尚未對請願事宜做出具體的表示,但有鑑於決策者已有越來越大的壓力必須正視全球氣候變遷問題,故SEC未來對於請願團體的回應及可能採取的措施,將代表公司應如何揭露氣候變遷風險資訊,始為適當。   此外,面對全球變遷所帶來的挑戰,美國許多州均積極提出或通過因應氣候變遷的法案,可預期企業經營者為遵循新一代的環境法規,未來將會有一波波的資金投入於法規遵循,目前企業經營者多將重心放在如何化挑戰為機會,然而公司在其中所為的投入,意味一定的財務風險,根據當前的發展,SEC極可能要求公司必須清楚地揭露此等氣候變遷相關資訊,值得企業經營者與投資人注意。雖然能源產業是氣候變遷風險最主要的揭露者,但氣候變遷風險實關乎所有的產業,目前已有許多保險公司也開始揭露其因為氣候變遷涉及的財務風險(如因颶風、水災、乾旱、火災或其他險惡的氣候現象所導致的財務損失)。

TOP