合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/01/10)
引註此篇文章
你可能還會想看
荷蘭智庫提出發展永續性生質燃料的政策建議

  面對解決氣候變遷及尋找替代石化能源的全球性問題,生質材料(biomass)的開發與利用深受期待,然而,生質材料的生產與利用是否適當,乃是複雜的決策工具,一國政府在推動與能源、溫室氣體減量有關之政策工具時,必須意識到這些政策工具背後所蘊藏之其他風險。   在面對生質材料的風險,荷蘭政府可謂最先有此問題意識,並嘗試在提出政策工具時盡可能作妥適規劃的先進國家之一。荷蘭是歐洲最大的棕櫚油進口國,以棕櫚油製成的產品在荷蘭超市到處可見,部分棕櫚油也用於能源供應,荷蘭甚至有業者打算興建專門使用棕櫚油運轉的電力供應站(power stations)。   為確保利用棕櫚油及其他生質材料所開發新能源符合環境永續經營的目的,荷蘭政府已研議在相關的政策措施中,導入生質材料應符合永續性的標準;而為落實此一政策構想,荷蘭政府委託智庫Cramer Commission(該委員會以其主席Jacqueline Cramer的姓為名,Cramer女士更在2007年2月成為荷蘭環境部長)進行相關研究。Cramer Commission在今年4月向荷蘭政府正式提出「檢測生質材料是否符合永續性之架構報告」(Testing Framework Report for Sustainable Biomass),報告中提出發展生質燃料可能涉及的六大永續性議題分別:溫室氣體排放、與食物及其他運用領域之衝突、生物多樣性、環境、經濟繁榮、社會福祉;報告除針對此六大議題分別提出永續性思考外,並建議透過追蹤系統(track-and-trace system)對作物從種植到成為電廠生產生質燃料的整個過程予以監控,並對生質燃料公布嚴格的進口標準,作為生質燃料的作物,其栽種方式必須經認證是不破壞環境,或所釋出的溫室氣體比節省得多,始得進口。Cramer Commission並建議荷蘭政府設定在2020年前進口永續來源的生質材料,並建議在此之前應有過渡措施。   關於生質燃料的環境風險問題,目前在歐盟已開始有問題意識,歐盟也嘗試思考是否可能藉由綠色認證制度之建立,確保非以永續方式製造的生質燃料,不得進入歐盟市場;其他打算跟進的歐洲國家,則正在觀察荷蘭的作法。

英國電信公司批發電話訂價遭OFCOM認定涉嫌價格擠壓

  英國電信管理局(OFCOM)經過兩年的調查,於2010年12月21日發佈一項反對聲明(Statement of Objections),認為英國電信公司(BT)自2008年7月至2009年4月間的批發終端語音電話(wholesale end-to-end voice calls)產品訂價,可能涉嫌價格擠壓(margin squeeze)之濫用獨占地位行為,違反英國1998年競爭法第二章與歐洲聯盟運作條約第102條規定。   本案係由THUS與Gamma Telecom兩家公司向OFCOM提出檢舉;該兩公司均係由BT提供其批發電話產品,再轉提供服務予家用或商業零售客戶。檢舉人指稱,由於BT的訂價低於成本,並意圖消滅或削弱市場競爭,將迫使部份提供載具預選(Carrier Pre-Selection)服務的業者退出市場。   在OFCOM作成最終決定前,BT仍可在十二週內以書面或口頭表示意見;BT的發言人則反駁了此項指控,並表示將充分參與OFCOM的調查。然而,如BT經確認違反競爭法,將可能遭OFCOM處以批發電話業務年收入百分之十的罰款。據分析師表示,罰款金額可能達數千萬英鎊。

英國猶疑應否開放人獸混合細胞之胚胎幹細胞研究

  英國之胚胎幹細胞研究活動,係根據「1990年人類受精與胚胎學法」(Human Fertilisation and Embryology Act 1990,HF&E Act)和「2001年人類受精與胚胎學規則」(Human Fertilisation and Embryology (Research Purposes) Regulations 2001,Research Purposes Regulations)之規定,授權由「人類受精與胚胎學管理局」(Human Fertilisation and Embryology Authority,HFEA)依法管理。   新堡大學東北英格蘭幹細胞中心(North East England Stem Cell Institute)Lyle Armstrong博士,在去年底向HFEA申請一項涉及混合人類與動物細胞製造胚胎幹細胞之研究許可;其計劃利用細胞核轉置技術,將牛的卵子細胞核取出,植入人類體細胞核,並刺激其分裂形成胚囊或早期複製胚胎,用以研究培養病患所需身體組織之技術。過去HFEA從未曾核准過此類研究,僅核准過2件利用細胞核轉置技術和單性活化卵母細胞製造胚胎幹細胞株作為醫學研究之申請。此研究申請訊息一流出,即引起保守團體嘩然及指責,要求英國政府應盡速立法,禁止製造人獸混合細胞之實驗活動。面對各界抗議聲浪,HFEA表示,會暫緩此申請案。   事實上,去年12月英國健康部提出了一篇報告-「人工生殖及胚胎學法之檢討」(Review of the Human Fertilisation and Embryology Act),建議國會應儘速立法規範人類動物細胞混合研究。而英國政府與人民究竟能否接受混合人類動物遺傳細胞研究之合法性、合道德性,則為未來立法動向之重要指標。

美國國會議員(Patrick Leahy)提案(PROTECT IP Act)封鎖違反智慧財產權的非法網站

  美國國會議員日前提案,擬立法對抗違反智慧財產權的非法網站。該法案(Preventing Real Online Threats to Economic Creativity and Theft of Intellectual Property Act, 或稱PROTECT IP Act)主要係針對侵害智慧財產權的非法網站,擬賦予美國司法部或著作權人,可向法院聲請於網路上封鎖該網站,或者不讓其在搜尋引擎上顯示,亦即讓該非法網站從網路徹底消失。同時,經營網路金流的業者以及網路廣告商,也不得再提供服務給予這些違反智慧財產權或者是販售贗品的非法網站。   該法案明確的規定,舉凡與非法網站相關的資料、數據、索引、超連結等,皆需從網際網路上移除。亦即,美國人民在網路上將不會再看到這些非法網站的任何資訊,若該法案通過,將連帶影響到Google、Yahoo等搜尋引擎的實務運作。有反對者指出,此舉將使得美國政府可以決定美國人民在網路上應該看什麼內容,因此戲稱該法案為網路審查法案(Internet censorship bill)。   網路巨擘Google執行長(Eric Schmidt)也於今年5月中聲明反對該提案,認為該提案已經嚴重侵害言論自由。執行長Eric Schmidt表示,美國政府試圖以立法手段解決複雜的網路侵權爭議,以立法封鎖、移除非法網站所有資料,跟中國限制網路言論自由的方式如出一轍。   目前該法案尚未通過,已出現不少反對聲浪,財產權以及言論自由同樣是憲法上保障的權利,究竟應如何在保障著作財產權人與言論自由間取得平衡,該法案未來發展值得密切注意。

TOP