合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/20)
引註此篇文章
你可能還會想看
新加坡智慧財產局研究顯示,智慧財產對於企業經營獲利的重要性

新加坡智慧財產局(Intellectual Property Office of Singapore, IPOS)2023年5月發布了一份名為《品牌、專利與企業績效表現的研究報告》(Brands, patents and company performance study),分別針對全球前100大上市公司及新加坡前100大上市公司進行分析,說明智慧財產等無形資產對於企業發展的重要性。 首先,IPOS在報告中對全球前100大上市公司進行分析,若該上市公司同時名列「全球500大最有價值品牌」(英國知名品牌諮詢機構Brand Finance每年發布)及/或「全球專利前250強」(美國知名專利研究公司IFI CLAIMS Patent Services每年發布),報告中將這類上市公司定義為持有最有價值品牌或最強專利組合的企業。這類企業與全球前100大上市公司中的其他企業相比,平均收入(revenue)是其他企業的2.2倍、淨利(net profit)是其他企業的1.9倍、市值(market capitalisation)是其他企業的2.3倍。 其次,本報告以新加坡前100大上市公司為分析對象,其中持有最有價值品牌(同時名列「新加坡100大最有價值品牌」)及/或最強專利組合(根據PatSnap專利資料庫的檢索資料定義)的上市公司,與新加坡前100大上市公司中的其他企業相比,平均收入是其他企業的2.4倍、淨利是其他企業的1.8倍、市值是其他企業的2.7倍。 由新加坡發布的報告可知,品牌或專利等無形資產對於企業維持競爭優勢的重要性,企業應將智慧財產布局與管理列為公司治理的重點,持續確保企業無形資產的價值(譬如企業若未持續落實商標布局與管理,將會削弱品牌價值),以強化企業的競爭力。 本文同步刊登於TIPS網站(https://www.tips.org.tw)

美國OMB發布M-26-04備忘錄,確立聯邦採購之「無偏見原則」與透明度義務

美國白宮管理與預算辦公室(Office of Management and Budget,以下簡稱OMB)在2025年12月11日發布M-26-04備忘錄(以下簡稱本指引),目標是落實第14319號行政命令「防止聯邦政府中的覺醒AI」(Preventing Woke AI in the Federal Government)。本指引闡述「追求真相」(Truth-seeking)、「意識型態中立」(Ideological Neutrality)兩大「無偏見AI原則」(Unbiased AI Principles),並強制要求聯邦機構在採購大型語言模型(LLM)時,必須將此二原則納入合約條款。 為確保符合規定,本指引要求聯邦機構在進行採購時,應避免強制供應商揭露過於敏感的技術資料(如模型權重),而是採取以下兩層級的資訊揭露架構: 1. 基本透明度要求(Minimum Threshold for LLM Transparency) 各機構於招標階段,應要求供應商提供以下資訊: (1) 可接受的使用政策:界定產品適當與不適當用途的文件。 (2) 模型、系統和/或資料的摘要卡(Model, System, and/or Data Cards):包含訓練摘要、風險緩解措施及基準測試評分。 (3) 終端用戶資源與意見回饋機制:包含用戶教程及針對違反無偏見原則產出的回報管道。 2. 強化透明度門檻(Threshold for Enhanced LLM Transparency) 若機構擬將模型整合至其他軟體或服務中,則需獲取更深入的開發與運作資訊,例如: 1. 預訓練和後訓練(Pre-Training and Post-Training):如影響產出事實性(factuality)的活動、系統提示詞(System Prompts)、以及內容審查過濾器的具體運作。 2. 模型評估:針對政治議題的偏見測試結果與方法論。 3. 模型中嵌入的企業控制(Enterprise-Level Controls): 如可客製化的系統指令或來源引用功能。 4. 第三方對模型的修改:非原廠開發者所施加的額外控制層。 本指引對聯邦行政機構具有行政拘束力。機構必須於2026年3月11日前更新採購政策,並將上述要求納入新舊合約中。值得注意的是,本指引引入了「實質性要求」(Materiality Requirement),即若供應商拒絕針對違反無偏見原則的產出採取糾正措施,將構成合約違約之重要事由,機構得據此終止合約。 觀察美國OMB此次發布的內容,係透過將「意識形態中立」轉化為具體的採購合規要件,OMB利用聯邦政府龐大的購買力,在採購合約中確立供應商的「透明度義務」,OMB指引不僅建立了明確的法遵標竿,更可能發揮示範效應,將政府端的無偏見規範逐步推廣至私營部門,轉化為產業的最佳實踐標準。

法國國民議會通過反仇恨言論立法提案

  法國國民議會(National Assembly)於2019年7月9日通過反仇恨言論立法提案,希望效仿德國社群媒體管理法(NetzDG),課予網路平台業者積極管理平台上仇恨言論(hate speech online)之責任。該提案希望透過立法要求大型網路平台及搜尋引擎,如Facebook及YouTube等,必須設置用戶檢舉管道,並於24小時內刪除以種族、宗教、性別、性取向或身心障礙為由之煽動仇恨或歧視性侮辱言論,否則將面臨高達全球營業額4%之罰款。   在主管機關方面,規劃由法國廣電主管機關「最高視聽委員會」(High Audiovisual Council, CSA)進行監管,網路平台業者必須向其提交仇恨言論之處理報告與相關數據。同時,平台業者應加強與法國司法系統的合作,取消違法用戶的匿名權利並提供相關證據資料,以利司法追訴。   2019年3月15日紐西蘭清真寺槍擊案之網路直播事件,讓各國警惕勿讓網路平台成為傳遞仇恨言論的工具。發起立法的法國議員Laetitia Avia表示,對抗網絡仇恨言論是場艱巨且長期的戰鬥,希望透過立法讓各方負起應有的責任,讓仇恨言論無所遁形,但反對者認為平台業者為了避免裁罰的風險,可能會對內容進行過度審查,相關自動化過濾技術也可能對言論自由產生不利影響。本立法提案仍待法國參議院完成審議。

美國參議院通過幹細胞研究加強法案,惟仍難逃被布希總統否決之命運

  美國參議院近日就是否開放聯邦經費挹注於胚胎幹細胞研究進行激辯,並於 17 日通過幹細胞研究加強法( Stem Cell Research Enhancement Act of 2005, HR 810) 及其他兩項亦涉及胚胎幹細胞研究的類似法案。其中最引人注目者為 HR 810 ,該法案允許以聯邦經費資助使用人工授精之剩餘胚或病患自願捐贈之胚胎,進行幹細胞研究。這些法案的通過顯示,美國參議院打算挑戰布希政府自 2001 年所立下禁止聯邦經費挹注於胚胎幹細胞研究的禁令。   其實早在去年五月,眾議院即以 238 票贊成、 194 票反對通過 HR 810 ,布希政府在眾議院通過 HR 810 後,隨即表示一旦本法在國會立法通過,將會動用否決權推翻此一法案。根據美國法律,法案唯有經參眾議院以三分之二以上多數通過,總統始不能否決之。日前參議院係以 63 票贊成、 37 票反對通過 HR 810 ,並未達三分之二多數通過,因此本法案未來恐難逃被布希總統否決的命運。白宮發言人業已表示,該法案強迫所有的美國納稅義務人出錢資助以故意破壞人類胚胎為基礎的研究行為,法案一旦送交總統,布希總統將會行使否決權,這將會是布希總統任內首度針對國會所通過的法案動用表決權。   儘管布希總統仍持一貫反對胚胎幹細胞研究的立場,不過,美國民眾卻有支持胚胎幹細胞研究的趨勢。一項最新民調顯示,每四名受訪者中,就有三名贊成將聯邦經費用於資助胚胎幹細胞的研究。隨著美國國會大選將於十一月中旬展開,預料胚胎幹細胞研究議題將會再度成為焦點。

TOP