合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/02/26)
引註此篇文章
你可能還會想看
何謂「IoT推進聯盟( IoT推進コンソーシアム)」?

  日本政府為了對應智慧聯網(Internet of Things, IoT)、巨量資料(Big Data)以及人工智慧(AI)時代之到來,經濟產業省及總務省於2015年10月23日正式成立了產官學研聯合之「IoT推進聯盟( IoT推進コンソーシアム)」。該聯盟旨在超越企業及其產業類別的既有框架,以民間作為主導,目的為推動IoT之相關技術研發,以及促進新創事業成立之推進組織,未來並將針對IoT相關政策以對政府提出建言。在該聯盟下有三個工作小組,包括技術開發、實證、標準化的「智慧IoT推進論壇(スマートIoT推進フォーラム)」;推動先進實證事業,規制改革之「IoT推進實驗室(IoT推進ラボ)」,以及針對資訊安全、隱私保護的專門工作小組。   我國自2011年行政院首度召開「智慧聯網產業推動策略會議」以來,積極推動發展台灣成為全球智慧聯網創新中心,以及成為亞洲智慧聯網解決方案領先國;而目前我國有「台灣物聯網聯盟(TIOTA)」、「中華物聯網聯盟」等民間推進組織,旨皆為結合產官學研各界資源,促進產業與政府、國際間之合作。

美國參議員提案修改股票選擇權(stock option)租稅處理優惠

  美國參議員Carl Levin最近提出一項名為「終止公司股票選擇權租稅優惠法」(Ending Corporate Tax Favors for Stock Options Act, S. 2116,以下簡稱:股票選擇權租稅優惠終止法)的草案,主要目的是希望改變公司對於股票選擇權費用化的租稅處理(tax treatment of corporate stock option deductions)。   就租稅意義而言,公司發給員工(包括高階經理人及一般員工)的股票選擇權為薪資的一種,而根據美國內地稅法規定,目前公司在申報股票選擇權的薪資支出(compensation expense)減項時,可以申報的費用比公司帳簿上所登載的更高。由於此一稅法上獨厚股票選擇權的處理,使得近年來許多美國企業支付給主要高階經理人的薪資,有一大部分是股票選擇權,此現象在科技產業亦甚為顯著,其結果造成公司高階經理人與一般員工的薪資差距越益擴大。   「股票選擇權租稅優惠終止法」要求公司於薪資支出項下申報的股票選擇權費用,必須與公司帳簿所記載的數目一致,同時,股票選擇權也應與其他類別的公司薪資費用一樣,同樣受到1百萬美元的費用上限之申報限制,至於股票選擇權申報費用的時點,則不須要等到選擇權行使(exercise)的年度。

美國陪審團裁定Rambus未違反反托拉斯法及其行為未構成欺詐

  美國聯邦法院陪審團(San Jose, California federal jury) 於2008年3月26日裁定Rambus之記憶體晶片專利未違反反托拉斯法 (anti-trust)及於制定晶片業重要標準時未非法欺騙JEDEC(Joint Electron Device Engineering Council)成員。   記憶體製造商Hynix Semiconductor, Micron Technology 及台灣南亞科技公司指控Rambus 的專利違反了反托拉斯法,企圖透過其專利壟斷六個技術市場。前三家公司並認為依法專利不得涵蓋產業組織JEDEC的設計規格,指控Rambus 的專利涵蓋關於DRAM介面技術的JEDEC行業標準中的內容。 此三家公司另指控Rambus於產業標準制定過程中蓄意扭轉關鍵JEDEC標準的制定,構成欺詐之行為。   但陪審團於3月26日的審判中否決原告的控訴,認為原告未能提出足夠證據以證明被告之違反反托拉斯法與欺詐行為。   Rambus 將可望藉此判決獲取最少美金1.344億元以上的權利金 (Rambus於2006年指控Hynix 侵犯其擁有的專利一案獲賠美金1.344億元)。Rambus 另控訴Micron Technology與三星(Samsung Electronics Co.)侵害其記憶體專利權。於獲得勝訴後,Rambus 表示其不排除尋求禁止令禁止Hynix 繼續製造侵害其專利的產品。   Micro Technology 則表示它堅決不同意陪審團判決,其法律事務副總裁Rod Lewis表示:Micro Technology認為,Rambus公司從事了一系列欺騙、銷毀證據、虛假證詞和其他不正當活動,企圖誤導和提取不公正的專利授權費用。因此,Micro Technology打算對判決結果進行上訴。另外,Micro Technology也認為,Rambus的專利權是無效的,已要求美國法院駁回Rambus向Micro Technology提出的專利索賠。

Rambus再興訟 南亞科、華亞挨告

  美國記憶體設計司Rambus1月25日向美國北加州地方法院提出侵權告訴,指控Hynix、南亞科技、華亞科技、英飛凌等四家DRAM廠,涉嫌侵犯Rambus的DDR2記憶體、GDDR2及GDDR3繪圖卡用記憶體等共18項專利。南亞科副總經理白培霖表示,還不了解Rambus實際的指控內容,一切仍在了解中。   Rambus三年前推出RDRAM並獲得英特爾支持成為次世代主流產品,但因當時DRAM廠基於成本考量,決定支持DDR規格,所以Rambus後來不得不被迫退出標準型DRAM市場。然因Rambus擁有多項記憶體專利,目前主要產品獲得新力PS遊戲機採用,所以大部份營收來源均來自於權利金收入,去年Rambus營收約1億4500萬美元,其中的1億2000萬美元就是權利金收入。   由於Rambus前年就宣佈研發出DDR2產品,隨著今年英特爾力推新款支援DDR2晶片組,全球DRAM廠均投入DDR2生產,因此Rambus再度興訟,控告Hynix、南亞科技、華亞科技、英飛凌等四家DRAM廠,侵犯其 DDR2及GDDR2、GDDR3等記憶體共18項專利。   對於被Rambus控告一事,南亞科技及華亞科技提出說明。白培霖說,南亞科及Rambus一直就二家製程技術洽談相互授權事宜,內容包括DDR2及繪圖卡用記憶體GDDR3等,但目前為止雙方還沒有達成相互授權協議,自然也沒有權利金支付問題,由於南亞科目前還沒收到起訴書,不知道Rambus提出的控訴內容為何,因此一切有待再進一步了解後再行說明。除了此次的Rambus控告南亞科侵權,去年日本半導體大廠瑞薩科技(Renesas)也三度對南亞科技提出侵權控告,瑞薩除了指出南亞科技侵犯其記憶體製程、設計、封裝等專利權外,去年十月底還向東京地方法院提出申請,將對南亞科技日本子公司進口、銷售DRAM行為進行假處份(Preliminary Injunction)。   對於國際大廠不斷針對南亞科提出侵權告訴,南亞科技表示,與瑞薩在日本、美國的專利權官司,至今還在上訴審理階段,南亞科已經提出資料證明,至於Rambus此次提出的侵權告訴,現在還在了解中,但南亞科的立場,會尊重每家半導體廠的專利權,不會有任何侵權的行為。

TOP