合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/03/07)
引註此篇文章
你可能還會想看
幹細胞研究 麻州亮綠燈

  美國麻薩諸賽州州長 Mitt Rom-ney 在五月二十七日否決一項允許在麻州擴大胚胎幹細胞試驗研究法案。州長支持使用成年人的幹細胞或從治療不孕症診所剩餘冷凍胚胎提取細胞的研究,但他呼籲州議員禁止複製,因為提取幹細胞會摧毀胚胎。他說,這相當於創造人類生命只是為了摧毀它,在道德上不具有合理性。此外,他還呼籲州議員在法案中增設一項條款,規定懷孕那一刻即為生命開始,禁止為了其他研究製造胚胎,並限制給捐獻卵子婦女的補償,但州議會拒絕他了的所有這些要求。該州參眾兩會在同月三十一日以壓倒性的票數,推翻州長先前在二十七日所為之否決,並使該法案立即生效。   根據舊州法,若麻州科學家想進行胚胎幹細胞研究,必須獲得地區檢察官批准。新法實施後,科學家不需等待地區檢察官同意後才能進行研究,但州衛生廳將有權管制過程。除此之外,這項新法和聯邦法一樣,禁止複製嬰兒。   美國各州對幹細胞研究的態度迥異,甚至可以說處於分裂狀態。有七個州禁止任何複製研究,十一個州禁止幹細胞研究。但是,加州在二○○四年率先透過法案支持胚胎幹細胞研究,還計劃在十年內從州預算中撥款三十億美元資助這項研究。麻州緊隨其後。紐約、康涅狄格、賓州等也準備放寬對幹細胞研究的限制。 支持胚胎幹細胞研究者紛紛希望,麻州能成為治療脊椎受傷和糖尿病、柏金森氏症等疾病的科學先進研究中心。

英國電信公司批發電話訂價遭OFCOM認定涉嫌價格擠壓

  英國電信管理局(OFCOM)經過兩年的調查,於2010年12月21日發佈一項反對聲明(Statement of Objections),認為英國電信公司(BT)自2008年7月至2009年4月間的批發終端語音電話(wholesale end-to-end voice calls)產品訂價,可能涉嫌價格擠壓(margin squeeze)之濫用獨占地位行為,違反英國1998年競爭法第二章與歐洲聯盟運作條約第102條規定。   本案係由THUS與Gamma Telecom兩家公司向OFCOM提出檢舉;該兩公司均係由BT提供其批發電話產品,再轉提供服務予家用或商業零售客戶。檢舉人指稱,由於BT的訂價低於成本,並意圖消滅或削弱市場競爭,將迫使部份提供載具預選(Carrier Pre-Selection)服務的業者退出市場。   在OFCOM作成最終決定前,BT仍可在十二週內以書面或口頭表示意見;BT的發言人則反駁了此項指控,並表示將充分參與OFCOM的調查。然而,如BT經確認違反競爭法,將可能遭OFCOM處以批發電話業務年收入百分之十的罰款。據分析師表示,罰款金額可能達數千萬英鎊。

歐盟針對數位化單一市場著作權指令法案達成改革性修正

  2019年2月13日,歐盟針對數位化單一市場著作權指令(Directive on Copyright in the Digital Single Market,2016/0280(COD))(下稱著作權指令)之爭議條款第11條及第13條進行討論修正,並達成共識。   從2016年9月,歐盟委員會提出修改新版著作權法,一直到去年9月12日,通過「著作權指令」法案,兩年多的改革過程始終產生多方爭議;其中,最具爭議性的有兩大條款:第11條「連結稅」(link tax),是要求網路平台業者在使用或摘錄其著作內容時,需向上傳的出版、新聞業者支付授權費用,對於Google、YouTube等網路巨擘易造成傳播新聞資訊的阻礙;而第13條「上傳過濾器」(upload filter),則是強調網路平台業者需負監督責任,防止上傳者侵權行為,現今流行的模仿搞笑影片、歌曲混音、翻唱影片等涉及部分著作權問題者,都有可能受到法規影響而大量減少。   近二十年以來,網路平台業者大多可以避免侵權責任,只要他們不知道上傳的內容侵權,並在發現侵權後立刻將內容移除。此次,著作權指令將加強規範於網路平台業者的行為,要求平台業者建立有效過濾機制,適當監督新聞傳播及熱門資訊之分享,並保護出版業、新聞業、文創產業等的著作權,且未來允許網路平台業者須支付授權費給著作權人。   此次修正的著作權指令法案,歐洲議會將預計於3月或4月進行投票,確認修法是否通過。 「本文同步刊登於TIPS網站(https://www.tips.org.tw )」

何謂「TLO」?

  「TLO」係「技術移轉機關(Technology Licensing Organization)」之簡稱,專指大學研究成果申請專利後,將該等技術移轉給企業等之機關,如同產學間的仲介角色。   日本於平成10年(西元1998年)5月6日通過「促進大學等實施技術研發成果移轉給民間企業法(簡稱大學等技術移轉促進法或TLO法)」,目的在於將大學之研究成果技轉給民間企業,促進研究成果之實用化。   在承認TLO存在之同時,日本做了以下法令之配套:依據TLO法第8條,實施特定大學技術移轉之事業期間,第1年到第10年之授權金及專利申請審查手續費用減免1/2、產業競爭力強化法第19規定,若國家委託之研發成果,歸屬於受託者時,該研發成果之移轉授權不須經國家之承認、同時大學法人法第22條允許國立大學得為出資。同時TLO法亦承認若中小企業透過TLO取得研究成果之授權時,得降低中小企業投資育成株式会社支出資要件。

TOP