合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=67&tp=5 (最後瀏覽日:2026/04/02)
引註此篇文章
你可能還會想看
美國聯邦最高法院受理美國發明法複審程序違憲爭議案

  美國聯邦最高法院於2017年6月13日受理Oil States Energy Servs., LLC v Greene’s Energy Group, LLC案之上訴,並將針對美國發明法的專利複審程序是否有違憲之虞的爭點進行處理。事實上,自從2016年美國聯邦最高法院的Cuozzo Speed案認定專利審判暨上訴委員會(Patent Trial and Appeal Board, PTAB)之專利複審程序可適用最寬廣合理解釋原則(broadest reasonable interpretation standard,BRI)後,針對美國專利法第314條規定美國專利複審程序之最終裁決結果不可上訴條款,就已經突顯出可能違憲之問題。加以來自各界的法庭之友於MCM訴惠普專利侵權案中提交意見書,以促使法院審理美國發明法的專利複審程序究竟有無違反美國憲法第3條及修正法案第7條,而有法律條文賦予行政機關司法權力是否違憲之議題,也再一次突顯專利複審程序可能存在的違憲問題。   本案件聯邦最高法院將對PTAB的權限以及專利複審程序進行重新檢視。倘若專利複審程序中PTAB最終裁決結果不可上訴條款造成違憲,可能會影響到美國專利制度之運作,不僅是正在申請或是已獲證的專利都會受到影響。而曾經被PTAB裁決無效的專利,也可能產生尋求司法救濟的可能。

中國電子簽名法將於四月一日正式生效

去年八月甫通過的中國電子簽名法在今年四月一日正式生效,而中國首家對外提供電子簽章服務的憑證機構(電子印章中心)在三月三十日成立。    中國電子簽名法對於電子簽名的定義指出,電子簽名是指數據電文中以電子形式所含、所附用於識別簽名人身分並表明簽名人認可其中內容的數據。而電子簽名的適用範圍,除了在涉及婚姻、收養、繼承等人身關係、土地房屋等不動產權益轉讓、停止供水、供熱、供氣、供電等公用事業服務或法律、行政法規規定不適用電子文書的其他情形外,均可使用電子簽名。

國際海事組織公布自駕船規則制定期程表

  國際海事組織(International Maritime Organization, IMO)於2018年6月5日第99次海上安全委員會(MSC 99)上,根據日本等國提案,開始進行監理範圍之界定與檢討等相關工作(Regulatory Scoping Exercise, RSE)。於MSC 99之會議上,IMO已暫定自駕船之定義與自動化等級,並於2018年12月3日至12月7日於英國倫敦召開之MSC 100會議上進一步確定RSE框架,公布自駕船規則之制定期程表,具體措施將分為兩階段實行。第一階段預計在2019年9月前釐清可能妨礙自駕船航行,或者有修正和確認必要之IMO規定。第二階段則規劃在2020年5月召開之MSC 102前,檢討為實現自駕船所需修正及制定之IMO規則。此外,MSC 100亦批准2018年5月IMO人為因素、訓練和值班小組委員會(Sub-Committee on Human element, Training and Watchkeeping, HTW)提出之船員「疲勞指引」(Guidelines on Fatigue)修正案,並預計在2019年6月召開之MSC101上,進一步針對燃料油品質所引發之安全問題進行討論。

有效開放:西進40%上限有條件鬆綁

  積極管理機制出爐後,行政院正在研議規劃有效開放政策,包括投資大陸 40 %上限鬆綁事宜,但尚未形成決策時間表。 40 %上限究竟如何鬆綁,政府高層高度關切,據悉,政府已委託財經智庫提供一份兩岸經貿對策建議白皮書,擬作為政府兩岸政策建議及六月召開台灣經濟永續成長會議決策參考,智庫建議應視個別企業、個別產業個案檢視放寬,對大陸投資利益必須大於不良負作用。   財經智庫建議以七大配套指標決定 40 %上限的鬆綁,七大指標包括:一、產業無法在台生產,也無法擴大中國以外的市場生產,應予放寬;二、在中國市場屬於領先地位,且可繼續擴大市場;三、在中國獲利可匯回台灣回饋股東;四、企業領先全球,必須對中國擴大投資以繼續取得全球領先地位。五、該企業在台有很大營運及研發中心,即以台灣為根;六、該企業有重大技術及品牌成就,可去大陸市場攻城掠地;七、外資持股比例高且公司治理的守法紀錄良好者。   一旦 40 %可有條件鬆綁,相關官員表示,將考慮對特定回台上市台商研擬放寬其股市上市條件,籌資再投資大陸的上限也可視為外資放寬。政府希望企業可以去大陸攻城掠地,但不希望把大陸當成唯一生產基地,企業把生產及上中下游關聯性產業一起帶走,甚至移出研發,例如筆記型電腦,對台灣造成失業等諸多不利負作用,因此台灣必須保留生產基地,生產高附加價值產品。

TOP