合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/01/22)
引註此篇文章
你可能還會想看
美國總統簽署通過2010年二十一世紀通訊和視訊無障礙法

  美國總統歐巴馬於2010年10月8日簽署通過2010年二十一世紀通訊與視訊無障礙法(Twenty-First Century Communications and Video Accessibility Act of 2010),將使美國約3600萬之聽、視障人士能無障礙的參與網路時代。該法案係增進身心障礙人士無障礙使用通訊傳播服務之保障,因應新興科技之發展,修訂既有法規的不足。由於新興科技的發展擴大身心障礙者使用科技的障礙與落差。同時,美國電信法放鬆管制的趨勢,將通訊服務區分為「電信服務」與「資訊服務」,使新興通訊服務因歸屬於「資訊服務」而不受管制。 在既有法規出現不足的情形下,美國國會於2010年8月通過該法,因應美國身心障礙人士使用新興通訊傳播工具與服務之障礙,修訂了許多內容: • 使具備接取網際網路能力之智慧手機,改進用戶界面使視障人士能易於使用。 • 透過口述影像之要求,以聲音描述媒體之非對白內容,如場景變化、表情、事件等,使視障人士,更充分地欣賞電視媒體內容。 要求節目指南和功能選單的設計,更易於視障人士使用。透過隱藏性字幕的要求,對媒體內容更多細節的描述,使聽障人士亦能充分瞭解電視節目內容。要求的控制接收或播放媒體之設備,應有易用之設計,如按鈕或專用圖示,使字幕或口述影像之功能能易於開啟或關閉。擴展進階通訊服務之定義,包含VOIP、及時訊息(如MSN)及視訊會議。並要求這些進階通訊服務能易於被聽、視障人士使用。   對低收入的且具有聽、視雙重障礙人士,提供高達 1000萬美元,補助通訊設備接取電話及網際網路,使這些人能夠更充分地參與社會。該法將能確保身心障礙人士能無障礙使用通訊工具、獲取資訊與視訊媒體內容,無論何種形式(文字、視訊、語音),也無論傳輸媒介(有線、無線、衛星、IP網路),建構無障礙之通訊傳播環境。

因應禁止「競業禁止條款」,企業得透過「資料存證」,證明營業秘密存在及擁有

  近年來,關於「競業禁止條款」之合法性及有效性等,一直是被廣泛討論的議題,在2023年1月5日,美國聯邦貿易委員會(Federal Trade Commission, FTC)發布禁止「競業禁止條款」之提案,並指出依調查結果顯示,其造成勞工薪資降低及壓抑流動性等負面影響,故企業未來可能須透過主張《統一營業秘密法》(Uniform Trade Secrets Act)或《防衛營業秘密法》(Defend Trade Secrets Act)等,以保護營業秘密。同時應值注意者為,有論者提出未來解決方案為企業應推動自動化營業秘密管理系統,而其中一個必要元素是應採取「資料存證」措施,以證明營業秘密存在及擁有。   所謂自動化營業秘密管理系統,即透過工具,對於營業秘密進行「識別」與「評估」,並應對於不具有經濟價值的資訊進行解密。惟為避免增加營業秘密外洩風險,故相關系統應僅留存後設資料。與此同時,為取得盜用營業秘密相關的勝訴裁判,除應留存及保護任何時點的後設資料外,更應採取能夠證明營業秘密存在及擁有之措施,如透過雜湊值或區塊鏈等技術進行「資料存證」,以確保能夠在訴訟上提供必要證據。   最後,近期司法院、法務部、臺灣高等檢察署、內政部警政署及法務部調查局共同規劃與建置「司法聯盟鏈」機制,藉由區塊鏈技術,並結合已通過經濟部智慧財產局審查核准之b-JADE證明標章,明定嚴謹之數位資料管理要求,以期強化數位證據同一性及建立簡便驗真程序。因此,未來企業若落實b-JADE證明標章所定之管理要求,將幫助營業秘密數位資料通過驗真程序。   本文同步刊登於TIPS網站(https://www.tips.org.tw)

共享經濟創新商業模式於歐盟各國發展所遭遇之公平競爭議題

  共享經濟(Sharing-economy)為近來很夯的議題,其概念係藉由網路平台分享自有資產、資源、時間及技能及其他有用的事物,透過資源分享能更有效利用或者獲得收入。共享經濟不僅能夠促進經濟成長、鼓勵創業,同時也促進資產有效再利用,許多創新服務成功案例,例如Uber、Lyft、Airbnb等因此產生,然而,這類型之創新商業模式推展至世界其他各國發展時,卻遭遇到法規範的差異,與各國政府監督與管理出發點的不同,對各國政府與創新商業模式皆成為未來的挑戰。   舉例來說,目前Uber公司在法國、西班牙和德國等國禁止其提供服務,由於德國政府認為Uber未事先依法律規定辦理司機與營業車輛登記,故禁止Uber於德國境內服務;而西班牙政府認為Uber公司未取得經營執照,亦禁止其於西班牙提供服務。然而Uber公司認為,上述國家對於公司的發展已產生限制競爭與不公平的對待,進而向歐盟執委會(European Commission)提出申訴。   依歐盟條約(The Treaty on the Functioning of the EU, TFEU)規定,歐盟會員國各該內國法之制定原則上不可抵觸歐盟競爭法(EU competition laws),是以,各該歐盟會員國必須遵守歐盟競爭法訂立至少符合歐盟競爭法的相關規範。因此,若認為歐盟會員國的規範與實務操作有悖於歐盟條約所制定之公平競爭規則時,可向歐盟執委會提出申訴,該委員會如發現確實有違背公平競爭規則時,可要求該歐盟會員國修訂其國家的監管制度。   對此,歐盟、各該會員國之監管部門、市場競爭當局試圖尋找解決問題的平衡點,並在適當的監管與促進創新與競爭的環境下,俾利共享經濟於各國的推動與發展。

英國政府公布物聯網設備安全設計報告,提出製造商應遵循之設計準則草案

  英國數位、文化、媒體暨體育部於2018年3月8日公布「安全設計(Secure by Design)」報告,此報告目的在於使IoT設備製造商於製程中即採取具有安全性之設計,以確保用戶之資訊安全。   此報告中包含了一份經英國國家網路安全中心(National Cyber Security Centre, NCSC)、製造商及零售商共同討論後,提出之可供製造商遵循之行為準則(Code of Practice)草案。   此行為準則中指出,除設備製造商之外,其他包含IoT服務提供者、行動電話軟體開發者與零售商等也是重要的利益相關人。   其中提出了13項行為準則:1. 不應設定預設密碼(default password);2. 應實施漏洞揭露政策;3. 持續更新軟體;4. 確保機密與具有安全敏感性的資訊受到保護;5. 確保通訊之安全;6. 最小化可能受到攻擊的區域;7. 確保軟體的可信性;8. 確保個資受到妥善保障;9. 確保系統對於停電事故具有可回復性;10. 監督自動傳輸之數據;11. 使用戶以簡易的方式刪除個人資訊;12. 使設備可被容易的安裝與維護;13. 應驗證輸入之數據。   此草案將接受公眾意見,並於未來進一步檢視是否應立相關法律。

TOP