合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2026/02/21)
引註此篇文章
你可能還會想看
LPL與華映在美侵權訴訟–加州法院駁回部份主張

  韓國樂金飛利浦(LPL)在美國加州控告華映(CPT)專利侵害案,自2002年8月起,至今已纏訟五年之久。   LPL控告CPT侵害其4件Side-mount專利(US6,002,457、US5,926,237、US6,373,537、US6,020,942),與2件Process專利(US4,624,737、US5, 825,449)。華映表示,前4件被加州法院以欠缺依據駁回。對此判決,華映表示欣慰。   LPL與華映之間的專利侵權訴訟爭議不休。華映強調,其在尊重智慧財產權的理念下蒐集證據進行因應,加州法院雖以LPL所提Side Mount訴訟欠缺依據(Lack of Standing)下令駁回LPL訴訟,但就另二件Process專利部份,目前法院對於雙方所提交之post trial motion作出部份同意及部份駁回的決定(Order),但法院尚未做出正式判決。   彭博社報導已傳出,美國洛杉磯聯邦法院網站已公佈裁決文,並同意LPL對華映加重侵權賠償的請求,以及持續侵權與判決前和判決後之利益與法律費用賠償。但並未透露加重賠償之確切金額。就此,華映發表聲明指出,對法官准許LPL部分訴求的初步決定,感到遺憾。華映表示其已掌握證據,待收到法院正式判決後將積極因應,且不排除上訴。

歐洲法院裁定銷售二手電子書侵害著作權

  Tom Kabinet為荷蘭之公司,其從個人及零售商處購得電子書後,再於網路轉售,遭為保護荷蘭出版商利益而成立之Nederlands Uitgeversverbond(NUV)及Groep Algemene Uitgevers(GAU)二協會提起侵害著作權訴訟。   Tom Kabinet公司主張,當書籍以有形體的形式出售時,該作品之著作權業已耗盡(exhausted),換言之,購買者可自由出售,而不會侵害作者或出版者的智慧財產權,此原則亦應適用於數位重製(digital copies)。NUV及GAU則認為Tom Kabinet公司轉售電子書的行為,構成著作權指令(Directive 2001/29/EC)所指在未經授權的情形下,向大眾傳播受著作權保護的標的。   歐洲法院近日針對雙方的爭議做出了裁決,法院援引世界智慧財產權組織(World Intellectual Property Organization)的著作權條約(Copyright Treaty),認為著作權的耗盡原則僅適用在著作權指令第4條的散布權(Distribution right),且是散布實體物,例如有形的書籍。而著作權指令第3條所指「向大眾公開(作者的)作品權利」(Right of communication to the public of works),係賦予作者有授權向大眾公開其作品的專屬權,此權利無耗盡的問題。本案所爭執向大眾轉售經下載且得永久使用的電子書之行為,並非散布權,而是向大眾傳播的概念,即符合著作權指令第3條所規範之範疇,因此,Tom Kabinet公司在轉售電子書前,須先取得作者的同意。   針對歐盟法院此一裁定,GAU發表聲明表示,法院的決定讓電子書的著作權議題有了結果,且此決定亦會影響音樂和電影產業,讓音樂和電影的下載拷貝版本同樣也無法再轉售。

澳洲規劃研修「國家重型車輛法」並探討科技設備檢測疲勞駕駛相關規範

  澳洲國家交通委員會(National Transport Commission)與警覺、安全、生產力合作研究中心(Cooperative Research Centre for Alertness, Safety and Productivity ,Alertness CRC)於2016年12月攜手研究重型車輛駕駛員之疲勞駕駛影響,並特別探討科技設備檢測及因應的可行性,並著手研析重型車輛疲勞駕駛管理相關規範之評估規劃。   依據澳洲國家重型車輛法(Heavy Vehicle National Law,HVNL)規定,設有國家重型車輛管理獨立機構(The National Heavy Vehicle Regulator,NHVR)針對總重4.5噸之重型車輛進行規範監管。依國家重型車輛疲勞管理規則【Heavy Vehicle (Fatigue Management) National Regulation】規定針對1.超過12噸總重額(Gross Vehicle Mass,GVM)之重型車輛2. 車輛及聯結物超過12噸者3.超過4.5噸可乘載12名成人(包含司機)之巴士4.超過12噸總重額定值之卡車及聯結車,其附接工具或機械者,必須進行疲勞管制,其他對於有軌電車、工具機械車輛(例如:推土機、拖拉機)、露營車等則不在此管制對象。該法針對重型車輛工作和休息時間、工作及休息時間之紀錄、疲勞管理豁免(Fatigue management exemptions),及公司、負責人、合夥人、經理等的連帶責任,訂有相關規範。疲勞管理規則的規範核心在於駕駛員不能在疲勞的情況下行駛重型車輛,故即使符合工作和休息限制,駕駛員也可能因疲勞而受影響。   目前,因有限的證據表明工作安排對於重型車輛駕駛員疲勞的影響程度,亦很少有研究使用客觀和預測技術測量駕駛員的警覺性和疲勞,另對於駕駛員睡眠的質量和時間最低要求的資訊亦不足。因此,現行法律規範對重型車輛駕駛員疲勞的影響將受到挑戰。故警覺、安全、生產力合作研究中心將採取更精準的警報檢測方法和睡眠監測設備,進行相關研究測試,以作為未來國家重型車輛疲勞管理規則修訂之依據。   駕駛疲勞所引發的交通事故時有耳聞,往往造成重大危害與耗費社會成本。目前實務上已有利用科技設備偵測是否有疲勞駕駛情形,然而更重要的是,應落實行車前的疲勞管制,及相對應的解決方案,並加強公司及相關管理者之監督義務及連帶責任,才能有效降低疲勞駕駛肇事率,確保道路安全。

「數位藥丸(digital pill)」新運用

  英國航空公司(British Airways)近來對數位藥丸申請了專利,並且調查乘客是否願意吞食數位藥丸,使空服員得對其提供更好的服務。   該數位藥丸以主要是一個可食用的偵測系統,藉此航空公司得以知悉乘客的身理狀況,包含偵測乘客的心跳、體溫、或是否處於睡眠等生理反應,航空公司便可據此調整基上的的燈光、用餐時間以及機上娛樂設施等等。這一整套「為了提升乘客旅遊品質」的系統現在被寫成專利申請書,並於2016年提出英國航空公司表示利用不同的資料可以幫助機員了解乘客是醒或睡、是否緊張、冷熱或感到不舒適,並通知機員。依據其專利申請書,英國航空希望創造一個App,協助乘客改善整體旅遊品質,不僅是在機上,而是乘客從踏出家門開始到旅程結束,均能享受此科技之便利。

TOP