合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=0&tp=5 (最後瀏覽日:2025/08/20)
引註此篇文章
你可能還會想看
韓國最高法院宣告撤銷製藥公司含有「LEGO」名稱的註冊商標

韓國最高法院2023年12月8日宣告著名積木玩具樂高公司(LEGO Juris A/S)提起撤銷註冊商標「LEGOCHEMPHARMA」的上訴審判結果,確認韓國製藥商樂高生技有限公司(下稱LegoChem Bio)的註冊商標無效,因該註冊商標包含LEGO字樣,存有減損樂高公司「LEGO」商標識別性之虞,構成侵害商標權。 科斯達克上市公司LegoChem Bio於2015年11月申請「LEGOCHEMPHARMA」商標註冊,用以提供藥物開發服務,隨後樂高公司提出異議,聲稱該商標與其「LEGO」商標近似,該商標因此被駁回。據此,LegoChem Bio向智慧財產權審判及上訴委員會(IPTAB)提出上訴,並於2018年9月取得商標註冊。其後,樂高公司於2020年3月向智財法院提起訴訟,主張商標權受到侵害,請求撤銷「LEGOCHEMPHARMA」商標註冊,法院判決該註冊無效,LegoChem Bio因此向最高法院提起上訴。 首先,最高法院認為「LEGOCHEMPHARMA」(下稱系爭商標)的關鍵識別部分為「LEGO」,而「CHEM」和「PHARMA」僅是化學和製藥領域的名稱,沒有特殊的識別性。其次,依韓國《商標法》規定,第34條第1項第11款規定「可能與消費者高度認識的他人商品或服務造成混淆誤認,或損害其識別性或聲譽之虞的商標」不得註冊商標。最高法院認為系爭商標與樂高公司的高知名度和高識別性商標「LEGO」非常近似,被告LegoChem Bio申請註冊系爭商標之目的可能是為引起與先使用商標「LEGO」之聯想。因此判決系爭商標註冊無效,且應視為有損害著名商標識別性之虞。 本案攻防戰可看出商標取得、保護對於品牌之生存發展具有重要影響,有關品牌發展各階段應留意的風險與建議作法,企業可參考資策會科法所創意智財中心出版的商標專書「TOP品牌商標管理術!新創業到老字號都適用」,可藉由該書收錄的經典國內外品牌商標管理方式與時事案例,跟上品牌商標管理趨勢,其中的品牌商標管理工具,亦得直接應用於實務工作,輔助建置品牌商標管理機制,保護品牌獨特性、穩固品牌競爭力,為品牌經營帶來加乘效益。 本文同步刊登於TIPS網(https://www.tips.org.tw)

猶他州選民詳細資料遭網站公開,引起社會大眾關注

  據猶他州政府檔案存取及管理法(the Government Records Access and Management Act,簡稱GRAMA),該州選民註冊資料及投票歷史紀錄檔案屬於得公開資訊,據此,猶他州民得給付1,050元美金並填寫申請表,向政府申請取得全州選民數據庫之資料。   上開法令作為申請之依據,UTvoters.com創辦人Tom Alciere透過向該州政府申請並取得該州選民資訊後,建置該網站。透過該網站系統,任何人可查詢該州選民選舉資料。Tom Alciere指出,倘選民認為他們資訊被公布網站上並不合理,他們可以要求移除網站上的資訊,但這些資訊仍被記錄在該州數據庫中,且仍可被公開取得。   該州負責選舉主任委員Mark Thomas指出,倘能證明自身安全因資料遭公開而陷入危險,或具有某些情況如屬政府官員(例如州市長或參議員)等資料,基於安全考量,得移除數據庫之資料。   該州選民認為他們資料如同信用卡被竊一般的遭到洩漏,且不應被公開於網路;該州參議員Karen Mayne亦認為該不合理制度須做改變,政府一方面應鼓勵民眾參與投票,但非在過程中犧牲與公開選民的個人資料。   相關修正案之建議,限制該類資料僅能作為「政治」上的使用,且應排除與網路連結。若違反,則將面臨6個月以上有期徒刑及1,000美元以上之罰金。

美國聯邦通訊委員會修改廣播電視業者對於兒童關看電視的保護義務

  美國聯邦通訊委員會( The Federal Communications Commission /FCC )在 2006 年 9 月,修改並解釋 2004 年一項課與廣播電視業者對兒童觀看電視保護義務之指令。在 2004 年提出的指令中對廣播電視業者有許多規定,包括:電視業者被要求提供兒童適當比例基準之核心( core )教育及資訊節目,並於該類型節目中全程播放中標示 E/I 的符號;允許在節目中出現網站網址,但限制兒童節目中顯示非與節目相關以及有商業目的之網站網址;原兒童節目之插播限制規定;以及修改所謂商業內容定義等。   這次對該指令的再修改,則是希望透過確保提供適當比例的兒童教育資訊節目、將廣告及其他兒童節目之行為納入商業內容定義,以及顯示網站網址之新限制規定,讓邁向數位化世界下之公眾利益能獲得保障。特別是在同時確保不過份削減廣播電視業者以及有線電視業者節目時間編排彈性下,保護兒童免於在廣播電視以及有線電視節目中,接收過多商業訊息。

為降低奈米材料風險以保障健康安全,美國環保署(EPA)擬公佈一系列相關新規範

  為了致力於確保及避免因特定奈米材料的曝露而不經意對環境、健康與安全(Environmental, Health and Safety,簡稱EHS)帶來潛在危害,美國環保署(Environmental Protection Agency,簡稱EPA)預計將於今(2011)年1月針對奈米材料的管理規範公佈三項新規定,此舉將使得EPA更能對於目前既有與未來新興奈米材料上有更充分的管理空間,同時這三項新規定也將接受來自公眾與各界人士的意見評論。   這三項新規定分別與顯著新用途規則(Significant New Use Rule)、試驗規則(Testing Rule)和資料收集規則(Data Collection Rule)有關。首先,就顯著新用途規則而言,多年來相關倡議團體(advocacy group)請求EPA將既有的奈米材料視為是「毒性物質管理法」(Toxic Substances Control Act,簡稱TSCA)下的顯著新用途,依此EPA將可管理奈米銀、奈米級二氧化鈦、奈米級氧化鋅等材料,亦可因此對要求廠商限制產量、採取勞工安全措施、進行毒性測試,並要求廠商不得故意將奈米材料釋出或排放至環境中。雖然現在尚無法確知詳細法令規定,但已知EPA有意透過TSCA第5條處理上述種種問題,其可能作法為奈米材料將不再受既有化學物質並非顯著新用途的限制,而任何以既有化學物質製成的新型奈米材料將被視為是顯著新用途。   其次,則是試驗規則,目前EPA對於特定奈米材料要求進行90日呼吸毒性試驗,而新規定將在TSCA第4條之下,要求對奈米粘土、奈米氧化鋁、奈米管等也進行相同的試驗。此係由於目前在經濟合作開發組織(Organization of Economic Cooperation and Development,簡稱OECD)主導的毒性試驗計畫之下,仍未有其他國家願意主導奈米黏土、奈米氧化鋁的試驗,以及通常90日呼吸毒性測試所費不貲,故未來美國預計率先投入,各界亦期盼EPA所提出的新規定將准予廠商以合作提出申請,以利於降低成本並落實相關試驗。   此外,資料收集規則將要求廠商必須正式遞交相關奈米材料的EHS資料,以供EPA進行評估審查,故新規定將在TSCA第8條之下,將原先EPA「奈米材料管理計畫」(Nanoscale Materials Stewardship Program,簡稱NMSP)的自願性參與改為強制性的資料收集,然而由於TSCA中規定對於僅使用少量奈米材料或作為研究目的者,可申請免除資料收集,故廠商仍可依此排除此一義務。   綜合以上,使用相關奈米材料的廠商應密切觀察未來三項新規定的發展動向,以確定日後如何遵守EPA的相關法令規定,落實風險管控,保障自身權益。

TOP