合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2025/12/05)
引註此篇文章
你可能還會想看
創用CC創始人主張合理使用對抗Youtube的移除通知

  創用CC(Creative Commons)的聯合創始人萊斯格在被強制移除他放在Youtube上的演講影片,影片包含群眾跳舞與受版權保護的音樂的剪輯,萊斯格之後即向美國聯邦法院提出申訴。   創用CC是一個非營利組織,創造各種自由的權利去促進著作的分享利用。   根據週四在美國麻塞諸塞區地方法院的訴狀,哈佛法學院教授萊斯格在2010年6月在南韓首爾一場創用CC的會議上,發表「文化與科技創新的現在和過去」的演講,此演講包含業餘音樂影片的剪輯,描繪一群人隨著法國樂隊「鳳凰」演奏的Lisztomania歌曲跳舞。   演講的影片在今年6月被放在Youtube網站上,萊斯格在6月30日接獲Youtube的通知,此影片被內容擁有者或被Viacome公司線上授權者依據Youtube的過濾程序辨識並阻止。大約在6月30日,澳洲墨爾本解放音樂(Liberation Music)公司也依據數位千禧年法案(DMCA),對Youtube提出了移除通知要求移除影片,因為侵害解放音樂的著作權。在6月30日,Youtube以電子郵件通知萊斯格影片已經被移除,萊斯格向Youtube提出反通知,Youtube轉發給解放音樂,解放音樂反過來威脅萊斯格,如果他不撤回反訴,將在麻塞諸塞州法院起訴他。   美國維護科技時代人權與自由的電子先鋒基金會(Electronic Frontier Foundation, EFF)代表萊斯格辯稱,使用剪輯的問題,特別是內容是一個有關文化和網路的公開演講,是被允許在合理使用的原則下,因此,並不侵害被告的著作權。萊斯格使用的著作權是最小範圍且非基於商業使用目的,也從娛樂改為教育目的。演講的影片並不造成任何市場的損害。

日本經產省與國交省提出「自動駕駛推動發展與制度規劃」檢討報告

  日本經濟產業省於2016年11月14日召開第二次「自動駕駛商業檢討會」,邀請產官學研各界對於自動駕駛未來國際標準的動向以及諸如協調領域、社會接受度、制度和基礎建設等方面所涉議題,交換意見。   該檢討會首先注意到美國、歐洲以及韓國對於自動駕駛各式規則或指引制定的討論。在協調領域方面,檢討會指出:關於自動駕駛所需的地圖資訊,應由各汽車製造商協調,透過合作機制或規範來確保資訊與資金提供的公平性。   社會接受度方面,檢討會則提出建議考量是否需要針對不擅駕駛的高齡者或初學者,提供有效系統的必要性。在制度與基礎建設方面,檢討會則指出:以現狀而言,自動駕駛服務的商業永續性仍不明朗,必須持續進行實證試驗。   此外,為減少交通事故與因應少子化,與汽車的ICT革命等議題,由國土交通省於同年11月25日設立「自動駕駛戰略本部」(自動運転戦略本部),並於12月9日召開第一次會議。   該次會議討論的範圍包括:為實現無人駕駛的環境整備、自動駕駛技術的研發、普及與促進,以及為實現自動駕駛的實證與社會試驗。   會議結論則由國土交通大臣指示針對「車輛的技術基準」、「年長者事故對策」、「事故發生時的賠償規則」、「大卡車列隊行走」、「非平地道路間以車站為據點的自動駕駛服務」等議題速成立工作小組。

歐盟執委會發布第二份「數位十年狀況報告」,說明「2030年數位十年政策計畫」當前進展

歐盟執委會(European Commission)於2024年7月2日發布第二份「數位十年狀況報告」(State of the Digital Decade Report)(下稱該報告),全面檢視「2030年數位十年政策計畫」(Digital Decade Policy Programme 2030, DDPP)之施行現況。特別的是,該報告今年首次新增歐盟成員國提出之「數位十年國家戰略路線圖」(National Digital Decade Strategic Roadmaps),說明預計投入數位轉型之措施、行動及資金。 為了呼籲歐盟成員國加強行動,進而促進經濟繁榮並提升社會凝聚力,歐盟執委會於該報告提出兩大面向之建議。首先,於數位基礎設施及企業之部分,該報告指出,目前高品質之5G網路覆蓋率僅有歐盟領土之50%。對此,各成員國與執委會應共同努力創建真正之數位單一市場(Digital Single Market)。此外,歐洲公司對於人工智慧、雲端、巨量資料之採用率遠低於DDPP欲達成之75%目標。若欲實踐商業部門數位化,應鼓勵中小企業採用創新之數位工具,且應積極投資具有高度發展可能性之新創企業。 其次,於數位技能與公共服務之層面,該報告提及,社會經濟相關之數位轉型過程中,以人為本係一貫之核心理念。然而,目前僅55.6%之歐盟人口具備基本數位技能,各成員國應採取多元方法於各級學校推動培養教育。又,為提升公共服務數位化,各成員國應致力於線上提供重要公共服務、電子健康紀錄,以利民間及企業方便運用。 最後,歐盟成員國須於2024年12月2日前審視、調整「數位十年國家戰略路線圖」,以符合DDPP闡述之目標。此外,歐盟執委會將監督、評估報告中建議之實施情形,並於2025年發布之「數位十年狀況報告」追蹤改善進度。

JST(日本科學技術振興機構)發表關於大學智財的政策建言

  於回顧過去10多年來在大學智慧財產相關的政策措施以後,日本科學技術振興機構(JST)智慧財產戰略中心於7月5日就「政策建言-回首長達十多年的大學智財相關政策措施並探求今後的發展」總結作出發表。根據外識學者專家所組成的JST智慧財產戰略委員會所作成的研議,其就大學智財此後所追求的目標願景,以及為達成該願景各個部門(政府、大學、技轉中心與JST)各自所應扮演的角色提出了整體的建議。   在建言中提到,大學智財的目標願景乃在於「以未來運用為導向擬定智財策略」與「確保研究成果轉化智慧財產,積極回饋國民社會」,並列舉各部門為達成目標願景所應執行之任務。   建言中主要提到的各部門任務如下所述: 【日本政府的任務】 ‧對於大學的智財評價,不應只限授權金收入,也應考慮共同研究、創新育成(由大學孕育而生的新創企業)的創出效果。 ‧應建構於獲得革新性的研究成果時,能夠搶先取得基礎專利、強化週邊專利的策略性的、機動性的強而有力的智財支援體制。 【日本大學、技轉中心的任務】 ‧為創造強勢的專礎專利,應能確保具備優秀判斷力的人材,與應進行充分的先前技術檢索。 ‧應以大學成果的早期實用化為導向,推進與中小、新創企業的合作關係。 ‧思考大學間、技轉中心間多樣而有效果的合作形態,積極謀求提升技轉機會。 ‧強化對學生與研究者的智財教育與智財進修。 【JST的任務】 ‧研析早期而積極的智財發掘與迅速而機動的資金投入等等主動性的支援模式。 ‧進行熟悉海外技術移轉的專業人材的配置與培育,且就對大學專利之權利侵害提供設置諮詢窗口等的支援措施。 ‧促進大學閒置專利的海外技術移轉。 ‧研議於鉅額資金投入而有多數大學、企業參與之特定大型計劃的場合,不受日本版the Bayh-Dole Act條款的限制,而由特定公共的機關等執行專利的管理。

TOP