合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=86&tp=1 (最後瀏覽日:2026/04/03)
引註此篇文章
你可能還會想看
Nokia 出售125項專利價值120億美元

  美國NPE公司Pendrell Corporation日前宣布從Nokia收購了125項專利。根據Pendrell Corporation之發言可知,前揭125項專利當中,共有81項專利為關鍵專利(essential patent)。主要涉及領域包括運用於智慧型手持裝置、桌上型電腦、MP3播放器等電子設備的多種基礎記憶體技術,其中尚包括以SD卡為主之嵌入式快閃記憶體技術。   市場分析師預估上開技術的全球市場在今年(2013)將有超過120億美元的價值,若僅論及SD卡市場,其價值甚至在2018年將超過210億美元。   依據雙方契約內容可知,為延續Nokia位於芬蘭之研發投入,Pendrell Corporation亦已成立一名為赫爾辛基記憶體技術(Helsinki Memory Technologies,HMT)之子公司。Nokia有權使用HMT未來所收購及所開發之所有專利。又,前揭專利之授權金收入均將運用於進一步之研發活動。   Pendrell Corporation之智財長Joseph Siino則指出,將購自Nokia之125項專利與該公司原有之其他智財組合結合後,除可提供持續性創新之用以外,亦可以公平合理的價格出售給全世界對其感興趣的公司。   赫爾辛基當地律師事務所之合夥律師Jan Lindberg表示大公司將更積極於出售已非其核心資產之專利資產。但應注意對專利之鑑價時有變化。以本件為例,便應考量Nokia之在赫爾辛基交易所之市值僅餘123億美元。

歐盟發布人工智慧法、醫療器材法與體外診斷醫療器材法協同適用問答集

歐盟《人工智慧法》(Artificial Intelligence Act, AIA)自2024年8月1日正式生效,與現行的《醫療器材法》(Medical Devices Regulation, MDR)及《體外診斷醫療器材法》(In Vitro Diagnostic Medical Devices Regulation, IVDR)高度重疊,特別是針對用於醫療目的之人工智慧系統(Medical Device AI, MDAI)。為釐清三法協同適用原則,歐盟人工智慧委員會(Artificial Intelligence Board, AIB)與醫療器材協調小組(Medical Device Coordination Group, MDCG)於2025年6月19日聯合發布常見問答集(Frequently Asked Question, FAQ),系統性說明合規原則與實務操作方式,涵蓋MDAI分類、管理系統、資料治理、技術文件、透明度與人為監督、臨床與性能驗證、合規評鑑、變更管理、上市後監測、資安與人員訓練等面向。 過去,MDR、IVDR與AIA雖各自對MDAI有所規範,但始終缺乏明確的協同適用指引,導致製造商、監管機關與醫療機構在實務操作上常面臨混淆與困難。本次發布的指引透過36題問答,系統性釐清三法在高風險MDAI適用上的關聯,重點涵蓋產品分類原則、合規評鑑流程以及技術文件準備要點,具高度實務參考價值。此外,傳統醫療器材的上市後監測,難以有效因應AI系統持續學習所帶來的風險。AIA因此要求高風險MDAI建立強化的上市後監控系統,並評估AI系統與其他系統交互作用可能產生的影響。 整體而言,該指引的發布不再僅限於MDAI技術層面的合規審查,而是進一步擴展至資料正當性、系統可控性、使用者能力與整體風險治理等層面,體現歐盟對AI倫理、透明與責任的制度化落實。此文件亦為歐盟首次系統性整合AI與醫療器材監管原則,預期將成為MDAI產品研發與上市的重要參考依據。 本文同步刊載於stli生醫未來式網站(https://www.biotechlaw.org.tw)

日本2018年7月27日發布最新3年期網路安全戰略(サイバーセキュリティ戦略)

  日本網路安全戰略本部(サイバーセキュリティ戦略本部)於2018年7月27日發布最新3年期網路安全戰略(サイバーセキュリティ戦略),其主要目的係持續實現「提昇經濟社會活力與永續發展」、「實現國民安全且安心生活之社會」、「維持國際社會和平、安定與保障日本安全」三大目標,並透過7月25日同樣由網路安全戰略本部(サイバーセキュリティ戦略本部)發布之網路安全年度計畫2018(サイバーセキュリティ2018),執行下述資安對策的細部計畫與做法。   以下簡述依據日本三大資安目標所提出之重要資安對策: 提昇經濟社會活力與永續發展 (1) 推動可以支援創造新價值之網路安全措施。 (2) 實現可以創造價值之網路安全供應鏈。 (3) 架構安全物聯網(Internet of Things, IoT)系統。 實現國民安全且安心生活之社會 (1) 制定網路犯罪之因應對策。 (2) 官民一體共同防護關鍵基礎設施。 (3) 強化與充實政府機關之網路安全。 (4) 確保大學能建構安全與安心之教育與研究環境。 (5) 展望2020年東京奧運與未來之措施。 (6) 強化情資共享與合作體制。 (7) 強化應變大規模網路攻撃事態之能力。 維持國際社會和平、安定及保障日本安全 (1) 堅持自由、公平且安全之網路空間。 (2) 建立支配網路空間之法律秩序。 (3) 強化日本網路防禦力、抑制網路攻擊能力與掌握狀況之能力。 (4) 強化掌握網路空間狀況之能力。 (5) 國際合作。

美國2016年製造創新策略方案

  依2014年復甦美國製造與創新法(RAMI Act of 2014),美國國家製造創新網絡計畫於2016年2月公布策略方案(Strategic Plan)。國家製造創新網絡有四大目標:以「提升製造競爭力」為終極目標,其他三個目標分別為「促進技術轉型」、「加速製造業人力發展」、以及「確保穩定與永續之基礎建設」。在「促進技術轉型」方面,旨在促進創新技術朝向具備可適性、擁有成本效益、以及高效能之國內製造業量能的方向轉型。由於不同的製造整備度(manufacturing readiness levels)對應不同的技術整備度(technology readiness levels),且國家製造創新網絡有其設定之目標範圍,因而研發機構被預期能夠促進技術轉型的亦有差異。   行政院於民國105年7月核定通過「智慧機械產業推動方案」,透過「智機產業化」與「產業智機化」來建構智慧機械產業生態體系。智慧機械將結合半導體先進製程、精密醫療機械加工與智慧服務型機器人、以及航太與造船軍民通用技術應用,分別對應帶動亞洲矽谷、生技醫藥、以及國防等創新產業政策。透過智慧機械帶動整體產業發展,從精密走向智慧、從單機走向系統,以提高整體產業之產值

TOP