合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=86&tp=1 (最後瀏覽日:2025/12/03)
引註此篇文章
你可能還會想看
英國成立「技術移轉政府辦公室」,以促進公部門知識資產流通利用

  英國技術移轉政府辦公室(Government Office for Technology Transfer, GOTT)於2022年10月設立於英國索爾福德(Salford);其為英國商業、能源與產業策略部(Department for Business, Energy & Industrial Strategy, BEIS)之轄下機構,設立之旨在於促進公部門(public sector)知識資產(knowledge asset)流通利用,以為英國帶來經濟、社會及財政上效益。   所謂「知識資產」係指—智慧財產權、專門技術、資料、品牌、業務流程、專家資源及技術等;目前英國關於公部門知識資產之估值,總計約超過1060億英鎊。而所謂「技術移轉」係指使這些資產與他機構分享,以刺激創新及帶動新產品、流程及服務的研發,並促進更多商業創投(commercial venture)的可能。   GOTT具有跨部門的職權,使公部門可增強其對自身知識資產的辨識、研發與利用,並鼓勵公部門在管理其知識資產上,可更具創新性及具有企業家精神。目前,GOTT已開始與其他公部門在創新上合作,例如一造價更低的高密度真空紫外光(Vacuum Ultra-Violet, VUV)光源機,以淨化水質;或以石墨烯(graphene)製成生物傳感器(biosensor),以使在人體上以生物標記(biomarker)偵測不同健康狀況及疾病。   GOTT係以提供資金和專業知識的方式,以在跨部門政府間,進行創新項目的支持;依據英國政府早先所編列的一「關於政府部門應如何管理知識資產」的指南(The Rose Book: guidance on knowledge asset management in government,下簡稱The Rose Book),GOTT係以「提供對The Rose Book之詢答」、「提供對於管理知識資產之訓練」、「形成關於知識資產之人脈網」、「舉辦活動以喚起對知識資產管理重要性的認識」、「告知不同部門其可能擁有的知識資產及可運用機會」等方式,對公部門進行協助(The Rose Book第8.2點參照)。   而依照The Rose Book第8.4點,GOTT亦將與以下單位,分就上述不同事項,及就知識資產爭訟事件提供建言等,進行合作,以對其他公部門提供協助:(1)英國智慧財產局(Intellectual Property Office);(2)英國國防部(Ministry of Defence);(3)英國犁頭創新中心(Ploughshare Innovations);(4)政府法務處(Government Legal Department);(5)國家檔案館(The National Archives)。   而在後續成果運用上,The Rose Book第6.1點提及,公部門於運用知識資產時,可就很多面向進行考慮。除尋求「商業上的回報」外,亦可將「促進各別部門及不同部門間公共事務之進行」,以及「為商業、慈善團體及人民之使用」一事納入考量,藉以達到經濟、社會及財政上效益;而就「商業上的回報」而言,依照The Rose Book第6.35點,除最常見的「技術授權」及「販賣知識資產」外,亦有「衍生新創公司」(spin-outs)及合資公司(joint ventures)等方式。而一知識資產可如何被適當運用,則可尋求專家意見。

協助產業因應歐盟EuP指令之推動情形

  繼歐盟實施 WEEE 和 RoHS 指令掀起一股綠色風潮之後,歐盟又將啟動能源使用產品生態化設計指令 (Directive of Eco-design Requirements of Energy-using Products ,簡稱 EuP 指令),該指令協調歐盟產品環保設計的通則與標準,要求耗能產品(運輸工具除外)採取以內部設計管制或管理系統評估的方式,進行評鑑以證明其符合這項指令之規定,並取得 CE Marking 的符合性宣告,產品方能在歐盟境內上市。歐盟要求各會員國應於 2007 年 8 月前完成國內立法。   EuP 指令要求產品製造商須採用生命週期( Life Cycle )的思考方式,將生態化設計的要求 (Rrequirement of Eco-Design) 融入產品設計開發之中,藉此提高產品效能,增加能源供應的安全性,並達到高度環保要求。雖然目前歐盟尚未公告各項產品之生態化設計要求,但初期已列出包括:加熱與鍋爐設備、辦公事務設備、消費電子、照明、通風與空調、電動馬達、家用電器等 14 項優先管制產品,該等產品實施方法仍在研擬中,未來將逐步擴大管制項目。   依海關統計資料, 2005 年我國輸歐盟 14 類產品之總金額達 2,127 億元台幣。預期 EuP 指令的實施,將對我國產業帶來新的挑戰和機會。為協助我國廠商預先準備因應 EuP 指令,經濟部工業局已逐步協助並輔導業界建立 EuP 符合性評估之基礎,期帶領廠商面對 EuP 指令的挑戰,進而於綠色採購與綠色消費的潮流中持有競爭力。

世界經濟論壇發布《人工智慧公平性和包容性藍圖》白皮書

  世界經濟論壇(World Economic Forum, WEF)於2022年6月29日發布《人工智慧公平性和包容性藍圖》白皮書(A Blueprint for Equity and Inclusion in Artificial Intelligence),說明在AI開發生命週期和治理生態系統中,應該如何改善公平性和強化包容性。根據全球未來人類AI理事會(Global Future Council on Artificial Intelligence for Humanity)指出,目前AI生命週期應分為兩個部分,一是管理AI使用,二是設計、開發、部署AI以滿足利益相關者需求。   包容性AI不僅是考量技術發展中之公平性與包容性,而是需整體考量並建立包容的AI生態系統,包括(1)包容性AI基礎設施(例如運算能力、資料儲存、網路),鼓勵更多技術或非技術的人員有能力參與到AI相關工作中;(2)建立AI素養、教育及意識,例如從小開始開啟AI相關課程,讓孩子從小即可以從父母的工作、家庭、學校,甚至玩具中學習AI系統對資料和隱私的影響並進行思考,盡可能讓使其互動的人都了解AI之基礎知識,並能夠認識其可能帶來的風險與機會;(3)公平的工作環境,未來各行各業需要越來越多多元化人才,企業需拓寬與AI相關之職位,例如讓非傳統背景人員接受交叉培訓、公私協力建立夥伴關係、提高員工職場歸屬感。   在設計包容性方面,必須考慮不同利益相關者之需求,並從設計者、開發者、監督機關等不同角度觀察。本報告將包容性AI開發及治理整個生命週期分為6個不同階段,期望在生命週期中的每個階段皆考量公平性與包容性: 1.了解問題並確定AI解決方案:釐清為何需要部署AI,並設定希望改善的目標變量(target variable),並透過制定包容性社會參與框架或行為準則,盡可能實現包容性社會參與(特別是代表性不足或受保護的族群)。 2.包容性模型設計:設計時需考慮社會和受影響的利益相關者,並多方考量各種設計決策及運用在不同情況時之公平性、健全性、全面性、可解釋性、準確性及透明度等。 3.包容性資料蒐集:透過設計健全的治理及隱私,確定更具包容性的資料蒐集路徑,以確保所建立之模型能適用到整體社會。 4.公平和包容的模型開發及測試:除多元化開發團隊及資料代表性,組織也應引進不同利益相關者進行迭代開發與測試,並招募測試組進行測試與部署,以確保測試人群能夠代表整體人類。且模型可能隨著時間發展而有變化,需以多元化指標評估與調整。 5.公平地部署受信任的AI系統,並監控社會影響:部署AI系統後仍應持續監控,並持續評估可能出現新的利益相關者或使用者,以降低因環境變化而可能產生的危害。 6.不斷循環發展的生命週期:不應以傳統重複循環過程看待AI生命週期,而是以流動、展開及演變的態度,隨時評估及調整,以因應新的挑戰及需求,透過定期紀錄及審查,隨時重塑包容性AI生態系統。   綜上,本報告以包容性AI生態系統及生命週期概念,期望透過基礎設施、教育與培訓、公平的工作環境等,以因應未來無所不在的AI社會與生活,建立公司、政府、教育機構可以遵循的方向。

美國專利商標局再審結果,將影響Motorola 與Aruba Networks間的專利侵權訴訟結果

  美商Motorola 公司(下稱MOT) 旗下Symbol Technologies, Inc.及Wireless Valley Communications, Inc.公司於2007年8月27日在美國德拉瓦州(Delaware)地方法院對美商Aruba Networks公司(下稱ARUN)提起專利侵權訴訟,指出ARUN侵害他們的無線區域網路連結技術(WLAN)等四項專利,並向法院申請永久禁制令及金錢上的損害賠償。     2008年9月,ARUN向法院申請反訴並向美國專利商標局(USPTO)對上開四項專利申請再審,指出MOT所據以主張的專利權申請日晚於ARUN之現有技術(Prior Arts)實施日。     今(2009)年2月,美國專利商標局已陸續對於ARUN所提的再審核發初審報告。其中,US Patent No.6625454中12/14說明項被認定為無效;US Patent Nos.6973622, 7173922之再審初審報告指出全部說明項都被認定為無效;目前還有1件ARUN申請的專利再審案在審查中,而根據MOT於法院上的陳述,美國專利商標局所受理的再審專利案件中,也多將原專利權認定為無效或變更。 ARUN所提的再審結果雖然尚未確定,但多數分析師認為再審結果多有利於ARUN。待再審結果確認後將會影響MOT v ARUN的訴訟結果,對於損害賠償判定也會有重大影響 。

TOP