合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=66&tp=1 (最後瀏覽日:2025/07/05)
引註此篇文章
你可能還會想看
何謂防禦型聯盟(Defensive Patent Aggregator)?其是否為NPE的重要類型?

  防禦型專利聯盟係為NPE之一種重要類型,主要以抵制NPE侵擾為出發點,防禦型聯盟儘可能搶先攻擊型如NPE者去進行專利的授權或購買,加入防禦型聯盟者則可付出比與NPE進行和解所支付費用較少的金錢,成員其會員以取得不被NPE侵擾的地位。   NPE中屬於防禦型聯盟(Defensive Patent Aggregator)者,RPX(Rational Patent)之運作模式常可作為主要類型化參考對象之一。RPX為上市公司,其主要核心業務在於「緩和其會員被訴之可能」。RPX取得專利之資金主要來自會員年費,而各會員可取得RPX所有專利之「授權」,而收費結構不當然等於獲取專利之成本之分攤,以使會員已低於一般訴訟和解、或取得爭議專利等更為低的代價來防止被訴。在此同時,RPX本身也不會對他人起訴。   RPX所提供的防禦性聯盟策略,先行於其他NPE取得前那些潛在「危險性」的目標專利,甚至有可能向NPE取得專利,必要時,直接於訴訟仍在進行之時去取得專利。而在防禦以外,如其他非會員向會員起訴,會員也可以以RPX所有之專利進行反訴。   目前RPX會費在6萬5千美元至6900萬美元之間,依照會員本身營運規模之不同定之,但「會費等級」(rate card)會自加入之初鎖定不再更動,實際每年繳交費用則可能依據RPX所取得的所有專利價值增加而上昇 。而除此主要運作模式外,RPX也運用其廣泛取得專利之經驗,提供個別企業服務服務,得以較低的躉售價格取得專利(Syndicated Acquisitions),反之企業自行購買專利可能需要付出較高的「零售」價格   RPX的運作模式對於加入成為其「會員」者有兩項優勢:第一,減少「專利蟑螂」可取得的專利數量;其次,因可理解為全體會員合力進行防禦型專利取得故能減低這些專利取得之成本。

“.cn”網域名稱爭議處理規則修正

  中國網路資訊中心( Chinese Internet Information Network, CINIC )日前修改其網域名稱爭議處理規則,嘗試在商標持有人與網域名稱註冊人權益間取得一平衡。新修正的規則已於今( 2006 )年 3 月 17 日正式生效,將使商標持有人更難取得相同或近似的網域名稱。   新修正規則將不再適用已註冊網域名稱超過 2 年的域名,對於此類案件爭端解決的途徑將僅能循法院管道處理。此將導致商標持有人將定期注意搶註網域者(俗稱網路蟑螂)之行為,並對註冊不到 2 年之域名提起申訴。   先前的網域名稱爭議處理規則將註冊人「註冊域名乃為求移轉並取得不當利益」的行為視為惡意,在是該案件中 CINIC 會將該域名移轉與申訴人。而新修正的規則即要求申訴人必須證明註冊人已移轉該域名與申訴人或申訴人之競爭者。   新修正規則亦要求註冊人若能證明以下事項,則得主張其註冊有正當權利: •註冊人已基於善意使用該域名提供商品或服務; •該域名已透過使用而使社會大眾對其產生一定信賴;或 •在無企圖混淆消費者以獲取商業利益的前提下,基於商業或非商業理由合法使用。

東協-澳洲高峰會後發表雪梨宣言:倡議網路安全、智慧城市以及數位貿易

  首屆東南亞國協澳洲高峰會(ASEAN-Australia Summit)於2018年3月18日落幕,各國領袖達成共識並聯合發表雪梨宣言(Sydney Declaration),宣言內容談到未來東協與澳洲間之戰略夥伴關係、推動區域經濟之整合以及在複雜的區域議題上(包含網路、海事、移民)提升合作關係。   首先,在倡議網路安全(Cybersecurity)議題上。網路安全的威脅乃是全球性的,且在現今許多技術的應用上都會加劇這個問題的嚴重性。而社群媒體以及加密通訊軟體的使用對於所有人而言都將會是一個挑戰,故為深化網路安全之合作,各國將承諾共同致力促進一個開放、安全、穩定、便利、友善的ICT環境。於現行的國際法制基礎下促進網路空間的國際穩定、培養合作能力、確實建立信任措施以及自願而不具拘束力之行為規範。此外,澳洲與東協簽訂共同打擊國際恐怖主義備忘錄(Memorandum of Understanding (MoU) on Cooperation to Counter International Terrorism),以打擊恐怖及暴力極端主義,其中合作內容即包含有網路情報交流、提供能力建構方案以幫助偵查及打擊恐怖活動等。   次之,在東協-澳洲智慧城市倡議(ASEAN-Australia Smart Cities initiative)議題上。澳洲總理Malcolm Turnbull宣布將在五年內投資3000萬澳幣於強化澳洲與東協發展智慧、永續之城市設計的合作計畫,並且將更進一步促進區域經濟整合與繁榮。澳洲將向東協提供教育、培訓、技術援助及創新支援並投資發展永續性都市化之研究。在綠色基礎設施、水資源管理、再生能源、創新科技技術、數據分析以及交通運輸上,澳洲願意共享經驗與知識。此外,澳洲與東協亦將合作開發一系列高效能的基礎設施項目,以吸引私人及公共投資並改善區域連通性,更進一步實踐智慧城市之目標。   第三,在倡議數位貿易(Digital trade)議題上。澳洲政府宣布將與東協十國共同推動數位貿易並支持該地區經濟的包容性成長。數位科技在全球迅速普及,並為政府、消費者、企業提供了機遇,特別是針對微型、中小企業,它帶來了新興數位交易機會、就業機會、投資機會以及提高生活水準,然而數位化的好處並不代表公平分享。而統一數位貿易之國際標準將有助於消除企業進入區域市場之阻礙以及創造新的就業機會及發展,此一舉措將幫助東協落實其在資料經濟政策上主要優先之處理事項。

歐盟2020年人工智慧白皮書

  歐盟執委會於2020年2月19日發布「人工智慧白皮書」(White Paper on Artificial Intelligence: a European approach to excellence and trust),以打造卓越且可信賴的人工智慧為目標。歐盟認為在推動數位轉型過程中的一切努力,均不應脫離歐盟以人為本的最高價值,包含:開放(open)、公平(fair)、多元(diverse)、民主(democratic)與信任(confident),因此在人工智慧的發展上,除了追求技術的持續精進與卓越外,打造可信賴的人工智慧亦是歐盟所重視的價值。   歐盟執委會於人工智慧白皮書中分別就如何追求「卓越」與「可信賴」兩大目標,提出具體的措施與建議。在促進人工智慧卓越方面,執委會建議的措施包含:建立人工智慧與機器人領域的公私協力;強化人工智慧研究中心的發展與聯繫;每個成員國內應至少有一個以人工智慧為主題的數位創新中心;歐盟執委會與歐洲投資基金(European Investment Fund)將率先在2020年第1季為人工智慧開發與使用提供1億歐元融資;運用人工智慧提高政府採購流程效率;支持政府採購人工智慧系統等。上述各項措施將與歐盟「展望歐洲」(Horizon Europe)科研計畫密切結合。   而在建立對人工智慧的信賴方面,執委會建議的措施則包含:建立有效控制人工智慧創新風險但不箝制創新的法規;具高風險的人工智慧系統應透明化、可追溯且可控制;政府對人工智慧系統的監管程度應不低於對醫美產品、汽車或玩具;應確保所使用的資料不帶有偏見;廣泛探討遠端生物辨識技術的合理運用等。歐盟執委會將持續徵集對人工智慧白皮書的公眾意見,並據以在2020年底前提出成員國協力計畫(Coordinated Plan)之建議。

TOP