合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/01/02)
引註此篇文章
你可能還會想看
Apple 對於Psystar案件之判決

  Apple在對Psystar的法律訴訟上贏得重要的勝利,美國政府聯邦法院已判決複製品製造者Psystar於販售個人電腦時事先安裝Mac OS X作業系統,已侵犯Apple的著作權。   在雙方提起簡易判決訴訟後一個月,美國地方法院法官William Alsup 表示Psystar已侵害Apple專用之重製權、散布權及衍生著作權,於判決中針對著作權侵害一事已被承認。並且確認Apple於Mac OS X產品之直接用戶授權合約,是限制使用於Apple生產的電腦,更特別禁止安裝此作業系統於其他電腦;在此同時,法官否決Psystar的論點:首次銷售原則所允許,買家可以任意使用此作業系統。 此外,法官同意Apple的聲明,Psystar侵害數位化千禧年著作權法案之反規避條款及反交易條款,另一方面,法官也否決Psystar對Apple濫用著作權的論點。   此判決並未包含其他Apple所提出的主張,包括:合約的侵害、商標的侵權及商標稀釋,法官也未提出給予Apple救濟上的權利,包括先前提及之永久禁止令,要求中止Psystar販售任何帶有Apple軟體的硬體並強迫其召回所有已售出帶有此作業系統之機器。   此判決對Apple而言,是決定性的勝利,但並非結束所有在法律上的爭議,12月14日將進行賠償的審訊,其餘審判也預訂於明年1月開始。

美國與歐盟宣布跨大西洋資料保護框架

  美國和歐盟執委會於2022年3月25日宣布將建立新的跨大西洋資料保護框架(Trans-Atlantic Data Privacy Framework),該框架將促進美國與歐洲之間的資料流通,並解決歐盟法院在2020年宣布隱私盾協議(EU-U.S. Privacy Shield framework)無效時所提出的疑慮與問題。   該框架是重新建立美國與歐盟兩地個人資料傳輸的一個重要法律機制。美國承諾將實施新措施,以確保訊號情報活動(signals intelligence activities)是在必要且合法的國家安全目標下進行,並且不得不成比例地影響對個人隱私和公民自由的保護。基此,美國承諾的新措施包含強化美國訊號情報活動的隱私及公民自由保障機制、建立獨立且具約束力的救濟措施,以及強化美國情報機構對現有訊號情報活動的程序且分層監督。對於歐盟公民而言,將有全新且高標準的規範來保護個人資料;而對於美歐間的民眾和企業而言,該框架將可促進資料持續流動,足以鞏固歐美兩地每年高達一兆美元的跨境貿易,並使各種規模的企業能夠在彼此的市場中競爭。   資料流通對於美歐雙方的經濟關係以及所有企業而言都至關重要。事實上,美國和歐洲之間的資料流通所創造的經濟價值高達7.1兆美元,高居世界首位。在此背景下,新的跨大西洋資料隱私框架將強化美國與歐盟雙方對隱私、資料保護、法治和整體國家安全的共同承諾,未來美國與歐盟雙方將依此框架持續推進雙方各自相關的法律規範。

德國汽車製造商擁有德國境內大部分的自駕車專利

  根據德國專利商標局(Deutsches Patent- und Markenamt)2017年度報告,德國該年境內發明專利申請量達67,707件,僅較2016年下降0.3%(2016年專利申請量達歷年新高),主要領域在交通;而新型專利和設計專利申請量卻持續下降。歷年申請量如下表: (件數) 2017 2016 2015 2014 2013 2012 2011 發明 專利 67,706 67,907 66,898 65,963 63,177 61,361 59,612 新型 專利 13,299 14,030 14,271 14,741 15,470 15,531 16,038 設計 專利 44,297 57,057 58,017 60,837 56,944 55,250 53,197 資料來源:德國專利商標局   其中,德國汽車公司投資在電動汽車、輔助系統和自動駕駛等領域數十億元的成果在發明專利中被充分反映出來。根據德國專利商標局2017年度報告,該年自動駕駛專利申請數量有2,633件,較2016年增加14%,是2013年的兩倍。   在德國4,810件自動駕駛專利中,德國汽車公司就擁有超過2,006件,占42%,日本為28%,美國為11%。僅2017一年,德國汽車公司就取得325件自動駕駛專利,較日本公司259件、美國公司112件和法國公司的41件還多。其中絕大多數被Audi、Toyota和Volkswagen所擁有。   此外,德國境內電動汽車專利申請也增加10%,總數達到3,410件,超過三分之一是用於蓄電池和燃料電池,德國汽車公司高居專利申請量榜首,其中以Bosch和Schaeffler為最。   事實上,除了在德國境內,全球自動駕駛專利幾乎一半亦為德國汽車公司所擁有,截止至2017年底,占了48.8%,其中Bosch排名第一,共擁有1,101件專利。前十名專利擁有者如下圖: 單位:件 資料來源:德國經濟研究所(Institut der deutschen Wirtschaft) 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

何謂德國電信媒體法中的「妨害人責任」(Störerhaftung)?

  原德國電信媒體法第八條條文中所指的「網路服務提供者」為擁有獨自或其他電信媒體及提供接取網路服務的自然人或法人,與我國著作權法中所提及「網路服務提供者」(Internet Service Provider)之適用對象範圍略有不同,而德國民法中有個特殊連坐法-「妨害人責任」(Störerhaftung),所有人對於妨害所有權之人,有排除及不作為請求權,因此,在原德國電信媒體法未規定之特定情形下,「網路服務提供者」應對他人透過其網路所從事的任何侵權違法行為負責。   這項法律使得德國許多咖啡館、公共空間、飯店大廳不願提供免費無線網絡,同時又讓大型咖啡連鎖店如星巴克,以提供免費網絡服務吸引顧客,因為他們就算被捲入網絡侵權責任的訴訟,也不怕支付高額律師費用,小型咖啡館就無法承擔這個風險,只能無奈面對客人轉向大型咖啡連鎖店消費的困境。根據原德國電信媒體法規定,咖啡館業主和其他網路熱點設立者所提供網路服務的方式將可能收到律師的警告函,告知他們不得再為非法下載者提供網路接取服務。   德國聯邦議院(Deutscher Bundestag)於2016年6月初經過激烈的辯論後,通過電信媒體法(Telemediengesetz; TMG)修正草案,將在最新的電信媒體法中免除「網路服務提供者」之「妨害人責任」(Störerhaftung),使德國的免費無線網絡連接點可以增加並走向開放。

TOP