合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/05/05)
引註此篇文章
你可能還會想看
美國猶他州針對未成年人使用社群媒體之新禁令

美國猶他州州長柯克斯(Spencer Cox)於2023年3月23日簽署參議院152號法案(社群媒體規則修正案,Social Media Regulation Amendments)與眾議院311號法案(社群媒體使用修正案,Social Media Usage Amendments)等兩項法案,此舉是為了因應美國青少年日益沉迷社群媒體的問題,降低網路霸凌、剝削與未成年人個資外洩之風險。新法預計於2024年3月1日生效,兩項法案所提列之重點如下: 一、參議院152號法案針對社群媒體業者,要求其對於社群媒體應用程式之用戶,應採取以下措施: 1. 對於想要創設或持有社群媒體帳號之猶他州居民,須驗證其年齡。 2. 未滿18歲的用戶,須獲得父母或監護人的同意。 3. 允許家長有查看未滿18歲子女帳號內容之權限。 4. 訂定宵禁機制,於夜間(晚上10:30至早上6:30)禁止未成年登入使用帳號,但家長可視情形調整。 5. 禁止未成年用戶,向未曾關注或加好友的陌生人直接發送訊息。 6. 須於搜尋引擎中隱藏未成年人帳號。 7. 若違反上述內容,每項違反處以業者2,500美元之民事罰款。 二、眾議院311號法案針對「有使用導致未成年人成癮(Addiction)於社群媒體之設計或功能」之業者,訂定以下相關裁罰: 1. 經證明會導致未成年人對社群媒體成癮之行為、設計或功能,針對每項行為、設計或功能,處以業者25萬美元之民事罰款。 2. 若使未成年人接觸而致其成癮者,依未成年人數計算,每位最高可罰款2,500美元。 3. 允許父母得以其未成年子女因成癮致其身體、情感與財產上之損害為由,起訴社群媒體業者。 4. 若為未滿16歲之用戶依本法請求損害賠償者,媒體業者將推定過失責任,亦即由業者負舉證責任。 兩項法案皆是為保護美國18歲以下的未成年人,要求IG、TikTok、Twitter、Facebook等社群媒體一定作為與不作為之義務,若有違反情形,猶他州商務部消費者保護司(DCP)有權限對其違規行為處以民事罰款。上述美國法案針對未成年之保護,以透過規定使平臺業者設計出更優質、更完善的程式介面之觀點,可作為我國未來針對社群媒體監管措施之借鏡與觀察。

簡介「歐洲共同資料空間」

簡介「歐洲共同資料空間」 資訊工業策進會科技法律研究所 2022年09月30日 壹、前言   歐盟為促進數位經濟的發展,於2015年5月發布「數位單一市場(Digital Single Market)」政策,並指出資料(data)對於發展數位經濟的重要性 [1]。經過了5年的規劃,歐盟於2020年2月發布了「歐洲資料戰略(European Data Strategy)」,勾勒出建立歐洲「單一資料市場(single data market)」的具體措施與進程。   歐盟執委會(European Commission)在「歐洲資料戰略」中指出,為確保歐洲數位經濟的競爭力,應採取相關措施創造一個有吸引力的市場環境,其目標就是建立「歐洲共同資料空間 (Common European data space)」[2] 。本文以下將介紹「歐洲共同資料空間」的發展背景與現況。 資料來源:作者自繪 圖一 「歐洲共同資料空間」的政策發展脈絡 貳、「歐洲共同資料空間」的發展背景 一、源起   歐盟期待能建立一個真正單獨且對全世界開放的資料市場,各類資料能安全地存放其中,企業可輕易地近用高品質的產業資料,以加速企業的成長並創造更高的經濟價值[3]。在此資料空間中,資料的使用需要符合歐盟的法規,且所有資料驅動(data-driven)之服務和產品應符合歐洲「數位單一市場」的規範。因此,歐盟陸續制定相關法律和標準,建設相關基礎設施,期望能促進更多的資料在歐盟境內儲存和處理[4] 。歐盟執委會初期以「歐洲開放科學雲(European Open Science Cloud, EOSC)」的經驗為基礎[5] ,聚焦9個重點產業領域發展資料空間,其介紹如下表: 表一:「歐洲共同資料空間」9個重點產業領域 產業/領域 發展資料空間的目標 1 工業/製造業資料空間 挖掘「非個人資料」的潛在價值,以強化歐盟工業的競爭力,預計在2027年可以創造1.5兆歐元的產值 2 綠色協議(Green Deal)資料空間 支持氣候變遷、循環經濟、零污染、生物多樣性等行動 3 交通移動(Mobility)資料空間 強化運輸和交通移動資料庫的近用、整合、共享,確保歐盟的智慧運輸系統在全球的領先地位。 4 健康資料空間[6] 提升疾病預防、檢測、治療的發展,促進實證醫學發展的加速 5 金融資料空間 提升金融領域的資料共享、創新、市場透明度、永續金融 6 能源資料空間 透過安全和可信任的方式進行跨部門的資料共享,提升資料的可利用性,促進低碳的落實 7 農業資料空間 透過對農業生產等資料的分析,提升農業部門的競爭力。 8 公行(Public administrations)資料空間 提高政府支出的透明性和問責,強化政府科技、法遵科技、法律科技的應用 9 技能(Skills) 資料空間 降低教育培訓體系和勞動市場需求的落差 資料來源:整理自歐盟執委會2022年2月發布的工作報告 二、設計原則   歐盟執委會原訂於2020年第4季提出「歐洲共同資料空間」的具體規劃,但進度有所延遲。2021年3月歐盟理事會(European Council)認為需要加速建立共同資料空間,並請歐盟執委會說明各產業領域資料空間的進展及未來需要採取的必要措施。[7]   根據歐盟執委會2022年2月出版的工作報告指出,所謂的資料空間可以定義為相互信任夥伴間的一種資料關係,參與夥伴在儲存和共享資料時必須適用相同的標準和規則[8]。此外,在資料空間中,資料並非中心化儲存,而是儲存在其來源處,只有在必要時才會透過語義互操作性(semantic interoperability)共享資料[9]。而「歐洲共同資料空間」將根據以下的原則進行設計[10]: 1.資料控制(Data control)   資料空間可以促進資料工具的開發,以彙集、近用、使用、共享各種類型的資料。資料持有者可使用這些資料工具,簡化資料上傳的流程、授予或撤銷其資料授權、更改資料近用權限等。 2.治理(Governance)   建立適當的治理結構,確保以公平、透明、符合比例、非歧視的方式,近用、共享、使用資料,此治理結構應遵守歐盟現有的相關規範,如《非個人資料自由流通框架(Framework for the Free Flow of Non-Personal Data in the European Union)》、《歐盟一般個人資料保護規則(GDPR)》、等。 3.尊重歐洲的規範和價值觀(Respect of EU rules and values)   資料空間應遵守相關的歐盟法律框架,如GDPR、網路安全、基本權利、環境保護、競爭法、歐盟關於提供資料服務相關的規則等;此外,應採取適當的技術和法律措施,防止未經授權的資料近用。 4.技術基礎設施(Technical data infrastructure)   鼓勵資料空間之參與者使用共通的技術基礎設施,並整合網路安全的設計原則,建構能確保資料彙集、近用、共享、處理、使用之安全和隱私保護的基礎設施。 5.互連接性及互操作性(Interconnection and interoperability)   為避免資料碎片化(fragmentation)、整合成本過高、產生資料孤島等問題,「歐洲共同資料空間」參考國際標準、歐洲空間資料基礎設施(INSPIRE[11]) 、FAIR原則[12],強化資料空間的互操作性,並透過歐盟運算基礎設施[13]共享和近用資料,以達到相互連接和互相操作。 6.開放性(Openness)   只要願意遵守歐盟規範、尊重歐洲價值觀的使用者都可以利用「歐洲共同資料空間」。開放性將有助於創造不同產品和不同服務提供商間的競爭,避免因產品或服務製造商的特定協定(protocols)產生鎖定效應(lock-in)。 三、近期整體發展   首先,歐盟執委會強調,由於「歐洲共同資料空間」涉及各產業領域,每個產業領域都有其特性;即便是同一產業中,所涉及之利害關係人多元,其資料需求也會不同。因此,為避免對特定產業領域正在發展之資料共享解決方案產生影響,歐盟將著重於建立各產業共通的技術基礎設施和資料治理框架[14]。根據2022年5月歐盟正式發布的《資料治理法(Data Governance Act) 》,第六章中規定未來將成立「歐洲資料創新委員會(European Data Innovation Board, EDIB)」;依據該法第30條的規定,EDIB的任務之一是制定促進「歐洲共同資料空間」的指引,內容包含建立跨產業領域資料共享的標準、強化互操作性等[15]。   其次,根據歐盟執委會2022年8月出版的調查報告指出,截至2022年上半年為止,歐盟關於資料空間徵案的結果,主題不僅有最初規劃的9個產業領域[16],還擴及智慧城市、文化資產、媒體、財政、語言、旅遊、公部門採購與安全執法等產業領域[17]。此外,與這些產業領域相關的公部門開放資料集部分已經編目並放在歐盟data.europa.eu[18]的網站上,譬如該網站上目前有48,000筆關於交通運輸的資料集,未來可能對於「交通移動」領域資料空間的建立有幫助[19]。   再者,歐盟執委會為了瞭解歐洲目前所有資料空間的發展現況,以國際資料空間協會(International Data Spaces Association, IDSA)的「國際資料空間雷達(International Data Space Radar)」、歐洲非營利組織所倡議的「歐洲雲和資料基礎架構專案(Gaia-X)」、「歐洲工業數位化開放平臺(Open DEI)」為調查對象。根據研究結果,這3個組織目前共有151個和資料空間有關的計畫或措施,但其中僅只有21個使用了開放資料,且僅19個計畫有公部門參與其中[20]。歐盟執委會認為開放資料社群和各國公部門長期以來,在推動開放資料與建立開放資料標準已經累積一定的經驗,未來可以對「歐洲共同資料空間」提供更多的建議[21]。   最後,歐盟執委會將「歐洲共同資料空間」的利害關係人區分為四大類別,包含核心參與者、中介者、軟體/服務提供商、治理機構,並選定相關人士進行訪談,以聚焦「歐洲共同資料空間」未來的推動方向。根據訪談結果,所有受訪者皆指出目前「歐洲共同資料空間」發展的一個重大問題,亦即缺乏完整的資料集目錄。因此,受訪者建議未來「歐洲共同資料空間」的重點可放在發展資料集目錄[22]。 參、結論   從上述的整理可以發現,歐盟相當有系統性地推動「歐洲共同資料空間」,期待透過不同產業領域資料空間的互相連接,強化資料近用和互操作性,在促進資料共享和使用的同時,亦充分保護個人與企業的資料權利[23]。雖然歐洲各產業領域的資料空間仍在持續發展,但歐盟對於發展資料經濟的政策規劃,不管在基礎設施的建設、標準化的制定、法制面的配套,都值得我國持續關注。 本文同步刊登於TIPS網站(https://www.tips.org.tw) [1] A Digital Single Market Strategy for Europe, at 14-15, COM (2015) 192 final (May. 6, 2015). [2] A European strategy for data, at 4, COM (2020) 66 final (Feb. 19, 2020). [3] id. at 4-5. [4] id.. [5] 關於「歐洲開放科學雲」的介紹可參考蔡立亭 ,〈論臺灣科研資料治理機制推行之模型-以歐洲開放科技雲為例〉,《科技法律透析》,第33卷第5期,頁21,(2021)。 [6] 關於「歐洲健康資料空間」近期的發展可參考施雅薰,〈歐盟執委會發布「歐洲健康資料空間」規則提案,旨在克服健康資料利用之障礙〉,資訊工業策進會科技法律研究所,https://stli.iii.org.tw/article-detail.aspx?no=67&tp=1&d=8858(最後瀏覽日:2022/09/27)。 [7] European Commission, Commission Staff Working Document on Common European Data Spaces 1(2022)。 [8] European Commission, data.europa.eu and the European Common Data Spaces 6(2022)。 [9] id. at 2. [10] European Commission, supra note7, at 3-4. [11] 關於「歐洲空間資料基礎設施」的介紹請參考INSPIRE KNOWLEDGE BASE,https://inspire.ec.europa.eu/(last visited Sep. 26, 2022). [12] Fair原則是可查找(Findable)、可近用(Accessible)、可相互操作(Interoperable)、可再使用(Re-usable) 的英文縮寫,相關介紹可參考GO FAIR,https://www.go-fair.org/fair-principles/(last visited Sep. 26, 2022). [13] 如歐洲雲服務或歐洲高效能運算(HPC)。 [14] European Commission, supra note7, at 4-5. [15] id. at 29-30. [16] 關於這9個產業領域2021-2023年間的規劃進度可參考European Commission, supra note 7, at 41-42. [17] European Commission, supra note 8, at 7. [18] 該網站設立於2021年4月,是整合European Data Portal及EU Open Data Portal兩個網站而成立。 [19] European Commission, supra note 8, at 8. [20] id. at 13. [21] id. at 5. [22] id. at 18. [23] European Commission, supra note 7,. at 2.

日本特許廳利用人工智慧審查專利與商標申請

  日本特許廳(Japan Patent Office,JPO)從去(2016)年12月開始,與NTT Data公司合作,使用人工智慧(Artificial Intelligence,簡稱AI)來系統化的回答有關專利問題,且依成果顯示,與原先運用人力回復的成果相當;JPO因此決定於今(2017)年夏天開始,將AI技術分階段應用於專利及商標的審查案,並期望能於下一會計年度(2018年4月至2019年3月),在審查業務中全面運用AI技術。   JPO指出,透過AI技術能有助於將專利及商標審查程序中繁冗的檢索程序簡化,以專利審查為例,可搜尋大量文件與檔案,進行專利先前技術檢索,以確保相關技術尚未獲得專利保護,同時也可以協助專利分類;此外,商標審查亦可利用AI之圖像辨識技術比對圖片及標誌,找出潛在的類似商標。   AI技術被證實能提升審查效率,並減輕審查人員檢索與比對部份的工作負擔,有助於抑制人工審查的長時間工作型態,根據2017年日本特許廳現況報告(特許庁ステータスレポート2017),於導入AI技術後,原本從申請到審查完成平均約2年左右之審查時間,期望可在2023年將審查期間降到14個月,讓日本成為智慧財產系統審查最快且品質最好的國家之一。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」

中國大陸電子遊戲機內銷管制變革

中國大陸電子遊戲機內銷管制變革 科技法律研究所 法律研究員 蘇彥彰 2014年07月22日   自中國大陸國務院2000年發布「國務院辦公廳轉發文化部等部門關於開展電子遊戲經營場所專項治理意見的通知」起,至2013年12月21日國務院發佈「國務院關於在中國(上海)自由貿易試驗區內暫時調整有關行政法規和國務院文件規定的行政審批或者准入特別管理措施的決定」為止,中國大陸長期以來嚴格執行其境內的「遊戲機內銷禁令」,一方面限縮了中國大陸遊戲機市場的發展,另一方面也使手機、網路遊戲得以在中國大陸地區崛起。如今遊戲機禁令逐步鬆動,是否會帶動整體遊戲市場洗牌,值得關注。為此,以下回顧中國大陸近年來就家用、掌上型遊戲機的管制政策沿革,並提示逐步開放過程間可能出現的變化和問題。 壹、中國大陸自2000年起長期禁止電子遊戲主機的國內銷售   中國大陸國務院於2000年發布「國務院辦公廳轉發文化部等部門關於開展電子遊戲經營場所專項治理意見的通知」,當中明白表示「任何企業、個人不得再從事面向國內的電子遊戲裝置及其零、附件的生產、銷售活動」,此一決定造成風行於世界其它國家地區的家用、掌上型遊戲主機,在中國大陸遊戲市場喪失其合法性[1]。當時中國大陸官方就管制家用遊戲機政策所提出的理由是其「擾亂了社會治安秩序、對青少年的身心發展帶來潛在傷害」。   然事實上中國大陸對於可能同樣對青少年造成影響的網路遊戲,不僅未加以禁止,反而將其列為重點產業大力扶植,此一作為明顯和禁止電子遊戲主機內銷理由相矛盾。因此長期以來各大主力電子遊戲機廠商,如索尼、微軟、任天堂等,仍一直試圖以各種方法打入中國市場,並呼籲中國大陸政府開放對內銷售電子遊戲主機[2]。 貳、2013年宣布於上海自貿區內重新開放電子遊戲機之內銷   中國大陸對電子遊戲主機的禁令在持續13年後,在2013年9月18日中國國務院發布的「中國(上海)自由貿易試驗區總體方案」中,終於提出允許外資企業在自貿區從事遊戲設備的生產和銷售。此後,僅隔五天上海文廣新聞傳媒集團旗下的百視通便宣佈將與微軟在自貿區合資組建公司,宣稱主要業務是「設計、開發、製作遊戲、娛樂應用軟件及衍生產品;銷售、許可、市場行銷自產和協力廠商的遊戲、娛樂應用軟體;遊戲機相關技術諮詢和服務」[3]。緊接著在2013年12月21日國務院再發佈「國務院關於在中國(上海)自由貿易試驗區內暫時調整有關行政法規和國務院文件規定的行政審批或者准入特別管理措施的決定」,正式宣佈在自貿區內停止實施「遊戲機禁令」。至此,自貿區的遊戲機銷售大門正式向投資者開放。 參、電子遊戲機於中國大陸市場可能面對的問題   在前述微軟案例中,其採取的方式是透過合資模式進入中國大陸市場,有論者指出,之所以如此,主要原因在於上海自貿區仍是「禁止外商投資經營網路資料中心業務」。因此,對於微軟而言,仍需倚重百視通成熟的資料中心業務和機上盒業務牌照,以作為其在中國大陸地區網路服務的內容提供主體。除了前揭百視通宣佈將與微軟在自貿區合資組建公司外,另外兩間在電子遊戲機市場上佔有巨大版圖的索尼(SONY)和任天堂(NINTENDO)目前雖然還無具體動作,但業界人士預計這兩間在遊戲機產業界具有舉足輕重地位的公司,很有可能仿照百視通與微軟合資的模式,尋找具有中國境內相關執照的廠商合作,進入中國大陸市場。   另一方面,由於2014年6月底最新公布的上海自貿區「負面清單」[4]中,仍然明確規定自貿區內外商「禁止直接或間接從事和參與網絡遊戲運營服務」。由於遊戲機上遊戲目前已朝向具有網路連線功能趨勢發展,此類遊戲若經有關部門歸類為網路遊戲,由於外商不得直接或間接進行遊戲的營運,因此將為中國大陸國產遊戲軟體業者留下相當大的發展空間,可據以抵抗技術實力和知名度兼具的外商國際遊戲軟體大廠;反之若此類具網路連線功能的單機遊戲不在中國大陸網路遊戲營運資格之限制範圍內,外商可直接或間接介入經營,對於目前仍處於「全本土化」的中國大陸網路遊戲產業,勢必會帶來相當的衝擊和競爭。   此外,中國大陸雖然放鬆對電子遊戲主機的內銷管制,但對於關鍵的遊戲軟體,由於中國大陸對出版境外著作權人授權的電子出版物(含網路遊戲作品),仍需由新聞出版廣電總局進行內容審查[5],對於有意進入中國大陸電子遊戲機市場的企業,如何推出能通過內容審查卻又不失遊戲性的遊戲軟體,並讓長期以來已習慣於「低價」甚至「免費」網路遊戲的中國大陸消費者買單,都是相關產業有待克服的問題。 [1]蓝齐,〈国务院禁令解除游戏机成客厅娱乐新力量〉,《IT时代周刊》,2014年3期。 [2]徐涵,〈13年禁令一夕难解 游戏3巨头苦盼中国市场开放〉,《IT时代周刊》,2013年3期。 [3]诸悦,〈游戏机,“行货”来了〉,《小康。財智》,2013年10期。 [4]《中国(上海)自由贸易试验区外商投资准入特别管理措施(负面清单)(2014年修订)》(上海市人民政府公告2014年第1号)。 [5]《国务院对确需保留的行政审批项目设定行政许可的决定》(国务院令第412号2004.06.29)。

TOP