合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=64&tp=1 (最後瀏覽日:2025/12/10)
引註此篇文章
你可能還會想看
90億基金挹注 生技業添活水

  為推動國內生技業發展,行政院開發基金審核通過90億元成立三種「生技創業種子基金」,今年將開始運作,希望發揮拋磚引玉功能,吸引異業的大型民間資金投入生技產業。而為加強BIO-IT跨領域異業科技整合,行政院近期內還要推動Mega Fund大型基金參與,建構台灣成為亞太地區最活躍的生技重鎮。   生技產業被公認為21世紀的明星產業,台灣也列為兩兆雙星產業發展計畫的重點推動項目,並提出具體執行策略與願景目標,以建構台灣為擁有亞洲區最活躍的生技創投產業、基因體研究重鎮、人體臨床試驗中心與亞熱帶花卉王國,成為國際生技與製公司進入亞洲市場的重要門戶。   不過行政院科技顧問組在立法院科技與資訊委員會備詢時指出,台灣現雖已有223家創投公司,其中61家近三年正逐漸將生技納入投資組合。可是國內的投資人對研發型生技產業仍瞭解不夠,投資在生技創投資金雖有增加,著重投資於國內技術移轉及產業化過程中的草創期資金缺口,但行政院開發基金日前已通過三個「生技創業種子基金」,金額90億元,卻還沒有開始運作,異業的大型民間資金也還沒有進入生技產業。   為強化生技政策與資源統籌,行政院決定今年設立「生技產業策略諮議委員會」,替台灣生技產業未來方向作整體評估與規劃,並引導國際聯盟的佈局。

美國第三州!科羅拉多州正式通過《科羅拉多州隱私法》

  美國科羅拉多州州長於2021年7月正式簽署《科羅拉多州隱私法》(Colorado Privacy Act, CPA)草案,科羅拉多州正式成為美國第三個制定全面性隱私專法的州,該法將於2023年7月1日施行。   隨著全球化及科技快速發展,以及大數據的應用趨勢,資料的蒐集、處理、利用規模及範圍逐漸擴大,全美各地隱私保護規範遍地開花,期待能促使企業在「保護個人資料」與「資料自由流通」及「資料商業運用」中取得平衡。 2018年美國加州首先制定《加州消費者隱私保護法》(California Consumer Privacy Act, CCPA)成為全美第一州級隱私保護專法後,包含華盛頓州、伊利諾州、紐約州等,也都提出各該州級隱私保護法案,而美國維吉尼亞州議會於今年2月通過《消費者資料保護法》(Consumer Data Protection Act, CDPA)法案,並在3月經由州長簽署,正式成為美國第二個擁有隱私保護專法的州,該法預計於2023年1月1日生效。   科羅拉多州於今年6月將CPA草案送交州長簽署後,於7月順利成為第三個通過隱私保護專法的州。一旦CPA生效,消費者除將享有近用權(right of access)、更正權(right of correct)、刪除權(right of delete)、資料可攜權(right of data portability)外;CPA規定在資料控制者對其消費者進行目標式廣告(targeted advertising)、銷售消費者個人資料,或者將對消費者決策產生重大影響時,消費者享有選擇退出權(right to opt out)。   整體而言,儘管 CPA 與CCPA及CDPA規範相似,在隱私保護規範上可能不是特別具有開創性,但CPA反映了美國各州強化隱私保護的趨勢與決心。舉例而言,去(2020)年不僅美國大選結果受矚目,美國各州隱私保護相關公投案,包含《加州第24號提案》、麻州《汽機車機械資料》、密西根州《電子資訊搜索票》及緬因州波特蘭市《臉部辨識禁令》也獲通過。美國在尚未具有統一聯邦隱私保護法下,透過州級隱私立法,保有各州特色並作為各州隱私保護執法依據。

美國上訴法院:行為人不得以「主觀上對犯罪行為之無意識」阻卻著作權之侵害

  在電腦與網際網路普及與便利的今日,只要上網搜尋一些特定軟體,非常容易就能下載侵害智慧財產權的音樂或是影片,這樣的行為當然是非法的,但在美國出現爭議,若未成年人利用電腦非法下載,可否用「不知道這是犯罪行為」來抗辯侵權呢?   美國就發生了這樣的案例,現年22歲Whitney Harper,於2004年被美國唱片業協會(The Recording Industry Association of America,RIAA)控告其使用Kazaa分享軟體,下載阿姆(Eminem)、瑪麗亞凱莉(Mariah Carey)等37首歌曲,並將該37首歌曲透過線上分享軟體讓其他使用者亦得下載,RIAA認為此行為侵害了這些歌曲的智慧財產權,要求Whitney Harper每首歌曲需付750美元懲罰性賠償。   在訴訟中,唱片公司主張,其已於每張CD上貼上警示標籤;而Whitney Harper則抗辯自己不應該負擔如此高的罰款,係因當時她只有16歲,沒有意識到未經授權下載歌曲是違法行為,且認為下載就像利用網路聽收音機節目一樣,應該是免費的,認為自己無罪。   雖然有一些法官支持Whitney Harper的爭辯,不過第五巡迴上訴法院認為,無論Whitney Harper是否知悉其下載音樂之行為係屬違法,只要唱片公司有公告未經授權之重製行為即侵害著作權,與被告Whitney Harper之主觀意識無關。最後第五巡迴上訴法院確認Whitney Harper有罪,並判定 Whitney Harper共需賠償27,750美元。   Whitney Harper不滿其判決結果,向美國最高法院提起上訴,但法院拒絕其上訴。

義大利正式加入歐洲單一專利制度

  歐盟執行委員會宣布義大利於2015年9月30日成為「加強合作系統(enhanced corporation)」的第二十六個會員國,加強合作機制是里斯本條約下的法律工具,且加強合作機制允許九個或更多的歐盟會員國使用歐盟的程序及架構來制訂約束這些會員國的協議。經由加強合作機制規劃來發展新的單一專利制度,義大利成為會員國後即加入單一專利制度,就專利登記來說,因義大利是歐洲第四大市場,但義大利曾經是少數不涉及推動新單一專利框架的歐盟國家之一且曾隨西班牙挑戰單一專利法規的合法性,故這是相當重要的突破。   委員會發言人並表示隨著義大利申請加入加強合作系統,義大利已簽署單一專利法規。西班牙與克羅埃西亞是目前唯二未採用單一專利法規的歐盟國家。單一專利法規提供支持新單一專利制度的法律框架。法規讓參與單一專利國家的所屬企業能藉由向歐洲專利局單一專利申請取得專利保護,而不需要到各個國家單獨申請專利。然而,單一專利保護將只應用於這些已簽署及認可單一專利法院協議及採用單一專利法規的國家。到目前為止有八個國家已認可單一專利法院:奧地利、法國、比利時、瑞典、丹麥、馬爾他共和國、盧森堡及葡萄牙。

TOP