合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2025/11/30)
引註此篇文章
你可能還會想看
歐盟將擬訂關鍵促成技術(Key Enabling Technologies)促進總策略

  因為生物科技(Biotechnology)、奈米科技(Nanotechnology)、微(奈)米電子與半導體(Micro- and nanoelectronics, including semiconductor)、光電(Photonics)、及先進材料(Advanced materials)等五大科技,能夠被廣泛的應用在各種產業上,並可協助現有科技作出重大的改善,故在2009年9月歐盟委員會(European Commission)所公布的一份溝通文件(Communication)當中,被認定為是可以加強競爭力,並協助經濟永續發展的關鍵促成技術(Key Enabling Technologies, KETs)。   在該份名為「為我們的未來做準備:發展歐洲關鍵促成技術促進總策略」(Preparing for our future: developing a common strategy for key enabling technologies in the EU)的文件中,歐盟委員會指出,KETs的技術外溢效益和其所能產生的加成效果,可以同時提昇其他領域的表現,如通訊技術、鋼鐵、醫療器材、汽車、及航太等領域,故將對歐盟地區未來的經濟永續發展有著重大的影響,也可以協助面對社會與環境的重大挑戰。   該文件指出,雖然歐盟擁有許多KETs的相關研發成果,對促進研發成果產業化之措施卻有所不足。在此溝通文件中所規劃的發展策略,配合歐盟持續的在研發作出更多的投資,將會協助歐盟充分應用這些可提高歐盟未來競爭力的KETs。   因為KETs的推展須注意系統性的相關聯性,所以數個不同的政策必需被同時考慮。在溝通文件中提出了十項應被考慮的面向,包括(1)將研發政策專注於KETs;(2)促進境內產學研單位間以及產業供應鏈間的技術移轉;(3)促進歐盟與會員國間發展共同的策略方案和操作專案;(4)運用各會員國境內之補助政策;(5)結合KETs的應用與氣候變遷政策;(6)創造市場需求並配合公共採購;(7)與國際間高科技政策相比較並加強國際合作;(8)透過雙邊或多邊貿易談判創造KETs有利的貿易條件;(9)促進歐洲投資銀行(European Investment Bank, EIB)給予高科技產業優惠貸款;以及(10)透過高等教育與在職訓練提昇技術水準。   歐盟委員會將會建立一個獨立的高階專家團體,去繪製歐盟有關各KETs的長期策略藍圖,並將於2010年年底向部長會議(Council of Ministers)報告。

歐盟電信法規改革案將於2008年09月完成最終投票

  對於歐盟執委會(European Commission)所提出的「歐盟電信法規改革案」,歐洲議會(European Parliament)下之歐盟產業、研究暨能源委員會(Industry, Research and Energy Committee ,ITRE)及內部市場消費者保護委員會(Internal Market and Consumer Protection Committee ,IMCO)已於2008年7月9日對相關議題進行投票,此兩委員會之投票對於該案內容之修整具有重大意義,惟須至9月3日歐洲議會完成全員的最終投票,屆時始揭曉此改革案內容之全貌。     由於歐洲目前具有支配力的通訊公司仍支配主要通訊市場,市場競爭面臨瓶頸,消費者的選擇也隨之下降;此外,各國間欠缺一致性規範,阻礙跨國經營及泛歐普及服務,業者亦無法面對來自歐洲外的競爭勢力,因此本改革案旨在建構通訊無國界之歐洲單一市場,歐盟執委會提出建議的主要內容包括:(一)通信費率及合約透明化,使消費者能充分選擇,縱使在一日間亦得自由轉換服務,也能在不同地點依較便宜價格選擇通訊業者,;(二)為促進競爭,對於具市場支配力量之業者,得採取「功能分離」(functional separation)措施,即將網路基礎設施與提供服務兩者分離;(三)利用新的通訊裝備來阻擋垃圾郵件及電腦病毒;(四)增加對網路基礎設施的投資,擴大能利用寬頻的區域,尤其是加強農業區域的通訊建設;(五)設置歐洲獨立的通訊管制機關,以強化各國通訊管制機構的合作。

2023年日本著作權法修訂之相關規範

2023年5月17日,日本國會通過了《著作權法》部分條文修正案,並於同月26日公布(2023年第33號法)。 隨著數位化的進步,內容的創作、傳播和使用變得更加容易,不再只是過去主流的出版社、電視台等「專業人士」才能從事,而是一般普羅大眾也可以參與創作,並將內容貼在網路上。與此同時,既有著作之重新利用的需求等情形均日益增加,然而此類內容的問題在於難與著作權人取得聯絡,不一定可順利使用。 為了解決上述問題,本次修正重點之一係新增第67之3條,根據該條規定,儘管著作之利用人採取了確認著作權人授權意願等措施,但仍無法確認著作權人授權意願時,得向文部科學省所屬之文化廳申請裁定,經文化廳長裁定允許利用並繳納補償金後,利用人得於該裁定所定之期間內(申請書所載之期限最長不得超過3年)先行使用該著作。新裁定利用制度放寬了確認著作權人意願之程序與要求,降低使用門檻,並同時規定著作權人可聲請撤銷使用,如果文化廳長裁定撤銷使用,則利用人應停止繼續使用該著作,著作權人得依利用人實際使用期間之比例領取補償金。另為簡化及加快程序,關於新裁定利用制度之申請受理、要件確認與補償金額的決定等部分事務,文化廳長得指定特定之民間機構作為聯絡窗口負責相關行政手續之處理(第104條之33以下相關規定)。 新裁定利用制度的建立,將有助於促進著作之流通利用,即認為已充分週知著作權人,且盡可能地確認著作權人等是否可以使用的意思,仍不能確認意思狀態之著作,而採取一定措施放寬使用是妥適的。因考慮到週知等需要時間,乃決定從公布日(2023年5月26日)起3年內施行。 本文同步刊登於TIPS網(https://www.tips.org.tw)

FCC主席Julius Genachowski警告美國恐有頻譜危機

  美國聯邦通訊傳播委員會(Federal Communications Commission, FCC )主席Julius Genachowski表示,美國政府正努力規劃商業用途頻譜(spectrum)供給量,以滿足通訊科技服務發展需求。惟諸多產業專家預測無線通訊服務運用導致頻寬需求快速增加,無線通訊擁塞情況恐將嚴重惡化。   儘管FCC已藉頻譜拍賣釋出不少頻譜,且2009年6月全美廣電數位化後(DSO),一定要件開放業者毋須取得頻譜執照便可使用所謂的「閒置頻譜」(interleaved/white space),但是頻譜匱乏的問題仍無法解決。   對此,FCC允諾將會弭平頻譜供給需求間的落差,並且列為FCC的首要任務之一。未來FCC將透過非商用頻譜重分配與鼓勵發展更有效率使用頻譜之科技,以期解決頻譜不足的窘境。   產業界與公眾安全通訊相關組織呼籲FCC應提供更多頻譜供無線通訊服務使用。不過FCC亦要求資通訊產業於研發行動寬頻新產品時,須設想頻譜供給不足,研發更有效率使用頻率的通訊技術。產官學三者間,必須相互配合與協調(尤其是業者間的「不歧視原則」),方能有效解決網路通訊擁塞及頻譜匱乏問題。

TOP