合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?no=64&tp=5&d=8532 (最後瀏覽日:2024/04/28)
引註此篇文章
你可能還會想看
印度對TK( Traditional Knowledge傳統知識 )保護提出的建議修正案

  近年來許多先進國家的藥廠或是生技公司紛紛到生物資源豐富的國家從事生物探勘活動,希望可以尋找合適的生技產品候選者 (candidate) ,也因此產生許多不當佔有的生物盜竊 (biopiracy) 事件。   由於印度本身在 2002 年專利法修正時,特別規定生技發明之專利申請者若使用生物物質 (biological material) ,應揭露其地理來源 (source of geographical origin) ,未揭露其來源地或提供錯誤資訊者,則構成專利撤銷之理由; 2005 年的專利法修正的重點之一為「加強專利授予前異議 (pre-grant opposition) 機制」,意即未揭露生物物質之來源地或提供錯誤資訊者,或者申請專利之權利內容含有傳統知識者,可提出異議之事由。   目前國際間針對是否應強制規定申請人應揭示其來源地等仍無共識。從 2001 年的杜哈發展議程的談判會議結果即可知,由於該談判採取 「單一承諾( Single Undertaking )」模式且可從不同議題間相互掛勾,加上開發中及低度開發會員採取結盟方式來壯大談判立場,在某些關鍵議題與美國、歐盟等主要會員國形成抗衡局面。 開發中國家對於 TRIPs 第 27 條第 3 項 b 款的審議特別在乎,認為 TRIPs 協定應該修訂應納入上述的揭露需求外,還必須提供事先告知且同意 (prior informed consent) ,以及因該專利而獲取的利益與來源地分享之證明。   因此,印度提出修正 TRIPs 協定的建議,強制會員國必須改變內國法律,規定專利申請者必須揭露其發明所使用的生物物質來源,並希望能在今年 12 月香港部長會議裡討論。

美國眾議院發布反壟斷五大法案,恢復數位市場競爭並防堵科技平台壟斷

  美國眾議院反壟斷委員會於2021年6月11日宣布五大反壟斷立法議案,目標是透過立法提升消費者、勞工和中小企業競爭空間,防止大型科技平台壟斷數位市場。2019年美國國會反壟斷委員會調查互聯網巨頭Amazon、Google、Facebook、Apple(GAFA)涉嫌濫用市場支配地位進行壟斷、抑制競爭、侵害用戶隱私、破壞新聞出版多元化。2020年10月發布《數位市場競爭調查》(Investigation of Competition In Digital Markets)強調恢復數位經濟市場競爭力重要性。2021年美國眾議院隨即提出五大反壟斷改革法案具體落實政策方向。 終止平台壟斷法案(Ending Platform Monopolies Act) 防止占主導地位的平台利用其對多個業務的控制能力,由董事或受託人持有公司25%以上的股票、盈利或資產,或以其他方式掌握實質控制權,要求用戶使用其平台購買產品或服務進而取得優勢地位。 美國選擇與創新線上法案(American Choice and Innovation Online Act) 禁止平台的歧視行為,包括使自家產品、服務及業務在平台上享有對手沒有的競爭優勢,禁止自我偏好或歧視其他同類業者之行為。 平台競爭與機會法案(Platform Competition and Opportunity Act) 禁止具獨占優勢平台藉由收購其他具競爭力對手,以擴大或鞏固線上平台市場力量。 透過啟動服務交換強化相容性和競爭力法案(Augmenting Compatibility and Competition by Enabling Service Switching Act) 透過啟動服務交換,滿足互操作性和資料可攜性,降低企業和消費者進入壁壘與轉換成本,使資料更容易移動到其他平台。 併購申報費現代化法案(Merger Filing Fee Modernization Act) 提高企業向政府申請併購案之審議費用,例如超過50億美金以上併購案審議費用從美金28萬提升至225萬,確保美國司法部和聯邦貿易委員會執行反壟斷資源。

全美達向英特爾提出專利訴訟Transmeta files suit against Intel

  加州,聖荷西(San Jose)-雖然已於去年(2005)放棄以x86為基礎之微處理器業務,全美達(Transmeta Corp.)日前宣告英特爾(Intel Corp.)侵害其專利權,並且已經對英特爾提起訴訟。   全美達向美國Delaware地方法院提起訴訟,主張英特爾侵害全美達多達10項的專利權。根據全美達表示,這些專利涵蓋了電腦架構以及電源效能技術。此外,該訴訟案指控英特爾藉由製造以及販賣多種微處理器產品而已經侵害或正在侵害前述之專利權,該等微處理器產品至少包含英特爾的Pentium III、Pentium 4、Pentium M、Core以及Core 2等產品線。並且,全美達請求法院禁止英特爾繼續銷售侵權產品,並提供金錢賠償,包括為侵權產品支付合理的專利費、三倍的賠償金和律師費。   全美達執行副總裁John O'Hara Horsley表示,全美達已經發展出完整且強大的智慧財產權組合,以掌握並且保護發展微處理器技術的重要資產。此外,John O'Hara Horsley也表示,英特爾在主要處理器產品線中使用了不少全美達的創新技術,該公司是在向英特爾要求合理授權費卻失敗之後,決定走上法律程序。

美國國會提出打擊專利蟑螂的研究報告

  專利蟑螂(Paten Troll)與非專利實施實體(Non-Practicing Entity, NPE)乃係本身不進行任何生產製造或產品銷售,藉由購買專利權(少數亦自行研發),以專利授權或專利訴訟為主要手段,對其他公司啟動專利攻擊,進而收取授權金或賠償金為營利目標之公司總稱。NPE約自2001年開始出現迅速成長,2011年因NPE專利訴訟與授權所造成的花費高達290億美金,較2005年的70億美金成長400%,而其中僅有不到25%是用於研發創新,超過25%用於訴訟。   美國國會智庫機構,國會研究處(Congressional Research Service, CRS)於今年(2012)8月20日發表「專利蟑螂爭議概要」(An Overview of the "Patent Trolls" Debate)研究報告,分析專利蟑螂的行為及其影響,並提出改善方法及建議:   一、建議限制資訊科技的專利保護,然而此舉可能違反WTO下TRIPS之規定(Agreement on Trade-Related Aspects of Intellectual Property Rights)。   二、許多專利蟑螂與NPE利用專利申請得提出延續案(Continuation),延長專利審查的保密期間。使得他公司可能在不知情下使用該專利而造成侵權。因此建議取消申請中專利提出延續案,並適度公開申請中專利案資訊。   三、限制專利蟑螂與NPE申請美國ITC(International Trade Commission)的禁制令,取消專利推定效力,或改變專利授權金計算方式等。   四、縮短專利權期間或增加專利之維持費。   五、仿效商標法上放棄(abandonment)/怠於行使(laches)商標權之抗辯,對於長期未實施之專利,原告需負舉證責任,證明其有進行該專利之研發、商品化或授權。   六、建議專利轉讓或授權皆應強制公開,以促進市場效率。

TOP