「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。 在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。 英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。 技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
歐盟人工智慧辦公室發布「通用人工智慧實踐守則」草案,更進一步闡釋《人工智慧法》之監管規範.Pindent{text-indent: 2em;} .Noindent{margin-left: 2em;} .NoPindent{text-indent: 2em; margin-left: 2em;} .No2indent{margin-left: 3em;} .No2Pindent{text-indent: 2em; margin-left: 3em} .No3indent{margin-left: 4em;} .No3Pindent{text-indent: 2em; margin-left: 4em} 歐盟人工智慧辦公室(European AI Office)於2024 年 11 月 14 日發布「通用人工智慧實踐守則」(General-Purpose AI Code of Practice)草案,針對《人工智慧法》(Artificial Intelligence Act, AIA)當中有關通用人工智慧(General Purpose Artificial Intelligence, GPAI)之部分,更進一步闡釋相關規範。 本實踐守則草案主要分為4大部分,分別簡介如下: (1)緒論:描述本守則之4個基本目標,包含協助GPAI模型提供者履行義務、促進理解人工智慧價值鏈(value chain)、妥適保障智慧財產權、有效評估且緩解系統性風險(systemic risks)。 (2)GPAI模型提供者:有鑒於GPAI模型對於下游系統而言相當重要,此部分針對模型提供者訂定具體責任。不僅要求其提供訓練資料、模型架構、測試程序等說明文件,亦要求制定政策以規範模型用途防止濫用。另於智慧財產權方面,則要求GPAI模型提供者遵守「歐盟數位單一市場著作權指令」(Directive 2019/790/EC)之規定。 (3)系統性風險分類法(taxonomy):此部分定義GPAI模型之多種風險類別,諸如可能造成攻擊之資訊安全風險、影響民主之虛假資訊、特定族群之歧視、超出預期應用範圍之失控情形。 (4)高風險GPAI模型提供者:為防範系統性風險之危害,針對高風險GPAI模型提供者,本守則對其設立更高標準之義務。例如要求其於GPAI模型完整生命週期內持續評估風險並設計緩解措施。 本守則發布之次週,近千名利害關係人、歐盟成員國代表、國際觀察員即展開討論,透過參考此等回饋意見,預計將於2025年5月確定最終版本。
關於軟體產品的智慧財產權保護建議近期軟體產品(特別是演算法)的智慧財產權保護受到各界廣泛注意,2022年12月美國實務界律師特別撰文對此提出相關智財權保護建議。軟體產品通常涉及演算法,指由人工智慧(AI)和分析組成,用於解決特定問題的一組規則。專利通常被企業預設為保護技術產品的最佳形式。 然而在2014年,美國最高法院在Alice Corp. v. CLS Bank International一案中可以發現將軟體申請專利保護可能存在風險,如:(一)軟體可能被認為是抽象概念(abstract ideas),非專利適格標的,而無法受專利法保護;(二)通常不易主張專利權,或可能在訴訟過程中因舉證責任造成機密資訊揭露等風險。因此該文作者認為難以受專利法保護之演算法、用於基於機器學習或訓練模型的資訊和資料集等軟體資料,亦可考慮透過營業秘密來保護,並提出以下營業秘密管理的建議: 1.員工教育訓練:建議企業可在僱傭的各階段(僱傭時、每年、終止時)採行相關措施、訓練,以減少營業秘密的竊用,及防止未來員工抗辯不知道該資訊是營業秘密。 2.機密標示:建議企業透過此階段審視組織對於機密文件之界定,再透過機密標示配合存取權限設定,協助企業控管與防止機密外流。 3.執行:瞭解需要受管理的營業秘密是什麼以及其為何重要。 4.監控和衡量員工參與度:建議企業採取相關監測機制檢視員工活動,及早發現離職動向與管控營業秘密資訊。 5.避免資訊揭露:建議企業應確保在向消費者或客戶行銷的過程中不洩露營業秘密,或至少採取相關保護措施,如簽訂保密契約。 6.確保資料安全:建議企業可建置網路安全策略、設置密碼、存取限制、外部設備使用下載或儲存限制等管控措施。 綜上所述,對於從事軟體開發的企業,除以專利保護產出成果外,還可從技術本質、後續是否容易主張、是否適合公開等面向,評估搭配營業秘密保護成果。並在選擇以營業秘密保護成果時,採行相關的管理措施避免營業秘密外洩而造成企業損失,包括:劃定需管理的營業秘密、制定員工教育訓練與相關管制措施,如機密標示、權限控管,並可搭配預警機制以便能夠即早發現異常。 本文同步刊登於TIPS網站(https://www.tips.org.tw)
美國專利局授予Chromatin公司獨占植物小染色體權利美國專利局日前核准美國Chromatin公司一項指標性專利,該專利係用在動植物細胞上,作為傳遞媒介的小染色體建構物(construction of mini-chromosomes as vectors for plant and animal cells),與使用基因工程小染色體創造轉基因植物的技術(techniques for creating transgenic plants using engineered mini-chromosomes)。這項專利的重要性並非針對特定的植物品種,而是使Chromatin公司在植物使用小染色體的技術上,取得的獨佔權利。 此項專利的技術最初由芝加哥大學的研究人員所開發,該校將技術專屬授權給Chromatin公司,並允許該公司為了商業目的進行轉授權(sublicense)。該公司在這方面的相關權利上,可謂積極進行佈局,並已經擁有超過40項,包括小染色體設計、傳遞與使用等方面的專利權、專利申請與發明。該項專利所描述的技術,可在植物中同時增添幾個基因(gene stacks),不但可節省研發時間,並可衍生具商業價值的新產品。此外,確認用作植物絲點(plant centromeres)的核酸序列,可使該公司在多種植物品種中,產生穩定的DNA構成物(stably inherited DNA)與小染色體。 Chromatin公司主要業務,為開發與銷售促使整個染色體經設計或經混合,而進入植物細胞之新穎技術。這些經過處理的染色體,在維持對基因表現作精確控制的狀況下,可同時將多功能的基因注入植物細胞中。Chromatin公司利用這些新基因工具來設計與銷售產品,這些產品可賦予植物更多的商業價值,包括改進養分與健康特性,在用途上則包括工業、農業與醫藥產品的開發。