「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
美國「音樂現代化法案」(Music Modernization Act,簡稱 MMA) 於2018年10月由總統川普簽署成為有效法律之後,於今年(2019)9月17日正式對外發布消息,其依照MMA之規定,美國著作權局已於今年7月8日指定由「美國音樂發行協會」(National Music Publishers Association,簡稱NMPA)成立「機械式集體授權組織」(The Mechanical Licensing Collective,簡稱MLC)。NMPA係全美音樂發行商之貿易協會,早於1917年運行至今,現被指定成立MLC,擬於2021年1月正式開始進行全美音樂之「概括授權」(blanket license),並維運前所未有的「透明化資料庫」,期能對接音樂串流平台,促使音樂作品比對相關著作權之權利人,藉以有效率且準確地支付相關授權金給詞曲創作人和發行人,且串流平台業者只要確實遵守MMA之概括授權與MLC之運作方式,即免於侵權責任MLC之組織體編制與人員名單資訊,亦透明地揭示於官網,其設有MLC董事會(由BMG、SONY、華納音樂等背景之人員擔任),以及「無人認領授權金監督委員會」、「爭端解決委員會」、「營運顧問委員會」等三個委員會,各委員均由音樂著作權人或詞曲創作等人擔任。 MMA立法之初,試圖創設一全新、單一窗口非營利組織,並建置符合現代科技的數位資料庫,來解決音樂授權的痛點。而今MLC即將於後年1月正式運行,在數位時代借力科技,帶領音樂授權邁向新里程碑!
世界智慧財產權組織發表2020年全球創新指數報告世界智慧財產權組織(World Intellectual Property Organization, WIPO)於2020年9月2日發表「2020年全球創新指數報告」(Global Innovation Index 2020, GII 2020),報告中比較131個經濟體之最新全球創新趨勢。GII為一年一度發行之報告,除了比較不同經濟體的創新指數外,每年會挑選不同創新議題進行深度研究,2020年研究主題為「誰投資創新?」(WHO WILL FINANCE INNOVATION?)。 GII的報告評比,區分為七大指標分別為:組織機構(Institutions)、研發與人力資源(Human capital and research)、基礎建設(Infrastructure)、市場成熟度(Market Sophistication)、企業成熟度(Business sophistication)、知識技術產出(Knowledge and technology outputs)以及創意產出(Creative outputs)。其下再區分為21個次標和80個小標例如政府效能(Government effectiveness)、法規範環境建構(Regulatory environment)、教育支出占GDP比例、外國學生比例、R&D支出占GDP比例、生態永續度、高科技出口、資通訊服務出口等。2020年評比全球創新指數最高的10個國家排名分別為:瑞士、瑞典、美國、英國、荷蘭、丹麥、芬蘭、新加坡、德國和南韓,均為高所得國家;這也是南韓第一次躋身進入前10名。 另外報告中亦說明,2020年COVID-19大流行引發前所未有的經濟停滯。在COVID-19爆發之前,研發支出成長明顯快於全球GDP成長,創業投資(Venture capital)和IP應用達到高峰,但疫情發生的現階段全球經濟成長大幅度下降。然而經濟成長停滯之下,突破性技術創新的潛力仍在繼續存在,例如許多仍保有現金流的大型ICT企業仍持續推動數位創新,製藥技術與生物科技產業的研發支出大量增加,健康產業研發也受到重點關注。此外,COVID-19危機亦會促進傳統產業(例如旅遊、教育和零售等)之創新,以及改變企業在本地或全球之生產工作組織方式。而在各國政府為忙於制定緊急救濟計畫(emergency relief packages),以緩解地域封鎖所造成的負面影響和經濟衰退的同時,這些緊急救濟計畫對新創公司之融資多半不夠明確,到目前為止,各國政府並沒有創新研發作為當前刺激經濟計畫中的優先事項(priority)。 報告中針對「誰投資創新?」之主題,統計數據顯示創新金融(Innovation finance)雖然受疫情影響有所下降,但金融體系尚屬健全。惟資助新創企業的資金正在枯竭(drying up),北美、亞洲和歐洲地區的創業投資交易也急劇下降,幾乎看不到首次公開發行(IPO)。即使是倖存下來的新創公司,其盈利能力和對創投者(Venture Capitalist)的吸引力也在下降。也因為疫情影響,創投者減少對創新、小型和多元化的新創事業提供資金,取而代之關注所謂的「大型交易」(mega-deals),也就是資助大型企業的發展,並將投資領域轉向健康、線上教育(online education)、大數據、電子商務和機器人科技。此外,報告中亦說明近期創投多半集中在可以短期得到報酬的創新事業,例如資通訊軟體及服務、消費性產品服務、金融商品等,取得創投機構大量資金。相較之下,若研發較為複雜的前瞻科學技術,反而取得之資金較少;同時COVID-19惡化此現象,使研發期較長之產業和企業面臨更嚴峻的財務限制。
歐盟執委會提出「具可信度之人工智慧倫理指引」歐盟執委會人工智慧高級專家小組(High-Level Expert Group on Artificial Intelligence)於2019年4月8日公布「具可信度之人工智慧倫理指引」(Ethics Guidelines For Trustworthy AI)。該指引首先指出,具可信度之人工智慧需具備三個關鍵特徵:(1)合法(Lawful):應遵守所有適用於人工智慧之法規;(2)合乎倫理(Ethical):確保人工智慧符合倫理原則與價值;(3)健全(Robust):自技術與社會層面觀之,避免人工智慧於無意間造成傷害。 該指引並進一步指出人工智慧應遵守以下四項倫理原則: (1) 尊重人類之自主權(Respect for Human Autonomy):歐盟之核心價值在於尊重人類之自由與自主,與人工智慧系統互動之個人,仍應享有充分且有效之自我決定空間。因此,人工智慧之運用,不應脅迫、欺騙或操縱人類,人工智慧應被設計為輔助與增強人類之社會文化技能與認知。 (2) 避免傷害(Prevention of Harm):人工智慧不應對人類造成不利之影響,亦不應加劇既有的衝突或傷害。人工智慧之系統運行環境應具備安全性,技術上則應健全,且確保不會被惡意濫用。此外,弱勢族群應於人工智慧運用中受到更多關注,並被視為服務對象。 (3) 公平(Fairness):人工智慧系統之開發、布建與利用,必須具備公平性。除了透過實質承諾與規範,進行平等與公正之利益與成本分配外,亦須透過救濟程序確保個人或特定族群不受到歧視與偏見之侵害,並可對人工智慧之自動化決策結果提出質疑,且獲得有效之補救。 (4) 可解釋性(Explicability):人工智慧應盡量避免黑箱(Black Box)決策,其系統處理程序須公開透明,並盡可能使相關決策結果具備可解釋性,分析特定訊息可能導致之決策結果,此外亦需具備可溯性且可接受審核。
強制蒐集人體生物資料的人權標準-聯合國人權事務委員會的見解