「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
歐盟委員會與美國白宮於2022年3月25日發布聯合聲明,宣布雙方已就新的跨大西洋資料傳輸框架達成原則性協議。此舉旨在因應2020年7月歐盟法院(Court of Justice of the European Union)於Schrems II案的判決中宣告「歐盟—美國隱私盾協定」(EU-US Privacy Shield Framework)不符合歐盟一般資料保護規則(General Data Protection Regulation, GDPR)而無效。依照該聯合聲明,新的框架將在雙方間資料流動的可預測性、可監督性、可信賴性以及可救濟性等方面進行補強,以充分維護公民的隱私與自由權利。 目前,該框架仍處於原則性協議的階段,具體細節仍有待後續談判。聯合聲明指出,美國在下列三個方面做出了「重大承諾」: 加強控管美國的情報活動,以確保所追求國家安全目的適法,且所採取的手段係在必要範圍內,而未過度侵犯公民的隱私與自由。 建立具有約束力且獨立的多層次救濟機制,其中包含一個由非政府人員所組成的「個人資料保護審查法院」,並賦予該組織完全的審判權。 針對情報活動強化分層且嚴格的行政監督機制,以確保其合乎隱私與自由的新標準。 上述原則性協議的達成,表面上無疑是一項好消息,將有助於解決雙方跨境資料傳輸的法源爭議,並避免持續演變成嚴重的歐美貿易爭端。然而,美國政府能否順利將新框架轉化為具有約束力的國內行政命令,仍存在相當多的不確定因素。若結果為否,則最終亦難以達成取得歐盟根據GDPR所為「適足性認定」(adequacy decision)的政策目標。
敏感科技保護「敏感科技」的普遍定義,係指若流出境外,將損害特定國家之安全或其整體經濟競爭優勢,具關鍵性或敏感性的高科技研發成果或資料,在部分法制政策與公眾論述中,亦被稱為關鍵技術或核心科技等。基此,保護敏感科技、避免相關資訊洩漏於國外的制度性目的,在於藉由維持關鍵技術帶來的科技優勢,保護持有該項科技之國家的國家安全與整體經濟競爭力。 各國立法例針對敏感科技建立的技術保護制度框架,多採分散型立法的模式,亦即,保護敏感科技不致外流的管制規範,分別存在於數個不同領域的法律或行政命令當中。這些法令基本上可區分成五個類型,分別為國家機密保護,貨物(技術)之出口管制、外國投資審查機制、政府資助研發成果保護措施、以及營業秘密保護法制,而我國法亦是採取這種立法架構。目前世界主要先進國家當中,有針對敏感科技保護議題設立專法者,則屬韓國的「防止產業技術外流及產業技術保護法」,由產業技術保護委員會作為主管機關,依法指定「國家核心科技」,但為避免管制措施造成自由市場經濟的過度限制,故該法規範指定應在必要的最小限度內為之。
美國參議院提出促進生技學名藥競爭法案生技藥品是植基於活體生物的原理所開發出來的治療藥品,自第一批生技藥品上市以來,其專利在最近幾年已陸續到期,因此生技業者對於推出這些生物製品的學名藥版本(generic versions of biologics,以下簡稱生技學名藥),躍躍欲試。然而,美國當前的學名藥法規—藥品價格競爭及專利回復法(Drug Price Competition and Patent Restoration Act, 又名Hatch-Waxman Act, HWA),乃是針對化學藥品的學名藥版本所制定的法規,此類學名藥與生技學名藥並不相同,因此既有的學名藥法規並不能適用於生技學名藥,生技業者無不引頸企盼政府部門通過新的法規,以使生技學名藥儘速上市。 美國參議院最近提出一項生技學名藥法案—生技製品價格競爭與創新法(Biologics Price Competition and Innovation Act, BPCIA),一如HWA,BPCIA的內容也呈現出各種利益折衝的色彩,法案一方面賦予FDA對生技學名藥進行審核的新權限,並藉由減少臨床試驗之進行,加速生技學名藥的上市;另一方面,為避免低價的生技學名藥會對品牌藥的銷售產生衝擊,法案也有針對生技研發公司的研發誘因設計,以鼓勵其持續投入資金,開發更多的生技治療藥品。未來生技學名藥廠需要配合FDA所規劃的風險管理計劃(該計劃的相關立法目前尚待眾議院審議),故生技學名藥廠於其生技學名藥上市後,仍有進行臨床試驗之義務。 法案中最具爭議的條文在於,究竟應給予生技研發公司多長的銷售獨家銷售權(market exclusivity),始得允許生技學名藥廠加入市場競爭,生技研發公司與生技學名藥廠對此的歧見甚大,前者主張十四年,後者則認為五年的時間已足,目前法案訂為十二年。另一個不易處理的議題,則是藥師如何處理此類的生技學名藥,根據目前的法案內容,未來藥師亦可不經徵詢醫師而以生技學名藥代替之。
美國Six Strikes系統成為打擊音樂、影視網路盜版的利器?!為杜絕網路盜版行為,美國AT&T、Verizon、Cablevision、Time Warner Cable及Comcast等主要網路服務提供者共同推動著作權警告系統(Copyright Alert System, CAS),亦稱為Six Strikes系統。該系統可用在舉發透過P2P違法下載音樂、電影、電視節目盜版的網路使用者,而舉發盜版者之業務係委由MarkMonitor公司執行。 但最近MarkMonitor公司在執行舉發著作權侵權嫌疑者的業務過程中,卻發生誤認某一著作權人的合法網站為侵權網站,並通報Google要求刪除的烏龍事件。2013年2月3日MarkMonitor公司代替HBO公司在Google上檢索確認有侵害「Eastbound and Down」節目著作權的可疑網站,並且要求Google根據DMCA規定發出刪除通知。但是,MarkMonitor公司在舉發侵權過程中,除搜尋到著作權侵權網站的URL網址,甚至連HBO營運的8個官方網站和其它針對「Eastbound and Down」節目內容討論的網站如Perez Hilton、Hitfix,以及單純刊登新聞社論的網站等合法網站,均接受到DMCA的刪除通知。此一事件發生後,不僅讓被誤認的合法網站和HBO所屬網站的合法著作流通遭受損害,同時也讓各界質疑MarkMonitor公司的DtecNet軟體自動舉發盜版的成效,亦質疑在沒有其它監督機構的情況下,MarkMonitor公司的系統仍有可能發生誤判的情形。 雖著作權資訊中心(Center for Copyright Information, CCI)獨立顧問Stroz Friedberg表示DtecNet軟體準確性及穩定性應無問題,但是外界認為Stroz曾是美國唱片協會(RIAA)的國會遊說者(lobbyist),亦是著作權警告系統的創立成員之一,其說法公正性令人存疑。再者,若無第2個獨立機構監督MarkMonitor的系統運作,將來正式利用此一軟體舉發Bittorrent使用者時,合法網路使用者難以避免地有被誤認為侵權者之虞。因此,未來該系統運作成效及發展情況仍有待繼續關注。