「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
臉書(Facebook)於今年11月底與美國聯邦貿易委員會(FTC)就2009年的隱私權控訴案達成和解。該控訴案指出「臉書欺騙消費者其在臉書上的資訊可以保持隱私,然而卻一再任這些資訊被公開分享與使用」。舉例而言,在2009年12月,臉書改版時未預先通知使用者進行設定,導致使用者的朋友名單被公開。除此之外,擁有全球8億用戶的臉書,允許廣告商在臉書使用者點選廣告時,蒐集其個人身分資訊。另外,縱使臉書的使用者將帳戶刪除,其照片等等影音資料仍能夠被該公司讀取。臉書的這些行為被聯邦貿易委員會指出,這是不公正的詐欺行為(unfair and deceptive)。 聯邦貿易委員會最終與臉書達成和解,未施加任何罰緩,也未指控臉書蓄意地違反任何法規。依照和解內容,臉書必須要在接下來的二十年內,每兩年一次受獨立公正第三人稽核其隱私保護措施。但假設臉書在未來違反了這些和解條款,臉書將被處以每行為每日16,000美元的罰緩。推特(Twitter)以及谷歌(Google)近來也與聯邦貿易委員會達成了類似的協議。 聯邦貿易委員會要求臉書必須要取得使用者「確切的同意」才可以變更其本身的隱私使用設定。比如說,假設使用者設定某些內容只能供「朋友」讀取,臉書就不能夠把這些內容提供給「朋友」以外的人,除非取得使用者的同意。
世界智慧財產組織(WIPO)及經濟合作暨發展組織(OECD)建立公共著作之線上授權機制為促進各國政府和國際組織間之研究資料、新聞報導、資料集(data set)等公共著作於網路自由流通、運用,世界智慧財產組織(World Intellectual Property Organization, WIPO)和經濟合作暨發展組織(Organization of Economic Co-operation and Development, OECD)等多個國際組織經過2年多的合作研究,終於2013年底開發出「創用CC 3.0 政府間組織授權(Creative Commons 3.0 Intergovernmental Organization (IGO) Li-cense,下稱IGO授權)」機制。聯合國教科文組織(United Nations Educational, Scientific and Cultural Organization,下稱UNESCO)亦將其建置之「開放近用著作資料庫(Open Access Repository,下稱OAR)」網站運用IGO授權。 IGO授權係為使特定內容再發行而設計的簡易公開授權程序。IGO授權同樣分為6種授權條件,即為「姓名標示」、「姓名標示-相同方式分享」、「姓名標示-商業性」、「姓名標示-禁止改作」、「姓名標示-非商業性-相同方式分享」、「姓名標示-非商業性-禁止改作」。 2013年12月UNESCO將IGO授權運用至儲存UNESCO之電子書、新聞報導、研究資料等之OAR。UNESCO之OAR係開放給全世界的人可免費下載內容,甚至進行重製、翻譯、改寫等。UNESCO只使用IGO授權中「姓名標示-相同方式分享」條件,若使用者要依其他授權條件使用著作的話,就須向UNESCO取得書面同意。 UNESCO為聯合國所屬組織中第一個對著作採取公開近用政策(Open Access Policy),透過OAR,UNESCO著作流通規模已有顯著增加。未來相關政府間組織之資料開放利用,若逐步地適用IGO授權機制,可預期的是將會有助於擴大公共資料加值利用市場規模。
美國聯邦通訊傳播委員會將表決是否開放閒置頻譜為釐清開放閒置頻譜(white space)予業者使用是否會產生干擾問題,美國聯邦通訊傳播委員會(Federal Communication Commission, FCC)所屬工程科技辦公室(Office of Engineering and Technology, OET)於上個月就閒置頻譜(white space)開放進行干擾測試,並在2008年10月15日公布結果報告。 工程科技辦公室表示,同時具有頻譜感測(spectrum sensing)以及定位(geo-location)功能之設備在測試中顯示對於既有使用者並不會造成干擾,是以,當美國於2009年2月17日完成無線電視數位化之後,閒置頻譜設備(white space devices, WSDs)應被允許使用於閒置頻譜。於此同時,聯邦通訊傳播委員會主席 Kevin Martin 在記者會中公開表示支持開放閒置頻譜,並宣布美國聯邦通訊傳播委員會將於2008年11月4日的公開會議中就此一議題進行表決。 美國國家廣播業者協會(National Association of Broadcasters, NAB)旋即在2天後向聯邦通訊傳播委員會提出緊急請願(emergency petition),希望聯邦通訊傳播委員會延後其表決時間,並就此一議題進行公共諮詢。國家廣播業者協會同時指出,該報告摘要對於測試過程所蒐集之資料解讀錯誤,國家廣播業者協會認為,根據該測試結果,未經取得執照且僅以頻譜感測技術避免干擾之閒置頻譜設備將會干擾既有的使用者。而非如該報告摘要所稱,應可開放同時具有頻譜感測技術及定位功能之閒置頻譜設備。截至目前為止,聯邦通訊傳播委員會尚未正式決定是否接受國家廣播業者協會之請求延後表決時間。
英國通過《電子貿易文件法》,將透過「可信賴系統」的要求強化電子貿易文件的證明效力英國國會於2023年7月上旬通過《電子貿易文件法》(Electronic Trade Documents Act 2023, ETDA),經國王於7月20日正式批准,該法於2023年9月20日正式生效,未來英國的電子貿易文件將與紙本貿易文件具有相同效力。 一直以來,英國僅承認紙本貿易文件的法律上效力,因此英國企業在進行國際貿易的各環節上,必須處理上百頁的紙本文件,造成英國企業及其交易對象必須花費相當高的時間和金錢成本,不僅效率低且造成環境破壞,同時紙本文件也較難驗證其真實性。在數位轉型趨勢下,此類陳舊的法律早已不合時宜,因此美國、新加坡、德國等國家也正在進行類似立法,而英國是七大工業國組織(Group of Seven, G7)中第一個完成立法的國家。 該法正式施行後,可大幅降低英國企業的成本,提升國貿及融資的效率;根據英國政府估計,未來十年,該法將可為英國經濟創造11.4億英鎊的淨效益(net benefit),同時每年可減少10%以上的碳排放量,有助於落實ESG。更重要的是,相對於紙本,貿易文件的數位化,可提升安全性和透明性。 根據該法第2條第2項規定,電子貿易文件必須是由「可信賴系統」(reliable system)所產生,所謂「可信賴系統」必須具備以下特徵: 1.能清楚識別文件,與其他副本加以區分; 2.能防止文件遭到未經授權的修改; 3.確保任何時點僅有一人能對該文件行使控制權; 4.允許能夠對該文件行使控制之人,能向他人「證明」其控制權; 5.確保電子貿易文件移轉後,使前手立即喪失控制權。 此外,第2條第5項列出在判斷一個系統是否可信賴時,可考量的7點因素,其中第5點指出可考量該系統是否經獨立機構定期稽核(包含稽核頻率和範圍),以及第6點為該系統是否經監管機關進行任何可信賴性的評估。 雖然該法基於技術中立(technological neutrality),並未明定何種技術符合「可信賴系統」的要求。然而,起草該法的法律委員會(Law Commission of England and Wales, LCEW)於2022年3月的草案報告中花了相當大的篇幅說明「分散式帳本」(Distributed Ledger Technology, DLT)的技術,並認為DLT在透明性、安全性、不可竄改等面向有較好的表現,因此指出這是「目前」產生可信賴電子貿易文件的重要技術之一。英國政府表示,承認電子貿易文件的法律效力後,國際貿易各環節的參與者可以透過如DLT等技術,更有效地追踪相關紀錄,進而提高國際貿易的安全性和合規性。 本文同步刊登於TIPS網站(https://www.tips.org.tw)