「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。
在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。
英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。
技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
本文為「經濟部產業技術司科技專案成果」
針對告知消費者個資使用方式以及確保消費者對個資利用之參與及意見表達,英國通訊傳播管理局(The Office of Communications, Ofcom)於2015年6月17日公布委託德國顧問公司WIK-Consult進行之「個資與隱私」(Personal Data and Privacy)報告。報告指出,雖然法規要求在處理個資前必須獲取相關消費者的告知同意,但事實是消費者並未在線上實際閱讀隱私權政策條款,這個問題則由於智慧聯網大幅促進了裝置間的互聯性與資料的流通而更形嚴重。報告表示,雖然資料流通的本質不變,但僅因互聯裝置數量倍增就足以讓可近用與分析的資料呈等比級數成長,要在線上對這些遍及生活各層面的資料進行追蹤也就難上加難。 對於這個起因於智慧聯網興起的問題,報告認為政府可能必須利用更複雜的契約關係加以規範。因為隱私權政策要能透明,必須指出究竟是哪些人會在何時以哪種方式為了何等目的去近用相關資料,但這勢必會讓隱私權政策條款更加冗長,這不但與隱私權政策盡可能應簡潔易懂相違,消費者也更不可能實際去閱讀。此外報告也指出,機台或裝置在智慧聯網下能夠在幾乎沒有人為介入的情況下進行溝通,此將大幅壓縮消費者能夠得知個資蒐集與使用方式的機會,智慧聯網也讓消費者可能根本沒有察覺其正在使用的裝置實際上已經與網路連線。另一方面,隨著互聯複雜性的大幅提高,有意或無意揭露個資也將帶來更多的潛在不利影響。
美國網路安全聯盟提出網路安全策略建議報告美國網際網路安全聯盟(Internet Security Alliance,ISA)日前公佈一份新的報告,期使歐巴馬政府之「網路空間政策檢討」(Cyberspace Policy Review)能更進一步的落實。 網路安全聯盟主席Larry Clinton指出:「ISA對歐巴馬政府的網路安全政策表示支持,而目前民間機構需要設計一套規範,去落實ISA與政府對於網路安全重要議題共通之協議。本次所提出的報告,就是為了要提供能解決此一關鍵問題的架構。」 此份報告之標題為「利用ISA之社會契約模型執行歐巴馬政府之網路安全策略」(Implementing the Obama Cyber Security Strategy via the ISA Social Contract Model),而此報告強調必須重視網路安全的經濟意義。 Clinton認為,一旦討論到網路安全議題,會發現所有的經濟因素都對攻擊者有利,攻擊者總是能以簡單、成本低廉之攻擊方式得到巨大的利益。相對地,防守者(網路使用者)卻往往要付出高昂的成本。需要防護的領域太廣,而投資的回收通常很有限。必須從經濟的角度去平衡考慮成本與回收,才能建立具實效性且持續穩固的網路安全系統。 此份報告包含下列事項之架構:1.在商業計劃層面,創設政府與民間機構的合作夥伴關係,以強化網路安全;2.提出關於網路安全的國際議題;3.維持全球IT產業供應鏈的安全;4.建立新式資訊分享範例。 上述架構均依循ISA之網路安全社會契約模型,此一模型是源自於20世紀早期美國政府為了提供民間企業電信與電力服務,所成功建立之夥伴關係。
食品標示 美國新制上路隨著食物過敏與過胖等健康問題愈來愈受重視,美國FDA(Food and Drug Administration, 食品暨藥物管理局)規定從2006年1月1日起,食品製造商必須在食品標示上揭示產品中八種主要過敏原與反式脂肪(trans fat)含量,並且必須加強揭示卡路里含量、說明整個包裝所含的養分。 依據此項新規定,廠商必須在食品標籤上以簡易的文字,標示八種容易造成過敏的過敏原,包括核果(杏仁、胡桃、大胡桃)、牛奶、蛋類、魚類、甲殼綱蝦蟹、花生、大豆與小麥。至於反式脂肪,又稱為轉化脂肪或反脂肪,是不飽和脂肪酸的一種,它會刺激人體內低密度脂蛋白(LDL)的增加,進而使低密度蛋白膽固醇(LDL-C)的量增加。LDL-C又被稱為『壞膽固醇』或『不好的膽固醇』,它會間接刺激膽固醇升高,增加罹患心臟血管疾病的風險。過去一直沒有決定每人每天攝取量標準,因此在商品包裝上的營養成分表(Nutrition Facts Table)一直都沒有列出反式脂肪含量,但是新制上路後,在包裝標籤上面也必須列出反式脂肪含量。 在消費者越來越重視健康問題之趨勢下,未來如何製造反型脂肪低或零含量的食用加工油脂產品,相信會是相關業者所面臨的新挑戰。
美國和歐盟合作推動統一優良臨床試驗規範美國聯邦食品藥物管理局(U.S. Food and Drug Administration)和歐洲醫藥局(European Medicines Agency)在2009年7月31日共同公佈了一項名為優良臨床試驗行動(Good Clinical Practices Initiative)的合作計畫,期能藉由該計畫,使得不論是在美國或歐盟,所有臨床試驗之執行,都有遵守相同且適當的規範。 在醫藥品上市申請的實務中,因為大部份的醫藥品都會企圖向廣大的歐美市場扣關,同樣的臨床試驗通常也會分別提交到兩地的醫藥品上市許可申請程序中。故若兩地主管機關可以合作訂出統一的優良臨床試驗規範,則可避免因重複審查所造成的資源浪費,申請者也可以因為統一的規範而加速其在兩地審查的程序,且在跨國資訊交流整合下,也可為臨床試驗研究的參與者提供更好的安全基礎。 此次美國聯邦食品藥物管理局,和歐洲醫藥局合作之優良臨床試驗行動的幾個主要目標如下: 一、定期交換有關優良臨床試驗之實務操作資訊:交換的資訊包括(1)彼此的優良臨床試驗(Good Clinical Practices, GCP)查核計畫,以了解有那些臨床試驗或地點是對方會去查核的,就不需要重覆查核;(2)彼此受理的上市申請案件中,有關GCP的如科學上的建議或上市申請的結果等;以及(3)彼此執行GCP查核之結果。二、共同執行優良臨床試驗審查:藉此了解對方之GCP查核程序,並進而信賴彼此之程序,也藉由共同執行時之交流,提昇彼此查核之技巧,及精進查核之程序。 三、合作增進優良臨床試驗規範:藉由對彼此GCP相關法規、指導原則、和政策等的交流及了解,找出現有規範中可予以改進之處,以增進臨床試驗研究的品質。 自2009年9月1日起,此項合作行動將首先開始一個為期18個月的先期行動,在此先期行動結束後,兩主管機關將會共同發布一份包含其整體行動計畫,及雙方就各自既有法規或程序應予以調整部分。