「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。 在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。 英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。 技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。
英國發佈具有決定性的基因體醫藥報告正當英國衛生部門(Department of Heath)計畫建構一個受命與提供資金的機構來進行癌症分子研究時,一個著重於基因藥物使用的英國政府諮詢組織-人類基因體策略團體(Human Genomics Strategy Group)提出報告要求英國健康照護服務(National Health Service, NHS)以多面向的方式來開發潛在性基因體科技。 人類基因體策略團體所提供的報告建置出了英國就基因體藥物於臨床應用可行性的相關步驟,該等步驟可提昇英國臨床醫師決定疾病的風險與傾向、從事正確的診斷與預知,以及培養個人醫療的能力。除此之外,該報告亦開展了人類基因體於臨床與診斷照護上的創新應用,並且提供英國政府關於基因資料之處理、公共健康議題與教育等措施資訊,以用來支持基因體科技的應用。 該報告建議,有鑑於英國已擁有強健的研究文化與資源,現階段英國已經準備好基因體藥物研究的初期階段。然而,在開始基因體藥物的研究之前,英國政府應該先在基因體技術廣泛使用於臨床照護與診斷的面向上作出更多的努力,其中包括建制出一套對於基因體與臨床基因檢驗的清楚標準,用以發展出一般性的程序來幫助健康照護專業人員來取得檢驗並分析結果。除此之外,為了防止前述一般性程序產生各項倫理道德性爭議,該報告亦建議英國政府應該發展出一套法制規範來處理關於基因藥物是否具有利用性的挑戰議題,並且以該規範來防範各種基因體資料可能被濫用的問題。 而除了建置基因體計畫法制面的規範,為了讓基因體技術能更廣泛的應用於臨床照護與診斷的範疇,此報告亦建議英國NHS應該規劃採用基因體科技的計畫、發展中央基因體儲存網絡來處理大量由基因體藥物所產生的生物資訊,以及開展出針對基因體科技所發展的受命計畫和服務傳遞模型。同時,考量英國國民與健康照護人員對於促進基因體藥物亦有所幫助,該報告也建議英國NHS應該持續提供相關教育與訓練課程來提高前述人員對於基因體藥物的認知與其帶來的益處。 有鑑於基因體醫藥報告對於英國未來從事基因實驗、臨床研究與基因藥物的研發具有決定性的影響,然該報告僅建構出具體的大方向,對於細節部分尚未有大量的著墨。因此,英國官方部門如何將此份報告於法制面和技術面加以具體落實,實值得繼續就相關內容作後續的追蹤。
歐美擴大永續報告書的揭露範圍,企業可透過歷程管理增進資料透明度根據美國瑞生國際律師事務所(Latham & Watkins)於2024年1月發布的ESG年度報告指出,隨漂綠議題延燒,ESG報告不受信任為一課題,因此國際逐步擴大ESG監管,多國透過立法強制企業應揭露永續報告書或供應鏈資訊,比如:歐盟於2023年1月生效之《企業永續報告指令》(Corporate Sustainability Reporting Directive, CSRD),要求企業揭露的永續資訊需增加供應鏈資訊的透明度;美國證券交易委員會(SEC)於2024年3月6日通過規則,要求上市公司及公開發行公司揭露碳排放報告等氣候風險相關資訊。 為因應ESG帶來的挑戰,報告建議企業應採取流程化管理方式,了解產品進出口涉及的其他國家對ESG揭露資訊的要求,加以規劃並建置資料控管規範、進行人員教育訓練以及確認ESG相關資料的所有權歸屬。 由於碳排放量的計算沒有一致標準,且難以確保供應鏈上下游所提供的碳排資訊真實、未經竄改等問題,外界不容易信任企業永續發展書提倡的供應鏈減碳策略。國內企業可參考資策會科法所創意智財中心發布的《重要數位資料治理暨管理制度規範(EDGS)》,透過流程化管理,從制度規劃及留存供應鏈二氧化碳排放量或二氧化碳減量等產品相關資料歷程來增進ESG資料透明度。 本文同步刊登於TIPS網(https://www.tips.org.tw)
Google新版桌面搜尋工具引發隱私權顧慮Google在2006年2月11日推出最新版的桌面搜尋工具Google Desktop 3,它的最新功能可以讓用戶同時搜尋多台電腦的資料。當啟用這項功能後,它會將電腦裡的文件和文字檔案(如Word、Excel)內容予以複製上傳到Google的伺服器上。當用戶在一台電腦搜尋資料時,也會在其他台安裝此工具的電腦自動開始搜尋。Google 表示,目前已經有很多人同時使用數台電腦,這個新功能可以讓使用者的生活更為便利。 但是倡導網路隱私權的團體Electronic Frontier基金會卻表示憂慮。由於新功能可能會讓駭客更容易盜取用戶個人資料,用戶的個人隱私將面臨更大的威脅。該基金會律師Fred von Lohmann認為,使用者應重視個人資料被放在Google伺服器上可能產生的問題,這比便利性更為重要。因為使用時若未花時間處理功能選項和設定問題,它將可能導致個人資料諸如納稅、醫藥和財物紀錄,以及其他文字檔案等資料外洩。