合成資料(synthetic data)

  「合成資料」(synthetic data)的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

  在合成資料的生成技術當中,最熱門的研究為運用「生成對抗網路」(Generative Adversarial Network, GAN)形成合成資料(亦有其他生成合成資料之方法),生成對抗網路透過兩組類神經網路「生成網路」(generator)與辨識網路(discriminator)對於不同真偽目標值之反覆交錯訓練之結果,使其中一組類神經網路可生成與原始資料極度近似但又不完全一樣之資料,也就是具高度複雜性與擬真性而可供研究運用之「合成資料」。

  英國國防科技實驗室(Defense Science and Technology Laboratory, DSTL)於2020年8月12日發布「合成資料」技術報告,此技術報告為DSTL委託英國航太系統公司(BAE Systems)的應用智慧實驗室(Applied Intelligence Labs, AI Labs)執行「後勤科技調查」(Logistics Technology Investigations, LTI)計畫下「資料科學與分析」主題的工作項目之一,探討在隱私考量下(privacy-preserving)「合成資料」當今技術發展情形,並提供評估技術之標準與方法。

  技術報告中指出,資料的種類多元且面向廣泛,包含數字、分類資訊、文字與地理空間資訊等,針對不同資料種類所適用之生成技術均有所不同,也因此對於以監督式學習、非監督式學習或是統計學方法生成之「合成資料」需要採取不同的質化或量化方式進行技術評估;報告指出,目前尚未有一種可通用不同種類資料的合成資料生成技術或技術評估方法,建議應配合研究資料種類選取合適的生成技術與評估方法。

本文為「經濟部產業技術司科技專案成果」

相關連結
相關附件
你可能會想參加
※ 合成資料(synthetic data), 資訊工業策進會科技法律研究所, https://stli.iii.org.tw/article-detail.aspx?d=8532&no=55&tp=5 (最後瀏覽日:2026/03/22)
引註此篇文章
你可能還會想看
美國音樂授權平台營運觀察─以BMI為例

美國音樂授權平台營運觀察─以BMI為例 資策會科技法律研究所 法律研究員 丘瀚文 104年10月22日 壹、前言   我國著作權法採「創作保護主義」[1],於著作完成之時,立即取得著作權保護,惟亦因如此,實務上難以證明何人為著作權人,常使利用人鋌而走險非法使用著作,使我國著作權流通、發展受到限制。如何讓著作人可以安心授權著作、利用人得以透過合法授權管道,簡單的取得授權,國外已有透過建立著作權授權平台來解決問題的先行實例。本文為研析我國著作權授權平台可行之營運方式、授權契約、費用計算方式,故觀察分析美國第二大音樂授權平台Broadcast Music Inc.(以下簡稱BMI),之特色,希望對我國著作權授權平台建立,有所助益。 貳、BMI音樂授權平台介紹 一、BMI音樂授權平台介紹   American Society of Composers Authors and Publishers(以下簡稱ASCAP)是美國最大的音樂授權平台,自1914年成立以來,凡是以公開播放方式利用音樂著作皆須向ASCAP支付授權費用,長久壟斷音樂授權市場[2]。在1940年ASCAP大幅提高授權費用後,以美國廣播協會為首廣播業者,為了因應ASCAP之調整價格,便聯合了500多家廣播公司自行組織了BMI進行抵抗,並蒐集大量非ASCAP管理之音樂供廣播業者利用,但由於後續運作獲得許多利潤,因而繼續經營。   美國司法部於1941年對ASCAP提出反托拉斯訴訟,結果達成和解,之後又於2001年司法部再度與ASCAP達成協議,完成了第二最終修正裁判(Second Amended Final Judgement),該協議讓司法部得藉司法監督,去控制ASCAP授權音樂費率於一定額度內,使BMI跟ASCAP能維持競爭關係。上開原因使BMI能慢慢發展成美國第二大音樂授權團體。 二、BMI授權方式觀察   BMI授權方式分為兩種,一為非即時性授權契約,其提供著作利用人定型化授權契約,但需經由傳真、客服確認時間,故不具有授權即時性;此一類型又區分為概括授權和單一節目授權兩種形式;二為即時性線上授權契約,利用BMI自行創設之數位授權中心,經線上填入資料、金融轉帳後,即可立即獲得授權,惟目前依網頁介紹觀察,授權對象僅限網站[3]。下列即分述兩種授權方式。 (一)非即時性授權契約   BMI非即時性授權契約分為媒體授權合約(Media Licensing)和一般授權契約(General Licensing)等兩大類型,媒體授權合約主要以公開播放業者為授權交易對象,並區分概括授權與個別節目授權;概括授權即繳納年費後不限次數使用,而個別節目授權則限定特定節目使用,如需在其他節目使用則需另外繳納授權費。   一般授權契約對象則多是廣播以外其他行業,如遊樂園、舞廳、餐廳、政府機關、健身俱樂部、手機…等,其使用授權費率皆不同,利用人填入行業內容後,該授權系統會線上提供與該行業相關授權契約內容供利用人參考,利用人填寫後可上傳至BMI管理中心即可完成授權作業[4]。不過亦非所有行業BMI均提供授權契約範本,仍有部分如餐館等,尚需使用人自行連絡BMI代理人方得進行授權。   以零售商(Retail Establishments)為例,本文登入BMI授權系統,並點選「Apply for License」按鈕,即出現下載授權契約選項,其內容包含[5]:有人對使用方提出訴訟,其訴訟標的關於BMI所提供授權服務,BMI將會負責損害賠償部分。使用人若想結束或轉讓生意,應於30日email至licensing @bmi.com,BMI會將授權金額重新計算,並寄送於使用人。   費用計算上BMI對每個行業皆有不同「計算基準」,據此計算出授權費用。例如零售商是以「場地大小」為計算基準;2000平方英呎以下零售商撥放一般音樂,授權費用為一年為227.6美元,播放具有視覺性音樂(MV),授權費用為一年307美元。計算基準是隨行業不同而有所變化,例如健身房則與零售商相異,其一年最少費用為311美元,費率亦非以「場地大小」單價計算,而是用「會員數量」作計算基準,並區分音樂是否使用於健身課程,而有不同費率;用於健身課程則一個會員0.279美元,非用於健身課程則一個會員0.195美元[6]。   最後,申請人應將此一表格掃描後做成電子檔,並藉由BMI網頁的上傳功能,上傳至BMI管理中心,中心審核後並確認匯款無誤,即會通知申請人開放授權[7]。 (二)即時性線上授權   BMI即時性線上授權是透過「數位授權中心」(Digital Licensing Center)進行,和非即時性一般授權契約不同,著作利用人只須登入該系統,線上填妥相關利用資訊,並以信用卡、線上轉帳等方式給付授權費用,即得線上完成與BMI締結授權契約程序。BMI將此一授權方式簡化為線上處理,避免授權契約雙方往返溝通繁雜手續,並具有即時性,是更為便利的交易模式。 x數位授權中心有兩種計價方式,總收入計算法與網頁流量計算法。總收入計算法是將網站一定比例收入計算為音樂授權金額。網頁流量計算法則是依據網頁上的流量為基準計算音樂授權金額[8]。而BMI將網站使用區分為三類:1.音樂網站2企業網站3.非營利網站,三者會讓使用者選擇計價方式不同。   舉例來說,企業網站、非營利網站關於音樂使用,其音樂使用與網站業務目的無關,音樂使用僅為提升形象,故不宜使用總收入計算法,應採網頁流量計算方式會較為節省[9]。簡言之,音樂使用與網站業務目的相關,則多使用總收入計算法,使用音樂與網站業務目的無關,則多使用網頁流量計算法。而網站可對財政報告進行分析,並選擇最經濟的方案,並可在一年中進行四次的變更,以符合網站商業運作模式。 參、結論   藉由觀察國外著作權平台授權方式並參考營運模式,對於我國類似平台建置營運提出三點或許可以借鏡之建議: 一、依行業區分不同授權標準   BMI之授權契約多樣化,並以行業做為區分標準,滿足不同需求,此區分各種行業不同收費方式,值得借鏡。例如廣播業者與零售商播放音樂軟體,使用權利雖可能皆為公開播送權,但播放時間、地點、影響程度可能皆不相同,如一律依使用權利態樣定收費標準,似有失公平,應可參考BMI以行業區分授權契約種類模式。 二、即時性線上授權   BMI將授權契約區分為即時性授權契約與非即時性授權契約,而即時授權對於使用人而言,較為方便,我國則可考慮以即時線上授權為基礎,並將對象擴張至一般行業皆能運用。 三、費用計算方式   BMI即時線上授權收費方式區分為總收入計算法與網頁流量計算,在授權對象為網站時,給予多重選擇,例如使用者為一般網站時,網頁流量計算法是對其比較有利的。這種費用的計算方法,讓使用人可依據網站業務不同,選擇利益最大化之優點,增加了使用人使用平台誘因,故此方式值得借鏡。   綜上,BMI之授權方式與契約內容、經營方式有獨到之處,可成為我國著作權平台建立之參考範本,使著作得以順利流通,促進我國產業發展。惟各式授權契約擬定,除有賴大量契約範本蒐集方得完善,授權費用如何設定仍是未來類似平台建置營運必須透過交易經驗與資料統計分析始能克服之難題。 [1] 著作權法第10條:著作人於著作完成時享有著作權。 [2] Music Licensing History,National Religious Broadcasters Music License Committee,http://www.nrbmlc.com/music-licensing/music-licensing-history(last visited Sep. 8, 2015). [3] BMI,https://apps.bmi.com/licensing/nmwebsite.jsf(last visited Aug. 12, 2015). [4] Musuc Users,BMI,http://www.bmi.com/licensing(last visited Aug. 12, 2015). [5] Music License For Retail Establishments,BMI,http://www.bmi.com/forms/licensing/gl/rtl.pdf (last visited Sep. 12, 2015). [6] Music License For Fitness,Clubs,BMI, http://www.bmi.com/forms/licensing/gl/fit1.pdf,(last visited Sep. 8, 2015). [7] BMI,http://www.bmi.com/digital_licensing(last visited Sep. 8, 2015). [8] 例如來站人次、瀏覽人數。 [9] BMI,http://www.bmi.com/digital_licensing(last visited Aug. 11, 2015).

為加速解決智財、民事相關爭議,日本推動司法制度改革

  日本政府一直希望能透過改革司法制度,用以解決日本日益增加的跨國民事、智財爭議、消費爭議等案件,故從今(2019)年4月起,日本內閣官房聯合日本最高法院、法務省、外務省等相關單位,積極針對現行的司法制度進行檢討。日本政府期盼透過這次的司法改革,能降低訴訟成本、加速解決爭議案件。   日本內閣官房,於12月9日發表了第九次民事司法制度改革推進會議的決議,這次的會議針對日本現行的民事訴訟程序制度提出了制度改革大綱與具體的改革建議,如日本現行的民事裁判應進行全面IT化,並希望擴充非訟事件的類型。   在這次的會議中,有三個主要的重點:首先在民事裁判上,將增加訴訟代理人律師有提出電子化訴訟文件之義務,民事訴訟法修法通過後,要求訴訟代理人應線上提出訴訟相關文件,未來也會進一步要求本人自訴的案件,自訴者也負有與訴訟代理人同等之義務。   再者在智慧財產爭議案件上,日本政府正在評估是否導入「二階段訴訟制度」。未來在專利權是否侵權的判斷上,會將侵權與否的判斷與損害賠償的裁量拆分為兩階段,且未來在判斷與裁量上,希望法院能採用第三方的專家學者意見做為判斷的依據。   最後,為因應近年的國際化社會,日本新設了「日本國際紛爭解決中心」,希望能強化現行商業爭議案件的裁判程序。另外擴充了現行「國民生活中心」裡「越境消費者中心CCJ」的功能,除了針對跨境消費者外,更提供了在日外國人多國語言的諮詢管道。綜上所述,未來將會修正日本現行的民事訴訟法、專利法等相關法規,司法制度改革細節預計於2020年3月做出最終決議。 「本文同步刊登於TIPS網站(https://www.tips.org.tw)」。

英國資訊專員辦公室對連鎖藥局違反GDPR存放敏感個資作成裁罰首例

  英國資訊專員辦公室(Information Commissioner's Office, ICO)於2019年12月20日發布首宗依據歐盟一般資料保護規則(General Data Protection Regulation, GDPR)之裁罰。   本案源於英國藥物及保健產品管理局(Medicines and Healthcare products Regulatory Agency, MHRA)接獲投訴前往倫敦當地一家名為Doorstep Dispensaree Ltd之連鎖藥局進行藥品違規調查,卻意外發現其後院存放大量敏感個資文件,約五十萬個文件檔案皆未做任何資料檔案保護措施,上面更記載名字、地址、出生日期、NHS號碼、醫療資料及處方籤等患者之個人資料,旋即通報英國資訊專員辦公室展開調查。最終英國資訊專員辦公室以該藥局違反歐盟一般資料保護規則(General Data Protection Regulation, GDPR)第5條1項第f款、第24條第1項及第32條,裁罰275,000英鎊。其裁罰理由如下: 一、隱私政策並不符合要求,如未述明蒐集個人資料之類別,未訂定個資保存期限,當事人告知聲明不完備,無當事人權利行使等。 二、無適當安全維護措施 三、涉及敏感性個資,違法情狀嚴重 四、未積極配合調查 五、影響層面甚深,導致該藥局配合之上百家療養院,近千名當事人個資受損害。   此為英國資訊專員辦公室首宗依據歐盟一般資料保護規則確定裁罰之案例且涉及敏感性個資,有其指標性。除此之外,英國航空與萬豪酒店之個資外洩案亦欲依GDPR進行裁罰,實值持續關注後續發展。

美國寬頻進步報告:寬頻部署有顯著改善但數位落差持續存在

  根據美國聯邦通訊傳播委員會(Federal Communications Commission, FCC)於2016年之寬頻進步報告,美國現行之標準為業者必須提供下載速度至少達25Mbps與上傳速度至少達3Mbps之寬頻服務,相較於2010年所設立之標準─下載速度至少達4Mbps與上傳速度至少達1Mbps的寬頻服務,顯示出美國在寬頻部署上有明顯的進步。然而,目前仍有3400萬美國人民所使用之寬頻服務並未達到上述FCC所設立之標準(25Mbps/3Mbps)。   這份報告亦顯示,持續之數位落差(digital divide)導致40%生活在鄉村以及部落地區之人民所使用之寬頻服務並未達到上述FCC所設立之標準(25Mbps/3Mbps)。此外,E-rate計畫方案之持續推行,雖使許多學校之網路連線已有顯著改善,但仍有41%之學校未能符合FCC之短期目標,亦即這些學校之寬頻連線仍無法供應數位學習之應用。基於以上理由,2016年之寬頻進步報告總結:寬頻部署並未被適時並合理的(timely and reasonable)適用於全體美國人。   該份報告亦認為當今的通訊服務應以固網及行動寬頻服務(fixed and mobile broadband service)之方式提供,彼此的功能不同並能互補。然而,FCC尚未建立行動寬頻服務標準,因此,行動寬頻之部署尚未能反映在目前之評估。   依據1996年電信法第706條之規定,FCC必須每年報告先進通訊能力之部署,是否讓每位美國人民都能適時且合理的使用。國會所定義之「先進通訊能力」(advanced telecommunications capability)必須具高品質之能力,可讓使用者傳輸以及接收高品質之聲音、數據資料、照片以及影像服務。 此份報告重點總結如下: ●全面部署: 目前仍有3400萬美國人(約10%人口)無法接取固網下載速度至少達25Mbps與上傳速度至少達3Mbps之寬頻服務。然而,相較於去年之5500萬美國人(約17%人口)未能接取該寬頻服務,今年已有顯著的改善。 ●鄉村與城市間之數位落差仍待改善: 仍有39%之鄉村人口(2340萬人)以及41%之部落人口(160萬人)無法接取該寬頻服務(25Mbps/3Mbps)。相較於都市僅有4%之人無法接取該寬頻服務,發展上仍不平等。但相較於去年報告所示,有高達53%鄉村人口以及63%部落人口無法接取寬頻服務,城鄉發展不均之程度已有改善。 ●學校之寬頻速度: 全國僅有59%之學校達到FCC所設立之短期目標,亦即100Mbps可以供1000位學生使用,並有極少數之學校達到長程目標,即1Gbps可供1000位學生使用。   這份報告首次將衛星寬頻服務列入評估,FCC對於衛星寬頻服務適用與固網寬頻服務採用同樣之標準(25Mbps/3Mbps)。然而,在評估過程中,尚未有任合衛星寬頻服務符合FCC所採行之寬頻標準。

TOP