2022年國家網(wǎng)絡(luò)安全宣傳周|阿里巴巴:數(shù)字水印技術(shù)、圖像篡改檢測技術(shù)的應(yīng)用實踐
2022年09月05日 17:22
9月5日至11日是“2022年國家網(wǎng)絡(luò)安全宣傳周”。中國互聯(lián)網(wǎng)協(xié)會圍繞"網(wǎng)絡(luò)安全為人民,網(wǎng)絡(luò)安全靠人民"的主題,開展“互聯(lián)中國夢——共筑網(wǎng)絡(luò)安全防線”活動。互聯(lián)網(wǎng)企業(yè)積極響應(yīng),結(jié)合工作實踐,以問題為導(dǎo)向,從保護個人隱私、防范電信網(wǎng)絡(luò)詐騙、保障數(shù)據(jù)安全等方面,多角度、多層面、多形式地分享網(wǎng)絡(luò)安全成果與良好經(jīng)驗,共同探索網(wǎng)絡(luò)安全問題的解決途徑,為我國網(wǎng)絡(luò)安全領(lǐng)域建設(shè)提供新思路、新方法,形成多方協(xié)作共同維護網(wǎng)絡(luò)安全的強大合力。
阿里巴巴
圖像篡改檢測技術(shù)在電信網(wǎng)絡(luò)反詐的應(yīng)用實踐
圖像已成為當(dāng)下最重要的信息憑證之一,違法人員常通過圖像編輯、深度偽造等手段偽造各類證照、轉(zhuǎn)賬記錄等來實施詐騙。普通用戶識別篡改圖像的難度與日俱增、識別方法捉襟見肘,圖像篡改成為電信網(wǎng)絡(luò)詐騙的重要手段。
數(shù)字圖像形成的周期包括圖像獲取、圖像編碼、圖像編輯三個階段,每個階段都會在圖像中留下痕跡。阿里巴巴依托多年來在賬號風(fēng)控、ICP備案等領(lǐng)域的處置經(jīng)驗,研發(fā)了圖像篡改檢測技術(shù),通過提取數(shù)字圖像各階段的痕跡,分析數(shù)字圖像的操作歷史,檢測圖片是否經(jīng)過篡改,從而提升用戶識別“假圖”的能力。
阿里安全研究的圖像篡改檢測技術(shù),是指將圖像分成極小的小塊,統(tǒng)計和分析每個小塊的特性,分析是否被壓縮、重采樣、引入新特征像素等,通過對比分析,標(biāo)記小塊的差異點,從而找出被篡改的圖像。
圖像篡改區(qū)域定位:精確度在業(yè)界處于領(lǐng)先水平,能進(jìn)行像素級別的準(zhǔn)確定位。覆蓋PS、美圖等軟件的各種篡改操作;適用于資質(zhì)、證照、證明及其他手機或相機拍攝的自然圖像。
翻拍檢測:適用于各種場景的翻拍圖像檢測,準(zhǔn)確率達(dá)到98%以上。
遮擋區(qū)域檢測:精準(zhǔn)定位各類圖像中被PS修改遮擋的區(qū)域;有效檢測PS物體拼接、馬賽克等遮擋方式,定位AUC達(dá)95%以上。
相機設(shè)備來源識別:建立了100款主流手機相機設(shè)備的指紋庫,來自指紋庫內(nèi)的圖像識別準(zhǔn)確率達(dá)95%以上。
阿里圖像篡改檢測技術(shù)應(yīng)用實踐
目前,圖像篡改檢測技術(shù)已廣泛應(yīng)用于阿里集團平臺治理領(lǐng)域,覆蓋高德、閑魚、淘寶、天貓等多個業(yè)務(wù)中。
在閑魚上,詐騙分子常在圖像中加入“聯(lián)系+QQ”“+微信”等文字將用戶導(dǎo)流至線下進(jìn)行詐騙。依賴該技術(shù),閑魚平均每周識別出1300余張引流圖像,準(zhǔn)確率超過90%。
在高德上,網(wǎng)約車司機入駐時需要提交駕駛證、行駛證、人證合影等圖像供平臺審核,依賴該技術(shù),大大降低了證照造假帶來的用車威脅。
注:已擦除圖片中敏感信息
數(shù)字水印技術(shù)在數(shù)據(jù)安全防護中的應(yīng)用實踐
數(shù)字經(jīng)濟時代,數(shù)字化使得數(shù)據(jù)更易復(fù)制易分發(fā)、流動路徑更加復(fù)雜,構(gòu)建數(shù)據(jù)全鏈路追蹤與保護的治理體系迫在眉睫。數(shù)字水印是信息隱藏技術(shù)的重要研究方向,主要包括水印嵌入模塊和水印提取模塊(類似加密解密)。將水印技術(shù)應(yīng)用到文件風(fēng)險防控場景,可實現(xiàn)文件內(nèi)容標(biāo)注和全鏈路溯源;結(jié)合終端DLP檢測能力,構(gòu)建非結(jié)構(gòu)化數(shù)據(jù)的分類、溯源、預(yù)警防控體系。
事前(傳輸前):數(shù)據(jù)(如文檔、截圖等)被嵌入水印。該過程對用戶完全透明,水印信息可以是用戶標(biāo)識或等級標(biāo)識。
事中(傳輸中):對所有傳輸(如向外發(fā)送)文件,掃描并提取標(biāo)識信息,可對識別到特定標(biāo)識的文件傳輸行為進(jìn)行攔截或告警。
事后(發(fā)布后):對在外部傳播的疑似泄露數(shù)據(jù),提取水印信息,進(jìn)而定位到發(fā)生泄露的具體路徑。
數(shù)字水印特點
安全性。水印信息難以篡改或偽造,當(dāng)數(shù)據(jù)內(nèi)容變化時,數(shù)字水印隨之變化,從而實現(xiàn)數(shù)據(jù)變更檢測。
隱蔽性。水印加載不影響被保護數(shù)據(jù)正常使用,用戶難以察覺。
魯棒性。在經(jīng)歷多種信號處理后,數(shù)字水印仍能保持部分完整性并能被準(zhǔn)確識別。
靈活性。一方面可嵌入水印的信息量較為靈活;另一方面,水印參數(shù)(大小、位置、布局格式、字體、透明度等)配置靈活。
數(shù)字水印應(yīng)用實踐
阿里巴巴深耕數(shù)字水印領(lǐng)域多年,累計完成70余篇專利申請,基于集團豐富和眾多的應(yīng)用場景和業(yè)務(wù)需求,研發(fā)落地了一套完整自主知識產(chǎn)權(quán)的水印技術(shù)體系。
阿里水印技術(shù)覆蓋圖像、文檔、視頻、音頻、網(wǎng)頁等幾乎全部數(shù)字媒體。其中數(shù)字視頻水印先后通過了國內(nèi)權(quán)威的ChinaDRM認(rèn)證以及國際權(quán)威的Cartesian認(rèn)證(好萊塢認(rèn)可的國際最高水準(zhǔn)視頻水印測試),打破了國外公司在該領(lǐng)域的主導(dǎo)局面。
集團內(nèi)部接入應(yīng)用數(shù)超過1000個,累計調(diào)用近60億次,覆蓋過億文件,攔截了數(shù)百起數(shù)據(jù)泄露風(fēng)險;同時已完成商業(yè)化上線,通過阿里云向全社會輸出優(yōu)質(zhì)水印產(chǎn)品,累計接入商家20余家。