技術(shù)
1.引言
人臉識(shí)別是一個(gè)研究熱點(diǎn),容易被用戶所接受,在生物特征識(shí)別技術(shù)中有直接、友好、方便的特點(diǎn)。利用原始圖像在小波分解中不同分辨率能量分布不均勻的特點(diǎn),應(yīng)用小波變換可以提高識(shí)別效率和質(zhì)量。Mallat算法可以有效地進(jìn)行圖像的分解和重構(gòu),不需要知道小波函數(shù)的具體結(jié)構(gòu),由一組濾波器的系統(tǒng)即可對(duì)信號(hào)進(jìn)行分解和重構(gòu)。
2.傳統(tǒng)的人臉識(shí)別
傳統(tǒng)人臉識(shí)別特征通常分為4類:視覺特征、象素統(tǒng)計(jì)特征、變化系數(shù)特征、代數(shù)特征。通過幾何特征或通過統(tǒng)計(jì)特征來(lái)識(shí)別。在識(shí)別過程有兩個(gè)重要的步驟,如圖1:
圖1:人臉識(shí)別系統(tǒng)的步驟
?、賹?shí)行人臉的檢測(cè)和定位,在輸入中找出人臉及存在位置,將人臉從背景中分辨出來(lái);
?、趯?duì)歸一化的人臉圖像進(jìn)行提取與識(shí)別。
3.基于Mallat算法的人臉識(shí)別
Mallatt算法是S.Mallat提出的,是一種求解小波系數(shù)的塔形算法思想,對(duì)一幅圖像完成一次一維小波變換,需要對(duì)圖像的行和列分別進(jìn)行一次Mallat算法處理,也就是水平和垂直濾波。小波變換 將原始圖像C(m,n)分成4個(gè)子帶,即1個(gè)低頻子帶(LL)與3個(gè)高頻子帶(LH,HL,HH)。對(duì)低頻子帶進(jìn)一步實(shí)施小波變換,分解成下一級(jí)4個(gè)子帶。
圖2:三級(jí)小波變換示意圖構(gòu)
Mallat算法針對(duì)小波分解后,其低頻、水平、垂直及對(duì)角線分量的顯著特點(diǎn),根據(jù)人的視覺生理、心理特點(diǎn),對(duì)小波分解參數(shù)作不同量化處理,來(lái)達(dá)到目的。
對(duì)圖像進(jìn)行二維的小波多尺度分解,得到一個(gè)圖像的多分辨率表示,即不同分辨率的子圖;不同分辨率級(jí)的子圖像對(duì)應(yīng)的頻率是不同的。圖像的能量基本集中在低頻部分,這就可通過多重小波分解,在Mallat算法中(多重濾波)逐步從低頻子圖中分離出高頻部分,得到一個(gè)集中了圖像大部分信息的幾乎完全低頻的部分。高頻部分,所含的信息很少,處理起來(lái)較容易,且噪聲大多集中于高頻部分,通過小波分解可有效的去除噪聲。
特征提取中,根據(jù)人的視覺敏感程度對(duì)低頻亮度子圖像和高頻細(xì)節(jié)子圖像分別采用不同的量化、編碼方法,從而確保得到更高人臉特征提取。識(shí)別過程中,人臉的檢測(cè)與定位和人臉圖像特征提取與識(shí)別步驟中間增加Mallat算法對(duì)人臉圖像進(jìn)行小波變換處理過程,如圖3。
圖3:加進(jìn)Mallat算法后的人臉識(shí)別系統(tǒng)的步驟
Mallat算法處理按三個(gè)步驟進(jìn)行小波變換:①利用二維離散小波變換將圖像分解為低頻近似分量和高頻水平、高頻垂直、高頻對(duì)角細(xì)節(jié)分量;②根據(jù)人的視覺特性對(duì)低頻及高頻分量分別作不同的量化;③利用逆小波變換重構(gòu)圖像。
通過三級(jí)小波分解圖像再恢復(fù)后的效果比原始圖有更好的清晰度,這是因?yàn)樾〔ㄗ儞Q在對(duì)高頻部分進(jìn)行量化時(shí)濾掉了很多高頻噪音。
4.試驗(yàn)結(jié)果及分析
樣本集采用MIT CBCL的單人臉測(cè)試,以隨機(jī)抽取的多人臉圖像。環(huán)境為P4 3.00Hz 、1 GB 內(nèi)存,Windows XP操作系統(tǒng)。在訓(xùn)練開始前,將樣本圖像進(jìn)行歸一化為24*24象素大小,每幅圖像提取162336個(gè)Haar-Like特征。使用其中的2000幅人臉圖像和3000幅非人臉圖像進(jìn)行人臉分類器的訓(xùn)練。
從圖4可看出,基于Mallat算法的人臉識(shí)別明顯優(yōu)于傳統(tǒng)的人臉識(shí)別,并且隨著圖像噪聲的增加,這種優(yōu)勢(shì)越來(lái)越明顯。也就是說(shuō)在傳統(tǒng)的人臉識(shí)別中增加步驟Mallat算法對(duì)人臉圖像進(jìn)行處理,然后再進(jìn)行特征提取與選擇,在提高檢測(cè)率的同時(shí)降低誤檢率。
圖4:檢測(cè)率與圖像噪聲數(shù)目的關(guān)系圖
對(duì)清晰圖像和經(jīng)2.0高斯模糊后的圖像進(jìn)行檢測(cè),檢測(cè)率和誤檢率的比較如表1所示。
表1:傳統(tǒng)的人臉識(shí)別與基于Mallatt算法人臉識(shí)別檢測(cè)性能的比較
從表中數(shù)據(jù)可以看出,基于Mallat算法的人臉識(shí)別比傳統(tǒng)的人臉識(shí)別算法在人臉圖像噪聲較多的情況下識(shí)別性能要好,這說(shuō)明采用基于Mallat算法的人臉識(shí)別可以有效地抑制圖像噪聲,提高檢測(cè)率,并降低誤檢率。圖5為使用本文提出的基于Mallat算法人臉識(shí)別的程序,分別在單人臉圖像和多人臉上的部分檢測(cè)結(jié)果。
5.結(jié)論
本文提出了一種基于Mallat算法的改進(jìn)人臉識(shí)別的檢測(cè)方法,進(jìn)行了實(shí)驗(yàn)并對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,表明在一定條件下這種算法可以增強(qiáng)人臉識(shí)別中特征臉的檢測(cè)效果,提高檢測(cè)正確率,有效降低錯(cuò)誤率。但是從結(jié)果分析上也可看出基于Mallat算法的DWT對(duì)圖像進(jìn)行分解時(shí),只能提取水平或垂直方向上的細(xì)節(jié)信息,并不是所有情況下都適用。