技術(shù)
引言
近年來(lái),數(shù)字圖像技術(shù)的應(yīng)用范圍越來(lái)越廣泛,運(yùn)用生物識(shí)別技術(shù)的身份驗(yàn)證則更是由于其在公安(罪犯識(shí)別等) 、安全監(jiān)控系統(tǒng)[1]、信用卡驗(yàn)證等方面的巨大應(yīng)用前景而越來(lái)越成為當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。這其中,利用人臉特征進(jìn)行身份驗(yàn)證又是最自然最直接的手段,相比于指紋、視網(wǎng)膜、虹膜、基因等其它人體生物特征,它具有直接、友好、方便的特點(diǎn),更易于為用戶所接受,因此備受關(guān)注。
人臉識(shí)別技術(shù)是根據(jù)人的臉面特征唯一性特點(diǎn)而進(jìn)行的個(gè)體識(shí)別和確認(rèn)技術(shù)。人的面部特征的唯一性,可以在臉上某一單一器官或部位上得以人臉識(shí)別技術(shù)的門(mén)禁系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 體現(xiàn),更重要的是可在這些單一特征之間的位置、距離、角度、數(shù)量、形狀和模式等相互關(guān)系上得以體現(xiàn),而且這些面部特征都具有一定的穩(wěn)定性。當(dāng)驗(yàn)證某人的身份時(shí),只要通過(guò)某種設(shè)備攝錄下他的面部生物學(xué)特征,與事先已經(jīng)儲(chǔ)存著的相關(guān)樣本特征進(jìn)行比較,幾秒鐘內(nèi)即可完成識(shí)別。同許多生物識(shí)別技術(shù)一樣,人的面部識(shí)別技術(shù)是近幾年在全球范圍內(nèi)迅速發(fā)展起來(lái)的一項(xiàng)安全技術(shù)。它依靠面部的二維或三維圖像處理和模式識(shí)別來(lái)實(shí)現(xiàn)鑒別或驗(yàn)證個(gè)體身份目的,具有非接觸性、對(duì)被識(shí)別對(duì)象侵?jǐn)_少和識(shí)別手段隱蔽等特點(diǎn),在反恐、跟蹤、追逃、打拐、出入口控制、銀行管理等許多領(lǐng)域都有著獨(dú)特 的應(yīng)用價(jià)值。
利用人臉識(shí)別技術(shù)和視頻監(jiān)控技術(shù)開(kāi)發(fā)的門(mén)禁系統(tǒng),可廣泛適用于智能管理系統(tǒng)(智能大樓、高級(jí)住宅門(mén)禁系統(tǒng))、銀行及金庫(kù)門(mén)安全系統(tǒng)、醫(yī)院血液中心身份管理系統(tǒng)等高可靠性、高安全性的場(chǎng)所。這無(wú)疑將成為21世紀(jì)遠(yuǎn)程監(jiān)控的新發(fā)展趨勢(shì),具有廣泛的應(yīng)用前景和巨大的市場(chǎng)潛力。
圖1 人臉識(shí)別流程圖
支持向量機(jī)的人臉識(shí)別算法
人臉識(shí)別應(yīng)包含學(xué)習(xí)和識(shí)別兩個(gè)階段,其流程如圖1所示。訓(xùn)練階段建立支持向量機(jī)分類(lèi)模型,主要步驟為對(duì)人臉圖像預(yù)處理,獲得人臉區(qū)域再利用膚色和幾何特征,獲得人臉特征向量訓(xùn)練集。由人臉特征向量訓(xùn)練集建立個(gè)體用戶的支持向量機(jī)分類(lèi)模型。識(shí)別階段主要步驟為首先由待識(shí)別者所聲稱(chēng)的身份,確定所要使用的支持向量機(jī)分類(lèi)模型,同時(shí)對(duì)待識(shí)別者的人臉圖像進(jìn)行預(yù)處理,獲得人臉區(qū)域,再利用膚色和幾何特征提取人臉特征向量,將該向量輸入到所確定的支持向量機(jī)模型進(jìn)行分類(lèi),以確定待識(shí)別者聲稱(chēng)的身份真實(shí)與否。
系統(tǒng)的組成和功能
門(mén)禁系統(tǒng)的組成結(jié)構(gòu)
本系統(tǒng)由攝像控制模塊、報(bào)警驅(qū)動(dòng)控制模塊和顯示錄像模塊、門(mén)鎖控制模塊四部分組成[2]。攝像控制模塊主要完成人臉圖像的采集、驗(yàn)證、登記使用人員的人臉圖像,取消人臉和重置使用,以及設(shè)定管理人員的權(quán)限。攝像控制模塊主要完成各監(jiān)視點(diǎn)(區(qū))的圖像傳送與控制。報(bào)警驅(qū)動(dòng)控制模塊和門(mén)鎖控制模塊主要完成各控制點(diǎn)門(mén)的開(kāi)啟、報(bào)警等功能。顯示錄像模塊進(jìn)行實(shí)時(shí)顯示和錄像。門(mén)禁系統(tǒng)的結(jié)構(gòu)如圖2所示。主要包括:
?、贁z像頭;
?、赗S232/485轉(zhuǎn)換器;
?、坶T(mén)控制器、配套電鎖;
?、躓INDOWS98 驅(qū)動(dòng)軟件及用于圖像顯示、人臉采集處理和管理、驅(qū)動(dòng)的多媒體應(yīng)用軟件平臺(tái)。
圖2 門(mén)禁系統(tǒng)的結(jié)構(gòu)圖
人臉識(shí)別門(mén)禁系統(tǒng)的功能及通信協(xié)議
本系統(tǒng)所依賴(lài)的攝像頭通過(guò)接口與本系統(tǒng)的運(yùn)行平臺(tái)相連?;谌四樧R(shí)別的門(mén)禁系統(tǒng)的接口需求可分為兩個(gè)部分:應(yīng)用編程接口和通訊協(xié)議。
應(yīng)用編程接口
本系統(tǒng)是作為一種軟件部件的形式,嵌入到各種相關(guān)應(yīng)用系統(tǒng)中去,為其提供安全的用戶身份認(rèn)證服務(wù)。為實(shí)現(xiàn)這一目的,本系統(tǒng)的客戶部分需要以接口函數(shù)的形式提供注冊(cè)、認(rèn)證功能。
通信協(xié)議
通訊協(xié)議就是通訊各方的約定,沒(méi)有固定的格式方法,由開(kāi)發(fā)商自行定義。在實(shí)際使用時(shí),由于各種干擾因素,往往會(huì)發(fā)生誤動(dòng)作的情況,因此通訊協(xié)議必須能抵擋各種干擾因素。為了得到可靠的通訊協(xié)議,我們常常在要發(fā)送的數(shù)據(jù)前加同步位,發(fā)送的數(shù)據(jù)后加結(jié)束位,以及加入校驗(yàn)字節(jié)等等方法。本系統(tǒng)的網(wǎng)絡(luò)通訊協(xié)議采用串口控制單片機(jī),不直接與任何網(wǎng)絡(luò)通訊硬件設(shè)備進(jìn)行交互。本文中我們確定如下的通訊協(xié)議。
1、數(shù)據(jù)為5個(gè)字節(jié),第1字節(jié)表示數(shù)據(jù)校驗(yàn)位,第2字節(jié)表示數(shù)據(jù)校驗(yàn)位,第3字節(jié)表示數(shù)據(jù)校驗(yàn)位,第4字節(jié)表示數(shù)據(jù)位1,第5字節(jié)表示數(shù)據(jù)位2。
2、第1、2、3字節(jié)表示校驗(yàn)位,固定為“P”“Z”“K”;第4字節(jié)表示數(shù)據(jù)位。
3、第4字節(jié)即數(shù)據(jù)1,位=1則繼電器開(kāi),位=0則繼電器1關(guān)。
4、第3字節(jié)即數(shù)據(jù)2,位=1則繼電器開(kāi),位=0則繼電器2關(guān)。
因此如果接收到數(shù)據(jù)PKZ11,首先判斷第1 、2 、3 字節(jié)是否=“P”“K”“Z”,再判斷第4、5字節(jié),如果=11,則繼電器開(kāi),即電控鎖關(guān)。
本系統(tǒng)的目標(biāo)是使人臉特征向量作為身份認(rèn)證的手段,對(duì)用戶進(jìn)行認(rèn)證,判斷該用戶是否為他(她)所聲稱(chēng)的用戶。因此,根據(jù)身份認(rèn)證和人臉識(shí)別技術(shù)的特點(diǎn),系統(tǒng)需要實(shí)現(xiàn)以下
功能。
(1)人臉檢測(cè)和特征提取功能。
因?yàn)樵谌四樧R(shí)別時(shí)只需要輸入圖像中人臉的特征向量,而通常輸入的圖像中除了人臉之外還有背景信息包含在里面,所以在進(jìn)行人臉識(shí)別前的首要任務(wù)就是要從輸入圖像中將人臉特征向量提取出來(lái)。要能有實(shí)時(shí)的、基于視頻流的人臉檢測(cè)、跟蹤和特征提取功能,有效地提取人臉特征向量。
(2)人臉識(shí)別功能。
要能在提供用戶口令和人臉圖像信息的情況下實(shí)現(xiàn)迅速的身份認(rèn)證,所以系統(tǒng)要具有實(shí)時(shí)、高效、準(zhǔn)確的人臉識(shí)別功能。
(3)數(shù)據(jù)庫(kù)管理功能。
經(jīng)常需要向用戶信息數(shù)據(jù)庫(kù)中添加、刪除或修改用戶信息,所以系統(tǒng)需要具有數(shù)據(jù)庫(kù)管理功能,可以將用戶信息保存到數(shù)據(jù)庫(kù)中,并且可以修改或者刪除數(shù)據(jù)庫(kù)中信息。
(4)人臉識(shí)別門(mén)禁系統(tǒng)還包括錄像監(jiān)控[3]、門(mén)禁控制和報(bào)警三大功能,每個(gè)功能由若干個(gè)相應(yīng)的子模塊實(shí)現(xiàn)。這些功能模塊提供了人臉的采集、校驗(yàn)、信號(hào)的傳送和驅(qū)動(dòng)電路、考勤記錄以及報(bào)警等功能。通過(guò)計(jì)算機(jī)可同時(shí)對(duì)若干個(gè)門(mén)禁通道和攝像機(jī)進(jìn)行管理,能授權(quán)不同的修改權(quán)限。開(kāi)門(mén)邏輯可設(shè)定為“一人開(kāi)門(mén)”或“多人與開(kāi)門(mén)”方式,即核查一人正確即可開(kāi)門(mén),或同時(shí)對(duì)倆人(或三人)的人臉進(jìn)行“與”校驗(yàn),結(jié)果正確方可驅(qū)動(dòng),否則,進(jìn)行報(bào)警。
該系統(tǒng)的設(shè)計(jì)可充分滿足某些特殊門(mén)禁管理的需要。對(duì)進(jìn)出人員進(jìn)出時(shí)間、門(mén)和電控鎖的狀態(tài)、報(bào)警情況進(jìn)行記錄、錄像,人臉校驗(yàn)的工作流程如圖3所示。報(bào)警功能即非法開(kāi)門(mén)報(bào)警。當(dāng)通過(guò)非法手段開(kāi)門(mén)時(shí),系統(tǒng)會(huì)輸出“非法開(kāi)門(mén)”報(bào)警信號(hào),聯(lián)動(dòng)報(bào)警系統(tǒng),保證系統(tǒng)安全可靠地運(yùn)行。
圖3 人臉門(mén)禁(報(bào)警)的工作流程
人臉識(shí)別門(mén)禁系統(tǒng)的實(shí)現(xiàn)及其性能指標(biāo)
該系統(tǒng)采用微軟公司的可視化編程工具M(jìn)icroso Visual Studio 2005作為開(kāi)發(fā)平臺(tái),利用面向?qū)ο蟮姆治龊驮O(shè)計(jì)方法進(jìn)行程序設(shè)計(jì)。在本文中,該系統(tǒng)主要屬性有:人臉采集攝像頭、控制面板、攝像機(jī)等。首先對(duì)各對(duì)象的屬性建立需求模型[4],然后,確定類(lèi)和對(duì)象[5]所屬的主題詞,并按主題詞劃分子系統(tǒng)。
利用面向?qū)ο蠹夹g(shù)實(shí)現(xiàn)人臉識(shí)別門(mén)禁系統(tǒng)的設(shè)計(jì),根據(jù)P.Coad 和E.Yourdon 提出的面向?qū)ο笤O(shè)計(jì)模型,進(jìn)行系統(tǒng)設(shè)計(jì),它主要由“主體部件”、“用戶界面部件”、“任務(wù)管理部件”和“數(shù)據(jù)管理部件”構(gòu)成??紤]到人臉識(shí)別門(mén)禁系統(tǒng)由人臉采集、攝像以及驅(qū)動(dòng)電路組成,當(dāng)系統(tǒng)某個(gè)人臉采集攝像頭被觸發(fā)時(shí),立即激活相應(yīng)的模塊,系統(tǒng)的設(shè)計(jì)完全展現(xiàn)了面向?qū)ο笤O(shè)計(jì)模型的方法。
軟件界面
根據(jù)面向?qū)ο蟮姆治龊驮O(shè)計(jì)方法,建立了相應(yīng)的系統(tǒng)模型,利用C + +編程語(yǔ)言進(jìn)行程序設(shè)計(jì),運(yùn)行界面由五部分組成。
(1)菜單區(qū)。進(jìn)行系統(tǒng)的初始化設(shè)置和操作功能,由系統(tǒng)設(shè)置、校驗(yàn)、查詢(xún)狀態(tài)、打印、幫助五個(gè)菜單項(xiàng)組成。
(2)圖像顯示區(qū)。顯示攝像機(jī)的圖像信號(hào)。
(3)電控鎖(門(mén))狀態(tài)顯示區(qū)。顯示電控鎖(門(mén))開(kāi)啟狀態(tài)。
(4)狀態(tài)條。進(jìn)行系統(tǒng)日期、時(shí)間、報(bào)警的顯示。
(5)按鍵控制區(qū)。進(jìn)行攝像機(jī)的選擇、云臺(tái)控制和鏡頭控制等功能。
性能指標(biāo)
(1)人像獲取時(shí)間小于 2 秒,人像識(shí)別時(shí)間小于 2 秒;
(2)人像檢測(cè)率 94.5%,錯(cuò)誤拒絕率小于 2%,錯(cuò)誤接受率小于 0.05%;
(3)光照條件:自然光照,普通燈光采光;
(4)視頻輸入:320×240 8bit 以上灰度圖像;
(5)數(shù)據(jù)庫(kù)容量:不限(僅取決于數(shù)據(jù)庫(kù)的容量),每人 1-9 幅樣本圖像。
結(jié)語(yǔ)
人臉識(shí)別門(mén)禁系統(tǒng)是一種全新的多功能系統(tǒng),它克服了密碼識(shí)別系統(tǒng)的局限,解決了傳統(tǒng)密碼識(shí)別系統(tǒng)容易被破解的缺陷,提高了系統(tǒng)的安全性、可靠性,本系統(tǒng)把人臉識(shí)別和錄像監(jiān)控技術(shù)有效地結(jié)合起來(lái),功能更為完善,更具有商業(yè)價(jià)值。這種新興的多媒體監(jiān)控系統(tǒng)將逐步滲透到安全、生產(chǎn)、生活的方方面面。隨著網(wǎng)絡(luò)技術(shù)、通信技術(shù)及計(jì)算機(jī)技術(shù)的發(fā)展,它將得到更廣泛的應(yīng)用。