人臉識別(FaceRecognition,FR)是一種基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行臉部識別的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。
人臉識別系統(tǒng)的研究始于20世紀(jì)60年代,80年代后隨著計算機(jī)技術(shù)和光學(xué)成像技術(shù)的發(fā)展得到提高,而真正進(jìn)入初級的應(yīng)用階段則在90年后期;近幾年隨著以深度學(xué)習(xí)為主的人工智能技術(shù)進(jìn)步,人臉識別技術(shù)得到了迅猛的發(fā)展?!叭四樧R別系統(tǒng)”集成了人工智能、機(jī)器識別、機(jī)器學(xué)習(xí)、模型理論、專家系統(tǒng)、視頻圖像處理等多種專業(yè)技術(shù),是綜合性比較強(qiáng)的系統(tǒng)工程技術(shù)。
人臉識別流程
人臉識別系統(tǒng)通常包括幾個過程:人臉圖像采集及檢測、關(guān)鍵點(diǎn)提取、人臉規(guī)整(圖像處理)、人臉特征提取和人臉識別比對。
人臉圖像采集。不同的人臉圖像都能通過攝像鏡頭采集下來,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。當(dāng)用戶在采集設(shè)備的拍攝范圍內(nèi)時,采集設(shè)備會自動搜索并拍攝用戶的人臉圖像。
人臉檢測。人臉檢測在實(shí)際中主要用于人臉識別的預(yù)處理,即在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小。
關(guān)鍵點(diǎn)提取(特征提取)。人臉識別系統(tǒng)可使用的特征通常分為視覺特征、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對人臉的某些特征進(jìn)行的。人臉特征提取,也稱人臉表征,它是對人臉進(jìn)行特征建模的過程。人臉特征提取的方法歸納起來分為兩大類:一種是基于知識的表征方法;另外一種是基于代數(shù)特征或統(tǒng)計學(xué)習(xí)的表征方法。
人臉規(guī)整(預(yù)處理)。對于人臉的圖像預(yù)處理是基于人臉檢測結(jié)果,對圖像進(jìn)行處理并最終服務(wù)于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機(jī)干擾,往往不能直接使用,必須在圖像處理的早期階段對它進(jìn)行灰度校正、噪聲過濾等圖像預(yù)處理。對于人臉圖像而言,其預(yù)處理過程主要包括人臉圖像的光線補(bǔ)償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
人臉識別比對(匹配與識別)。提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進(jìn)行搜索匹配,通過設(shè)定一個閾值,當(dāng)相似度超過這一閾值,則把匹配得到的結(jié)果輸出。人臉識別就是將待識別的人臉特征與已得到的人臉特征模板進(jìn)行比較,根據(jù)相似程度對人臉的身份信息進(jìn)行判斷??煞譃?span>1:1、1:N、屬性識別。其中1:1是將2張人臉對應(yīng)的特征值向量進(jìn)行比對,1:N是將1張人臉照片的特征值向量和另外N張人臉對應(yīng)的特征值向量進(jìn)行比對,輸出相似度高或者相似度排名前X的人臉。
人臉特征分析算法
人臉識別技術(shù)中被廣泛采用的區(qū)域特征分析算法,它融合了計算機(jī)圖像處理技術(shù)與生物統(tǒng)計學(xué)原理于一體,利用計算機(jī)圖像處理技術(shù)從視頻中提取人像特征點(diǎn),利用生物統(tǒng)計學(xué)的原理進(jìn)行分析建立數(shù)學(xué)模型,即人臉特征模板。利用已建成的人臉特征模板與被測者的人的面像進(jìn)行特征分析,根據(jù)分析的結(jié)果來給出一個相似值。通過這個值即可確定是否為同一人。
人臉識別的方法很多,主要的人臉識別方法有:
(1)幾何特征的人臉識別方法:幾何特征可以是眼、鼻、嘴等的形狀和它們之間的幾何關(guān)系(如相互之間的距離)。這些算法識別速度快,需要的內(nèi)存小,但識別率較低。
(2)基于特征臉(PCA)的人臉識別方法:特征臉方法是基于KL變換的人臉識別方法,KL變換是圖像壓縮的一種正交變換。高維的圖像空間經(jīng)過KL變換后得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識別的特征矢量,這就是特征臉方法的基本思想。這些方法需要較多的訓(xùn)練樣本,而且完全是基于圖像灰度的統(tǒng)計特性的。目前有一些改進(jìn)型的特征臉方法。
(3)神經(jīng)網(wǎng)絡(luò)的人臉識別方法:神經(jīng)網(wǎng)絡(luò)的輸入可以是降低分辨率的人臉圖像、局部區(qū)域的自相關(guān)函數(shù)、局部紋理的二階矩等。這類方法同樣需要較多的樣本進(jìn)行訓(xùn)練,而在許多應(yīng)用中,樣本數(shù)量是很有限的。
(4)彈性圖匹配的人臉識別方法:彈性圖匹配法在二維的空間中定義了一種對于通常的人臉變形具有一定的不變性的距離,并采用屬性拓?fù)鋱D來代表人臉,拓?fù)鋱D的任一頂點(diǎn)均包含一特征向量,用來記錄人臉在該頂點(diǎn)位置附近的信息。該方法結(jié)合了灰度特性和幾何因素,在比對時可以允許圖像存在彈性形變,在克服表情變化對識別的影響方面收到了較好的效果,同時對于單個人也不再需要多個樣本進(jìn)行訓(xùn)練。
(5)線段Hausdorff距離(LHD)的人臉識別方法:心理學(xué)的研究表明,人類在識別輪廓圖(比如漫畫)的速度和準(zhǔn)確度上絲毫不比識別灰度圖差。LHD是基于從人臉灰度圖像中提取出來的線段圖的,它定義的是兩個線段集之間的距離,與眾不同的是,LHD并不建立不同線段集之間線段的一一對應(yīng)關(guān)系,因此它更能適應(yīng)線段圖之間的微小變化。實(shí)驗(yàn)結(jié)果表明,LHD在不同光照條件下和不同姿態(tài)情況下都有非常出色的表現(xiàn),但是它在大表情的情況下識別效果不好。
(6)支持向量機(jī)(SVM)的人臉識別方法:支持向量機(jī)是統(tǒng)計模式識別領(lǐng)域的一個新的熱點(diǎn),它試圖使得學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險和泛化能力上達(dá)到一種妥協(xié),從而提高學(xué)習(xí)機(jī)的性能。支持向量機(jī)主要解決的是一個2分類問題,它的基本思想是試圖把一個低維的線性不可分的問題轉(zhuǎn)化成一個高維的線性可分的問題。通常的實(shí)驗(yàn)結(jié)果表明SVM有較好的識別率,但是它需要大量的訓(xùn)練樣本(每類300個),這在實(shí)際應(yīng)用中往往是不現(xiàn)實(shí)的。而且支持向量機(jī)訓(xùn)練時間長,方法實(shí)現(xiàn)復(fù)雜,該函數(shù)的取法沒有統(tǒng)一的理論。
人臉識別考勤系統(tǒng)
重要關(guān)鍵技術(shù)
基于大數(shù)據(jù)的深度學(xué)習(xí)
在人臉識別原理一節(jié)中提到了一些特征提取和分類算法,可以理解為是一種淺層的學(xué)習(xí)模型。淺層學(xué)習(xí)可以在一定規(guī)模的數(shù)據(jù)集下可以發(fā)揮較強(qiáng)的表達(dá)能力,但當(dāng)數(shù)據(jù)量不斷增大時,這些模型就會處于欠擬合的狀態(tài)。通俗點(diǎn)說就是數(shù)據(jù)量太大,模型不夠復(fù)雜,覆蓋不了所有數(shù)據(jù)。所以說,深度學(xué)習(xí)是近年來特別熱門的研究課題。
基于大數(shù)據(jù)的深度學(xué)習(xí),將是人臉識別技術(shù)的主要趨勢之一。深度學(xué)習(xí),往往含有更深的層次結(jié)構(gòu)。越是低層,特征越簡單,越是高層,特征越抽象,但越接近所要表達(dá)的意圖。舉個例子,從字到詞,再到句,到語義,是層層深化的過程,這就是一個典型的深層結(jié)構(gòu)?;氐綀D像分析的范疇,對于一個圖片來說,低級的特征是像素,也就是0到255的矩陣。通過像素,無法理解圖片里的目標(biāo)是什么,但我們可以從像素中找到了邊緣特征,然后用邊緣特征組合成不同的部件,最后形成了不同種類的目標(biāo)物,這個才是我們所想要實(shí)現(xiàn)的。
利用深度學(xué)習(xí)提取出的人臉特征,相比傳統(tǒng)技術(shù),更能表示人臉之間的相關(guān)性,輔之有效的分類方法,能夠顯著提高算法識別率。深度學(xué)習(xí)非常依賴大數(shù)據(jù),這也是為什么這項(xiàng)技術(shù)在近幾年取得突破的原因。更多更豐富的樣本數(shù)據(jù)加入到訓(xùn)練模型中,意味著算法模型將更通用,更貼近現(xiàn)實(shí)世界模型。另一方面,深度學(xué)習(xí)的理論性還需要加強(qiáng),模型還需要優(yōu)化。這一點(diǎn),相信在眾多學(xué)術(shù)界和工業(yè)界同仁的努力下,深度學(xué)習(xí)將取得更大的成功。屆時人臉識別應(yīng)用,或許能如現(xiàn)在的車牌識別技術(shù)一樣,深入到我們的生活中。
3D人臉識別技術(shù)
3D人臉識別技術(shù)是人臉識別重要發(fā)展發(fā)現(xiàn)。目前大部分的人臉識別應(yīng)用的范疇限定在2D圖像上。人臉實(shí)質(zhì)上是一個立體模型,而2D人臉識別容易受到姿態(tài)、光照、表情等因素影響,是因?yàn)?span>2D圖像本身有一個缺陷,無法很好地表示深度信息。如果說深度學(xué)習(xí)是從人的認(rèn)知角度來理解人臉識別,那么3D技術(shù)就是從現(xiàn)實(shí)模型來反映人臉識別。
目前關(guān)于3D人臉識別方向的算法研究并沒有2D人臉識別技術(shù)那么豐富和深入,許多因素限制了這項(xiàng)技術(shù)的發(fā)展。首先,3D人臉識別往往需要特定的采集設(shè)備,如3D攝像機(jī)或雙目攝像機(jī)。目前這類采集設(shè)備價格還比較昂貴,主要用于特定場景。其次,3D建模過程需要的計算量較大,對硬件要求較高,也限制了目前的應(yīng)用。第三,3D人臉識別數(shù)據(jù)庫比較稀少,研究者缺少訓(xùn)練樣本和測試樣本,無法開展更深入的理論研究。相信隨著未來芯片技術(shù)和傳感器的發(fā)展,當(dāng)計算能力不再收到制約,3D采集設(shè)備成本大幅下降的時候,3D人臉識別將取得重要突破