【摘要】对于一个完整的、自动的人脸信息分析系统来说,高效的人脸检测算法是必不可少的。本文主要是对彩色图像皮肤区域分割算法及人脸检测系统的设计研究。主要运用了ycbcr色彩空间的肤色模型,利用其混合高斯分布的特性对肤色进行比对分割。最终得出基于高斯肤色模型的图像皮肤区域分割算法。
【关键词】高斯肤色模型 皮肤分割 人脸检测
1 引言
人脸检测(face detection)主要是指在输入图像中确定人脸(如果存在)的位置、大小等信息。基本思想是利用统计的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配度。人脸检测系统的输入是可能包含人脸的图像,也可能是不包含人脸的图像,输出是关于图像中是否存在人脸以及人脸的数目、位置、尺度、位姿等信息的参数化描述。人脸检测问题如果追踪求源的话,它来源于人脸识别(face recognition),而人脸识别的研究可以追溯到20世纪60—70年代,经过几十年的曲折发展己日趋成熟。人脸检测是自动人脸识别系统中的一个重要环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像(如无背景的图像),往往假设人脸位置己知或很容易获得,因此人脸检测问题并未受到重视。近几年随着信息化社会的发展,人脸识别成为最有潜力的生物身份验证手段,这使得人脸检测开始作为一个独立的课题受到研究并得到重视。在检测静止目标的场合中,肤色的应用提供有价值的候选区域。比如,在人脸的检测中,图像中的肤色区域可有助于加速人脸的检测过程。本文将对基于高斯肤色模型的图像皮肤区域分割算法进行研究。
2 色度空间模型选取
在具体的色度空间中通过实践找到肤色区间,建立起可操作性的肤色模型,这样就让提取肤色信息成为了人脸检测的核心方法。不同肤色模型的建立基于不同的色度空间,且为色度空间的一个子空间。肤色信息主要由肤色模型描述。使用何种形式的肤色模型与色度空间(chrominance space)选择密切相关。可以从两个方面考察某种色度空间:(1)在该色度空间中能否用给定的模型描述“肤色”区域的分布;(2)色度空间中“肤色”与“非肤色”区域的重叠有多少。人脸检测常用的色度空间主要有:rgb(亮度归一化的三基色)、hsi(色调、饱和度、亮度)、yiq(ntsc制的光亮度和色度模型)、yuv(pal制的光亮度和色度模型)、ycbcr(ccir601)编码方式的色度模型、ciel(国际照明委员会提出的基于色度学的彩色模型)等。
不论在什么样的色度空间中,肤色模型大体上分为四种:区域模型(if-then)模型、简单高斯模型、混合高斯模型和直方图模型。
2.1 区域模型
该模型又称if-then模型、简单门限模型,它主要是利用了肤色在色度空间的聚类性(即取值范围),将一块满足一定条件的区域标定为肤色区域。采用这个模型来判别肤色需要分两步:首先通过统计的方法确定模型(即归属于肤色的具体范围);其次利用这个模型来判别新的像素或区域是否为肤色。因此,对于一幅新的图像,如果某个像素或区域满足给定的条件就为肤色,否则就是非肤色。从上面的判断过程来看,它是一种较简单的肤色模型。该模型的困难之处在于如何确定阈值。阈值选择不当可能会使肤色检测率下降,误检率上升。此方法计算简单,使用方便,速度快,但是效果不是很好,只适用于特定条件下的肤色检测。
2.2 简单高斯模型
这种方法是假设肤色分布服从单峰高斯分布。它主要通过统计分析,预测高斯分布的参数,其中参数确定常用的方法有em算法,maximum-likelihood或通过统计直接求得色度空间中每个分量(一般利用的是该色度空间中的色度分量)的均值与方差。采用这种方法也分为两步:首先选择方法确定模型的参数(即均值和方差);其次利用该模型来判别新的像素或区域是否为肤色。简单高斯模型相对区域模型能更好的表示肤色分布,因此相对而言,它的肤色检测率也高出许多,并且模型的参数也易于计算,但是速度比区域模型慢。
2.3 混合高斯模型
由于具有不同种族的肤色直方图并不完全满足单峰高斯分布,通过研究可以采用多峰的高斯分布来精确表示。因此,提出了混合高斯模型,如公式2.1所示:
(2.1)
其中,为肤色像素在色彩空间中的混合概率密度,为分量的概率密度,为分量的先验概率,i=1, 2,...,m为混合密度的分量个数。该模型表明肤色的每个像素密度都属于概率密度的混合体。在这个模型中主要难点是对混合高斯模型的参数估计,其参数的估计常采用基于极大似然的算法。利用该算法需要进行迭代,而迭代的收敛速度受参数的初值影响,同时与分量密度个数关系很大,分量越多,运算越复杂。这种方法相对于前面两种模型来说,肤色的检测率要高得多,误检率也要小得多,但是模型的确定(即模型的参数估计)较难,速度相对来说也比较慢,不适合快速的肤色检测。
2.4 直方图模型
通过对肤色直方图的统计,然后利用阈值来进行判别。对于三维直方图,尽管效果很好,但是需要很多的训练样本,而且训练时间很长。由于样本原因和时效性差,这里不详细讨论这种方法。
3 ycbcr色彩空间模型
ycbcr色彩系统是一种常见的重要的色彩系统,网络上比比皆是的jpeg图片采用的色彩系统正是该系统。本文则着重对此肤色模型进行研究。它由yuv色彩系统衍生而来,cb=k1,cr=k2,其中k1、k2分别为压缩系数,压缩的目的是防止色差信号对亮度信号的干扰及超过亮度信号的电平,也就是说cb和cr则是将u和v做少量调整而得到的。y仍为亮度信息(电视机中称其为亮度信号)。ycbcr色彩系统与rgb色彩系统的转换关系如下:
y=0.299*r+0.587*g+0.114*b
cr=(r-y)*0.713+128
cb=(b-y)*0.564+128
即:
3.1 cbcr空间肤色区域模型
由于统计表明不同人种的肤色区别主要受亮度信息影响,而受色度信息的影响较小,所以直接考虑ycbcr空间的cbcr分量,映射为cbcr空间,在cbcr空间下,受亮度变化的影响少,而且是二维独立分布。通过实践,选取大量肤色样本进行统计,发现肤色在cbcr空间的分布呈现良好的聚类特性,统计分布满足:
77≤cb≤127(3.1)
并且满足
133≤cr≤173 (3.2)
3.2 高斯肤色模型
不同人种的皮肤虽然相差很大,但在色度上的差异远远小于亮度上的差异,其实不同人的肤色在色度上比较接近,但在亮度上的差异很大,在二维色度平面上,肤色的区域比较集中,可以用高斯分布描述。
根据肤色在色度空间的高斯分布,对根据肤色在色度空间的高斯分布,对于彩色图像中每个像素,将其从rgb色彩空间转换到ycbcr空间后,就可以计算该点属于皮肤区域的概率,即根据该点离高斯分布中心的远近得到和肤色的相似度,将彩色图像转化为灰度图,其中每个像素的灰度对应该点与肤色的相似度,相似度的计算公式如下:
(3.3)
其中,m为均值,m=e(x),c为协方差矩阵,。
肤色分布的2d高斯模型g(m,v2)也可表示为:
其中,为cb、cr相应的平均值,v为协方差矩阵。
通过高斯肤色模型将彩色图像转换为相似度灰色图像后,选取合适的阈值,就可以分离肤色与非肤色区域。这种肤色模型的特点是基于统计的肤色模型,它需要对每一个像素点进行相似度计算,因此速度也不是太快。当然在实际用于肤色检测中,可以直接利用公式(3.3)中的项进行判决,以提高检测速度。
结合以上分析由于人肤色的不同主要体现为亮度分量的不同,所以选择亮度分量和色度分量分离的ycbcr 色彩空间进行肤色建模。
4 基于ycbcr空间的高斯肤色模型的检验
4.1 肤色模型的建立
为了利用肤色在色度空间的聚类性,选取ycbcr色彩空间进行肤色提取。首先选取大量彩色图片进行手工处理只保留人体皮肤区域。接下来将彩色图片颜色空间转换到ycbcr空间,然后对该区域的cbcr值进行统计处理。处理的方法就是采用前文提到的高斯模型。
,c为协方差矩阵,。
通过这个肤色高斯分布可得到待检测彩色图像中任意一个像素点属于皮肤的概率。对于某像素点s,从rgb空间转换到ycbcr色彩空间得到色度值(cb,cr)则该像素的肤色概率密度可由下式计算得到:
式中:。
通过计算,得到m和c的值如下:
(4.1)
(4.2)
4.2 肤色分割步骤
图片空间低通滤波是为了减少图像高频噪声的影响,先采用低通滤波器对图象进行处理。采用的低通滤波器的冲击响应矩阵为:
(4.3)
对于一幅被检测的彩色图像,首先将它由rgb 空间转换到ycbcr色彩空间,便于后面的统计。
(1)得到似然图:根据(cb,cr)值通过式(3.3)找到该值所对应的肤色似然度,并且得到整幅图像的最大肤色似然度。每一点像素的肤色似然度除以最大肤色似然度所得到的值,作为该像素点的灰度值,从而得到肤色似然度图像,其中每一个像素点的灰度值表征了这个像素点属于皮肤的概率。
(2)阈值分割:阈值分割的目的是将皮肤与图片背景分开。通常有固定阈值法、自适应阈值法等。建议选用的是固定阈值法,主要是从运算速度上考虑的。当然,相比之下,自适应的阈值法一般不会漏检,检测效果肯定比固定值法好。
(3)图像二值化处理:二值化处理的目的是将皮肤区域和其他区域更好地区分开来。皮肤区域用“1”(白色)表示,其他区域用“0”(黑色)表示。
(4)形态学处理:该步骤的目的是改善分割效果。形态学(morphology)原本是对于动植物调查时采取的某种形式的研究。数学形态学(mathematical morphology)是分析几何形状和结构的数学方法,它建立在集合代数的基础上,是用集合论方法定量描述集合结构的学科。1985年之后,数学形态学逐渐成为分析图像几何特征的工具。数学形态学包括一组基本的形态学运算子:腐蚀(erosion),膨胀(dilation)、开运算(opening)、闭运算(closing)等。运用这些算子及其组合来进行图像形状和结构的分析及处理。形态学的理论基础是集合论。在图像处理中形态学的集合代表着黑白和灰度图像的形状,如黑白图像中的所以黑像素点组成了此图像的完全描述。通常我们选择图像中感兴趣的目标图像区域像素集合来进行形态学变换。
通常,当有噪声的图像用闭值二值化时,所得到的边界往往是不平滑的,物体区域具有一些错判,背景区域上则散布着一些小的噪声。使用形态学上的连续的开和闭运算可以显著的改善这种情况。开闭运算后的图像可以去除图像上的一些细小的毛刺,达到去噪的目的。填孔处理可以进一步去除毛刺,但是也将一些非皮肤区域保留为皮肤区域处理。所以综合考虑后,只采用开闭运算改善效果。
5 结论
实验结果表明:在ycbcr色度空间中的高斯肤色模型的聚类特性比较好。ycbcr色度空间中的高斯肤色模型具有如下优点:
(1)具有与人类视觉感知过程相类似的构成原理。
(2)ycbcr色彩空间格式被广泛地应用在电视显示等领域中,也是许多视频压缩编码,如mpeg, jpeg等标准中普遍采用的颜色表示格式。
(3)ycbcr色彩空间格式具有与hsi等其他一些色彩空间格式相类似的将色彩中的亮度分量分离出来的优点,有助于提高皮肤区域分割的效果。
(4)ycbcr色彩空间格式的计算过程和空间坐标表示形式相比于hsi等其他一些色彩空间格式比较简单,从而提高皮肤区域分割的速度。
参考文献
[1] jie yang, weier lu, alex waibel. skin-color modeling and adaptation[j].cmu-cs-97-146, may 1997.
[2] terrillon j c, shirazi m n, fukamachi h, et al. comparative performance of different skin chrominance models and chrominance spaces for the automatic detection of human faces in color images. in: proc.conf. on automatic face and gesture recognition, grenoble, france, 2000.
[3] 李伟.基于肤色分割的人脸检测技术,电子科技大学硕士论文,2006.
[4] 何东健.数字图像处理[m],西安电子科技大学出版社,2003.
[5] 冈萨雷斯.数字图像处理(matlab版)[m],电子工业出版社,2006.
[6] 章毓晋.图像处理[m],清华大学出版社,2006.
[7] 陈永春.matlab m语言高级编程[m],清华大学出版社,2004.