王琪1,杜娟1,徐国清1,程彬2
(1.南阳理工学院计算机与信息工程学院,河南南阳473000;2.南阳理工学院软件学院,河南南阳473000)
摘要:颜色特征是图像最直观的特征,传统的颜色直方图虽然能够描述图像中各颜色分量的比例,然而却破坏了图像各颜色分量的空间位置分布信息,从而使得图像检索结果不准确。因此,提出一种分块颜色核特征的方法,使用重叠分块策略,强调图像中心的视觉内容,同时,设计颜色核函数将分块颜色直方图映射到核特征空间,更准确地描述图像颜色特征。经过实验证明,该方法与全局颜色直方图相比,分块颜色特征有较高的查准率和查全率。
教育期刊网 http://www.jyqkw.com
关键词 :颜色特征;图像检索;重叠分块;核函数
中图分类号:TN911.73?34;TP391 文献标识码:A 文章编号:1004?373X(2015)15?0042?03
收稿日期:2015?02?09
0 引言
随着网络的发展,图像数据量剧增,基于内容的图像检索可以有效地解决在众多图像数据中搜索到目标图像的问题,其关键问题是提取图像的视觉特征。颜色特征是图像最基础最直接的特征且鲁棒性较好,然而传统的颜色直方图虽然能够很好地表征颜色分量的含量,但却无法体现各颜色分量的空间分布情况,往往造成颜色直方图和图像之间一对多的关系即不同图像拥有相同的颜色直方图,因而造成图像检索结果准确性较低[1?2]。同时,均匀分块虽然可以体现颜色空间分布,但是由于分块模板大小难以把握,分块过大则不能较好地体现空间分布情况失去分块意思,而分块过小则使得图像整体内容被破坏,过分关注细节内容,从而失去了颜色特征的鲁棒性优势[3];另一方面,颜色特征是线性空间特征,对于细节差异的区分度较差[4]。当检索正确图像与错误图像的特征向量差异性量纲过小时,无法通过选择合适的阈值过滤掉错误图像,则检索结果中返回大量错误图像,对用户形成极大的干扰。
基于以上分析,本文提出一种重叠分块颜色核特征的方法来更好地描述图像的颜色视觉内容,该方法共分为三步:首先,以4×4为模板对图像进行划分,形成4×4个分块;然后,在4×4 分块的基础上,除去四个角的分块,以2×2 模板进行滑动分块,从而获得5 个重叠的分块;最后,获得每个子块的颜色直方图通过核函数形成分块颜色核特征,从而获得图像颜色内容的更准确描述。
1 算法描述
1.1 颜色直方图
颜色直方图因其实现简单成为当前最广泛采用的表示图像视觉内容的方法,由于它关注的是整幅图像各颜色分量比例,因此存在较好的全局性、旋转以及尺度不变性[5]。
(1)由于HSV空间与人眼感知色彩的方式较一致,将彩色图像从RGB转换到HSV空间获得的颜色特征更适合视觉模型;
(2)进行量化处理。理论上直接对真彩图像进行颜色直方图的计算获得结果更加真实准确,但实际上人眼对很多颜色细节并不敏感,而真彩图像则花费大量的计算在这些并不重要的细节方面,通常需要对真彩图像进行颜色量化突出人眼敏感的主要颜色,本文使用了简单而快速的查色表量化方法对HSV数据进行非均匀量化,同时完成了从3 维HSV 分量中获取1 维颜色特征值,量化方法如下:
(3)根据式(1)中颜色特征值L 计算各颜色值发生频率即获得颜色直方图,如式(2)所示:
式中:nk 表示颜色特征值为k 出现的频率;n 则表示像素总数。
1.2 分块策略
图像的全局颜色直方图能够描述图像全局颜色成分,具有良好的视觉感知效果,同时,有较好的旋转不变性,但是缺乏图像空间分布信息,使得完全不同的图像可能拥有较相近的颜色直方图,造成基于颜色特征的图像检索准确率低[6]。而传统的分块方法将图像划分为大小相同的小块,虽然可以增加图像空间分布信息,但是破坏了图像的主体部分,并且忽略了子块之间的联系。本文提出重叠分块的分块策略,首先,对图像进行均匀分块,使得颜色特征包含空间分布信息;然后,在均匀分块的基础上,使用固定模板对除去四角分块外的图像进行2 次滑动分块,使得图像中间区域在分块时进行重叠,从而强调图像中间部分,克服了分块带来的图像主体部分遭到破坏的缺点。因此,本文分块策略即获得了颜色空间分布信息,又较好地保存了颜色特征的整体性。步骤如下:
(1)将原图像按照4×4的模板进行分割,形成16个大小相同的分块,如图1所示,S11~S44为16个分块。
(2)在这16个分块的基础上进一步分块。上下左右4个角由于处于图像边缘,用户感兴趣度不高,因此对这些分块不进行再次处理,取这四个角的分块作为最终结果中的前四个分块区域用F1~F4 表示,其余分块以2×2为模板进行滑动分块得到新的5个分块,即F5={S12,S13,S22,S23};F6={S22,S23,S32,S33};F7={S32,S33,S42,S43};F8={S21,S22,S31,S32};F9={S23,S24,S33,S34}。最终获得了F1~F9共9 个分块,可以看出,图像的中间区域即F6 实质上强调了3次,而图像的周边区域仅出现1次,因此,本文重叠分块策略能够有效地突出图像主体部分,避免分块带来的图像主体部分分裂问题。同时,由于分块的划分,使得颜色特征增加了空间分布信息。
1.3 分块颜色核函数
分块包含了颜色的空间位置信息,而重叠的分块又强调了图像中间区域的内容,因此,本文颜色特征可通过计算由重叠分块获得的这9个子块的颜色直方图获得。分别提取9个子块的颜色直方图,最后将之合并为1维的图像重叠分块颜色特征向量。
颜色直方图是低维特征,采用传统欧式距离的方式计算相似性,往往遇到这样的情况,相似性距离过于集中或者过于离散,那么很难找到一个合适的阈值使得返回结果准确。阈值过大则返回结果中不相关图像较多,查准率降低;而阈值过小则可能将相关图像隔离在外,查准率降低[7]。因此,需要寻求一种方法更准确地描述图像视觉特征使其更有利于区分不相关图像。核函数能解决这种线性不可分的问题,使低维颜色直方图变换到高维的核空间,放大特征之间关联性[8?9],使相似特征集中,而不相似特征远离,从而可以很好地找到一个阈值将之划分开,因此,能够更准确地描述图像的颜色特征,克服了低维特征线性不可分的问题。同时,核函数维数与输入特征的维数无直接关系,可以避免“维数灾难”,对特征值进行有效的降维。
高斯核是一个符合Mercer条件的核函数[10],如式(3)所示,其中,x,y 分别表示两个低维空间的颜色特征。依据分块颜色直方图的统计特性,本文通过高斯核原理设计了颜色核函数,可将颜色特征转换到高维核空间进行更精确的处理。
公式(4)为分块颜色核函数,φ2 实质上表示了两个图像的分块颜色直方图的相似性,φ2 越高,则两个样本在核空间中越聚集。颜色直方图的相似性采用φ2 统计矩,如式(5)所示:
2 实验结果与分析
实验图像数据库由corel 图像库中的花朵,马,风景,公交车,建筑,印第安人,蝴蝶,夕阳,沙滩,大象共1 000幅图像,每类100幅图像,图2是以图中左上角第一幅黄色花朵图像为待测图像,采用传统全局颜色直方图的方法获得的检索结果,由于全局颜色直方图只关注颜色成分,而没有颜色分布信息,因此检索结果中有很多干扰图像。图3为用本文方法获得的检索结果,由于本文方法不仅包含颜色成分信息,同时有颜色分布信息,且运用颜色核函数使得颜色特征突出差异性,从图2和图3可以看出,图2中的检索结果有较多错误图像,图3结果全部与花朵有关,显示了本文方法的有效性,检索结果明显优于全局颜色特征。
在实验图像库上分别运用3 种方法检索与本文方法进行对比,即全局颜色直方图,均匀分块,重叠分块与本文重叠分块颜色核特征方法进行对比。在花朵,风景,马,公交车,建筑,印第安人这6类图像中,分别从每类中随机抽取10幅图像作为测试图像,通过上述4种方法进行检索,因而每类图像获得10次检索结果,对这10次检索结果的查准率和查全率进行平均,从而获得这类图像的平均查全率和平均查准率,将其作为检索结果的评价准则。图4和图5分别是这4种方法进行图像检索的结果对比,可见,本文方法无论是查准率还是查全率,都明显优于传统全局颜色直方图,均匀分块颜色直方图,重叠分块颜色直方图。
3 结语
颜色特征在基于内容的图像检索中得到广泛应用,但由于颜色直方图破坏了颜色空间分布信息同时低维数据存在线性不可分问题,导致检索结果不理想;而均匀分块的颜色特征易破坏颜色全局性且分块大小难以把握。本文提出一种分块颜色核特征的方法,使得分块策略兼顾图像主体内容和颜色空间分布信息,同时设计核函数解决了颜色特征数据线性不可分的问题。实验中,本文算法获得了较好的检索结果,与全局颜色直方图,分块颜色直方图相比较,具有较高的查准率及查全率。
教育期刊网 http://www.jyqkw.com
参考文献
[1] 周明全,耿国华,韦娜.基于内容图像检索技术[M].北京:清华大学出版社,2007.
[2] YUE Jun,LI Zhenbo. Content?based image retrieval using color and texture fused features [J]. Mathematical and Computer Mo?delling,2011,54(3/4):1121?1127.
[3] 林克正,张彩华,刘丕娥.基于分块主颜色匹配的图像检索[J].计算机工程,2010,36(13):186?188.
[4] 刘广海,吴璟莉.基于颜色体积直方图的图像检索[J].计算机科学,2012,39(1):273?275.
[5] 黄元元,刘宁钟.一种新的基于颜色特征的图像检索方法[J].小型微型计算机系统,2012,33(3):609?613.
[6] MIN R,Cheng H D. Effective image retrieval using dominant color descriptor and fuzzy support vector machine [J]. Pattern Recognition,2008,42(1):147?157.
[7] 孔锐,张国宣,施泽生,等.基于核的K?均值聚类[J].计算机工程,2004,30(11):12?13.
[8] 唐晓燕,高昆,倪国强.高光谱图像非线性解混方法的研究进展[J].遥感技术与应用,2013,28(4):731?738.
[9] SHEN Yi,FAN Jianping. Leveraging loosely ? tagged images and inter?object correlations for tag recommendation [C]// Pro?ceedings of 2010 ACM International Conference on Multime?dia. New York:ACM,2010:5?14.
[10] 王琪,彭进业.一种基于混合特征核的图像检索方法[J].计算机工程与应用,2012,48(15):168?172.
作者简介:王琪(1987—),女,河南南阳人,硕士,助教。主要研究方向为图像处理、模式识别。
杜娟(1986—),女,河南南阳人,硕士,助教。主要研究方向为移动通信、MIMO?OFDM无线通信。
徐国清(1986—),男,河南商丘人,博士,副教授。主要研究方向为图像处理、模式识别。