论文网首页|会计论文|管理论文|计算机论文|医药学|经济学论文|法学论文|社会学论文|文学论文|教育论文|理学论文|工学论文|艺术论文|哲学论文|文化论文|外语论文|论文格式
中国论文网

用户注册

设为首页

您现在的位置: 论文大全网 >> 经济学论文 >> 其他金融相关论文 >> 正文 会员中心
 财务税收论文   发展战略论文   国际经济论文   行业经济论文   新经济学论文   经济学理论论文   中国经济论文   国际贸易论文   地方战略论文
 证券金融论文   其他金融相关论文   房地产经济论文   统计学论文   经管期刊
基于聚类及融合技术的数字图像文字提取与识别研究
摘 要 在对当前数字图像与视频文字提取与识别技术的分析与考察基础上,提出了一个基于聚类和融合的文字识别与提取算法,算法包括文字区域检测、块增强、块提取与识别四个模块。与传统算法相比,该算法在彩色数字图像文字提取应用中具有较高的通用性与检测效率,同时在文字识别准确性方面也有一定的提高。
  【关键词】图像文字识别 k-means聚类 像素融合
  文中通过对现有算法进行分析与研究,文中提出一种具有较高通用性的图像与视频文字提取算法,首先对数字图像进行边缘图像处理,其次采用过滤与融合法对文字区域进行放大处理,最后以k-means聚类算法对背景像素和文字像素进行聚类分割处理,从而得到数字图像中的文字区域。该算法可以很好地应对彩色数字图像中的文字提取应用,同时具有较高的执行效率。
  1 算法整体框架
  文中介绍的图像文字算法主要包括文字区域检测、文字块增强、文字提取以及文字识别四个核心模块,其中文字识别模块直接采用ocr软件识别技术,算法的研究集中在前3个模块中。
  2 视频文字检测
  算法采用聚类技术奖图像中的边缘进行分解,并形成多个子图像,从而将不同颜色的图像文字与背景色进行隔离,主要步骤包括累积边缘图像的创建、彩色边缘分层处理以及文字定位三个步骤。
  2.1 边缘图像创建
  通过定义累积边缘图像,在原数字图像的y、u以及v三个分量上进行检测,得到更加丰富的边缘信息,在图像水平方向、垂直方向以及对角线方向上进行三个维度的边缘检测,假定py、pu与pv分别代表数字图像在y、u与v分量上的边缘图,则计算公式如式1所示:
  pi=max(sbh,sbv,sbl,sbr),i=y,u,v (1)
  其中sbh、sbv、sbl与sbr分别表示采用sobel检测算子计算得到的数字图像在水平方向、垂直方向及左右对角线分量上的边缘强度计算结果。
  2.2 彩色边缘分层处理
  边缘分层处理是通过对2.1中得到的边缘分量图进行着色处理,并采用k-means聚类算法将着色处理后得到的数字图像进行像素分类,从而得到不同层次的像素点集合,分别代表背景色和文字像素。由于不同的边缘图对应着不同的颜色,因此通过聚类处理后可以将边缘图中的不同颜色进行分类,得到颜色值相对统一的边缘子图,为文字区域的定位提供参考。
  2.3 文字定位
  由于数字图像中的文字区域一般分布比较集中,所以在2.2中处理结果上通过水平方向、垂直方向上的投影操作即可实现对文字区域的初步定位,其次采用基于svm向量机的方法对得到的文字区域进行过滤处理,并采用均值计算、方差处理、局部同次性等特征分析,丢弃明显错误的文字区域识别结果,从而能够大大提高文字区域的定位准确性。
  3 文字块增强
  通过过滤操作提高文字笔画的清晰度,并将得到的文字笔画进行融合处理从而得到更为准确的文字区域识别结果。
  3.1 文字区域过滤
  当前的数字图像与视频大都经过了一定程度的压缩处理,从而导致图像和视频中的文字笔画比较模糊,所以算法首先对文字笔画进行增强处理,具体方法是通过对文字块的水平方向、垂直方向以及两个对角线方向上采用如式2所示的检测算子进行增强处理:
  textmap(x,y)=max(textinth,textintv,textintl,textintr) (2)
  其中,textinth、textintv、textintl、textintr分别代表水平方向、垂直方向以及左右对角线方向上增强处理后得到的强度。
  3.2 文字区域融合
  算法采用局部阈值设定的方法对文字块中的背景色进行进一步分离,并在此基础上进行平均融合处理,从而降低噪声对识别结果的影响。另外,在背景色的融合方面,算法采用最小值融合技术,从而降低了算法的处理开销,并提高了处理结果的对比对。其中局部阈值t的设置采用otsu法进行计算得到,并通过对不同文字区域进行平均像素计算得到各个文字区域的图像集合,最后进行阈值判断,如果图像集合中的元素大于t则将其归为文字部分,否则归到背景色。
  4 文字提取
  4.1 二值化处理
  算法在文字提取时首先采用基于颜色分量的聚类算法进行像素二值化处理。具体的操作时通过对融合后的文字块图像从y、u和v三个分量上进行对比度检测,并选择其中的最大值作为二值化处理的选择标准。对于单个像素,算法通过对像素边缘区域的灰度进

分量计算,从而得到用来分割的局部阈值,最后将像素的灰度值与局部阈值进行对比,确定其是否属于文字区域。
  4.2 噪声去除
  经二值化处理后文字块的前景文字具有较高的连通性,但却包含了比较大的笔画噪声,所以为了提高文字识别的精度,还需对噪声进行去除。算法通过对连通分量进行考察,采用灰度一致性进行噪声去除。首先,采用k-means法进行连通分量聚类,将聚类结果中的大集合作为文字区域,将小集合作为噪声进行去除。最后采用灰度一致性分析将处理得到的文字块进行进一步噪声去除,从而得到更为清晰的文字提取结果。
  参考文献
  [1]李英,田春娜.一种图像中的文字区域检测新方法[j].西安电子科技大学学报, 2013(6).
  [2]张凯歌,缪毅.结合小波插值与k-means方法提取彩色图像文字[j].计算机技术与发展,2013(3).
  作者简介
  秦伟(1986-),男,现为哈尔滨工程大学计算机科学与技术学院,硕士学位。研究方向为数字图像处理。
  作者单位
  哈尔滨工程大学计算机科学与技术学院 黑龙江省哈尔滨市 150000
  • 上一个经济学论文:
  • 下一个经济学论文:
  •  更新时间:
    基于应用语言学视阈下的英语文化导入教学研…
    基于入门阶段日语平假名与片假名有效教学法…
    基于ESA理论的高职大学英语课堂教学设计研究
    基于Blog的电子档案袋评价应用于二语写作教…
    基于Android系统的移动应用数据分析探究
    基于Web的高职院校电子类实训室综合系统的设…
    基于LabView的核磁共振测井仪测试系统的研制…
    基于MATLAB的简单图像处理系统的实现
    基于DSP的AVS帧内预测的优化算法
    基于电子技术的氧碳对太阳能级直拉单晶硅品…
    基于BP神经网络输电线路山火隐患点识别
    基于发酵产氢的玉米秸秆酶解条件响应面优化
    | 设为首页 | 加入收藏 | 联系我们 | 网站地图 | 手机版 | 论文发表

    版权所有 www.11665.com © 论文大全网 All rights reserved