当前位置:四肖八码全年资料 > 区域聚类 >

基于聚类与边缘检测的自然场景文本提取方法

  基于聚类与边缘检测的自然场景文本提取方法_电子/电路_工程科技_专业资料。为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;

  4040 2010,31(18) 计算机工程与设计ComputerEngineering andDesign ?多媒体技术? 基于聚类与边缘检测的自然场景文本提取方法 常 莹1, 何东健”, 李宗儒1 (1.西北农林科技大学信息工程学院,陕西杨凌712100;2.西北农林科技大学机械与电子工程学院, 陕西杨凌712100) 摘要:为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K.means聚类与边缘检 测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值 子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选 字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文 本字符区域. 关键词:自然场景;文本提取;聚类:连通区域标记与分析;边缘检测 中图法分类号:TP391.41 文献标识码:A 文章编号:1000-7024(2010)18-4040.04 scenes text Based on clustering and edge detection of natural CHANG Yin91,HE extraction method Dong.jian2+,LI Zong-rul (1.College ofInformation Engineering,Northwest A&F University,Yangling 712100,China; 2.College ofMechanical and Electronic Engineering,Northwest A&F University,Yangling 712loo,Chma) Abstract:In order to efficiently proposed a exlract text from complex natural SCelIC8,uneven illumination and rich background textures,WC nstural SC翻fle text extraction method,which based on K-means clustering and edge detection.This method improved the K- sonae means clustering algorithm,to achieve text regional segmentation,and then divided the value ofthe results into black and white sub-images,marked the decomposition ofthe connectivity ofnle various sub-image regions and analyzed the characters to be the candidate regions,finally,We used the text edge characteristics to filter the candidate character regions and achieved the exwaction oftext characters. The experimental results showed that this method gall effectively extract the text regions from natlll"al s咖es which with complex back- ground,lighting effects and rich back伊ound textures. Key wor山:natural scene;text extraction;clustering;connected region labeling and analysis;edge detection 0引 言 边缘,利用局部自适应阈值进行二值化,然后通过对二值边缘 图像进行滞后边缘恢复、坝点标记、向内填充和投影分析等步 骤由粗到细定位文本区域川;文献【5】利用高斯金字塔对图像进 行分解,然后对每幅子图在。口,450,90*和1350上检测图像边缘, 将边缘结果进行合并形成特征图,再经过形态学运算得到文 本区域。基于连通区域的方法主有Soochang Pei等人首先用 神经网络对图像进行量化,然后用颜色梯度对图像进行二值 化,再通过形态学处理和连通域分析得到后候文本区域,又利 用空间特征计算每个后候文本之间的关系,最后通过高斯拉 自然场景文本是指通过图像采集工具,如数码相机,获取 自然场景图像时所采集到的文本信息。通常情况下,这些文 本的颜色多变、大小迥异、捧列不规则且背景复杂,如果能将 这些文本自动地提取出来,它将对于信息的检索、数字图书 馆、网页检索和智能交通等领域具有重要的应用价值“J。目 前,提取自然场景中的文本常用方法可分为3类:基于纹理的 方法、基于边缘的方法和基于区域方法。基于纹理的方法主 要有TomoySaoi等人在多通道(RGB通道)小波纹理特征上采 用无监督学习聚类方法定位文本区域脚;David Bargeron等人 提出一种改进型的Boosting分类器用于文档图像文本区域检 测例。基于边缘的检测方法有Lyu等人用Sobcl算子提取图像 收稿日期:2009.12-15;修订日期:2010-02-20. 基金项目:国家自然科学基金项目(60975007). 普拉斯算子定位文本区域脚;文献[7】将彩色图像转化到YlⅣ 空间,对Y进行灰度化并检测其边缘特征,然后计算候选文本 区域的水平和垂直投影

http://magdakalas.com/quyujulei/311.html
点击次数:??更新时间2019-06-16??【打印此页】??【关闭
  • Copyright © 2002-2017 DEDECMS. 织梦科技 版权所有  
  • 点击这里给我发消息
在线交流 
客服咨询
【我们的专业】
【效果的保证】
【百度百科】
【因为有我】
【所以精彩】