中国科学院光电技术研究所机构知识库
Advanced  
IOE OpenIR  > 光电技术研究所博硕士论文  > 学位论文
题名:
基于视觉认知的目标识别技术研究
作者: 常永鑫
学位类别: 博士
答辩日期: 2015-02
授予单位: 中国科学院研究生院
授予地点: 北京
导师: 付承毓
关键词: 视觉认知,目标识别,复杂场景,分层最大化,机器学习,多视角
学位专业: 信号与信息处理
中文摘要: 在机器学习、模式识别和计算机视觉等领域,目标识别一直是最具挑战性的难题之一。研究目标识别技术是解决目标跟踪、行为理解和场景分析等复杂视觉任务的基础,具有重要的实用价值和理论指导意义,已成为非常重要的研究热点和难点。目标识别是利用计算机对图像进行处理、分析和理解,获取感兴趣的目标或区域相关信息的技术。研究目标识别技术的最终目标是,使计算机像人脑视皮层一样快捷高效地“读懂”图片的内容,引领我们进入更加智能的未来。这也促进了对生物视觉认知机制及其智能性进行研究的兴趣。尤其是在复杂恶劣环境下,需要处理视觉信息时,传统的基于统计学习的计算机视觉方法遇到较大困难。鉴于此,如何从视觉认知的角度去研究和设计计算机视觉算法成为一项迫切而又富有挑战性的任务。
本文主要针对生物视觉认知系统的关键环节—分层最大化和学习机制开展研究工作,在深刻理解其运行机制和原理的基础上,将其运用于目标分类、识别系统,并在静态2D图像数据集和连续帧2D图像数据集上对优化的算法模型进行性能评估和分析,取得了重要的进展。首先,研究了两个经典的基于生物视觉的计算模型HTM(分层时序模型)和HAMX(分层最大化模型)。然后,结合视觉认知机制重新设计优化了传统的计算机视觉模型。具体研究内容如下:
(1)针对传统目标识别模型存在通用性差、目前尚未与视觉认知机制有效结合等难题,首先对HMAX和HTM两个仿脑模型进行了计算理论层次与算法设计层次上的分析,指出其本质上和计算机视觉模型的原理对应关系。然后,详细分析了视觉认知理论在目标分类、识别中的应用。
(2)针对光照突变导致识别时检测率低的问题,提出结合优化的同态滤波算法,设计了基于Patch的更具区分性的LBP特征,改进后的算法应用于目标识别系统,实验结果验证了优化后算法的有效性和可行性。
(3)针对遮挡情况下,有效检测目标,并同时能识别出遮挡目标的可见部分是目前面临的一个主要挑战,研究该方向有具有一定的理论指导意义和实际工程价值。针对上述难点本文提出结合外观特征和帧间运动信息对目标进行显式遮挡建模的方法。该方法将基于单帧的部件级目标检测与基于连续帧的目标遮挡估计相融合,解决了因为可利用信息不足导致识别性能不高的难题,有效提升了遮挡情况下的目标检测率。
(4)针对传统的视皮层前馈分层模型仅局限于探讨目标分类问题,提出了一种面向多视角目标检测的视皮层前馈分层模型。该模型采用基于视角的目标表达方法,通过增加一个简单单元层来表达目标的不同视角,增加一个复杂单元层来表达不同视角简单单元的投票结果,从而完成视角不变的目标检测。学习方面,在原有的底层特征分片学习的基础上,该模型在高层增加了对视角的学习,从而形成一个两层的学习结构,这一结构可以有效的提高学习的效率。在PASCAL VOC 2011数据集上的测试结果表明,改进后的模型性能与传统的计算模型相比,取得了更好的检测效果。
(5)针对被检测目标在视角变化和遮挡时较难识别的问题,提出利用多特征融合的方式来降低视角的干扰,联合利用Gabor特征和视角变换时共有的LIOP特征(Local Intensity Order Pattern)对目标进行多角度识别的新算法。首先,利用二维Gabor滤波器组对输入图像进行滤波,得到含有方向信息的Gabor特征响应图,进而通过相关算法得到具有尺度及平移不变的特征向量。其次,通过几何变换算法获得不同视角下的LIOP特征向量。然后,为了降低时间复杂度,通过主成分分析算法(principal component analysis)对联合特征降维。最后,把降维后的特征向量输入支持向量机(SVM)进行训练学习,得到检测器模型。
综上,本文针对在复杂场景下,传统目标识别存在一定局限性的问题,围绕如何利用、模拟生物视觉认知机制的特性。对传统的目标分类、识别领域等关键问题和算法模型进行探索和指导,初步实现了基于视觉认知的目标识别功能,完成课题既定研究任务,并取得了阶段性成果。为进一步的算法研究提供了理论基础,对研究生物视觉和计算机视觉也具有一定的借鉴意义。
语种: 中文
内容类型: 学位论文
URI标识: http://ir.ioe.ac.cn/handle/181551/3047
Appears in Collections:光电技术研究所博硕士论文_学位论文

Files in This Item:
File Name/ File Size Content Type Version Access License
常永鑫-博士学位论文.pdf(2957KB)学位论文--限制开放View 联系获取全文

作者单位: 1.中国科学院光电所
2.电子科技大学

Recommended Citation:
常永鑫. 基于视觉认知的目标识别技术研究[D]. 北京. 中国科学院研究生院. 2015.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[常永鑫]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[常永鑫]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
文件名: 常永鑫-博士学位论文.pdf
格式: Adobe PDF
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2016  中国科学院光电技术研究所 - Feedback
Powered by CSpace