预答辩公告
论文题目 |
图像智能处理的若干关键技术研究 |
答辩人 |
邹送上 |
指导教师 |
陈浩 |
答辩委员会 主席 |
秦拯 |
学科专业 |
计算机科学与技术 |
学院 |
信息科学与工程学院 |
答辩地点 |
软件楼532 |
答辩时间 |
2021年3月30日 上午10:00 |
学位论文简介
本论文将主要聚焦智能算法和深度神经网络这两大核心研究方法,围绕面向图像处理和复杂场景理解的应用开展相关工作。本论文的主要研究内容可以概括如下:
构建了一种具有融合特征的深度卷积神经网络(Convolutional neural network, CNN)模型结构。本文以CNN为基础建立解决方案,由于图像像素点周边邻域范围内的空间信息具有很强的关联性,CNN节点有效感受野的范围会直接影响图像智能处理的效果,因此网络模型结构采用级联的方式,在每次卷积核运算后采用局部归一化操作(LRN)来提高神经网络的收敛性和鲁棒性。同时将该网络经卷积操作后得到的特征与前两层全连接层的输出特征进行融合,融合后的特征更加能够表达原始图像的信息。对于图像像素点的周边邻域信息,还构建了多尺度感知野的特征融合模块。
提出了融合CNN和PCA降维的图像分类算法。本算法保留若干个能反映出图像数据大体上的信息变量,经降维操作后所剩变量与未降维变量呈线性关系,使所留下的变量尽可能地少,并保证剩余变量之间互相独立,这样能够降低信号在隐含层之间传播时隐含层分布的变化。主要图像特征经由ReLU激活函数转化,对提取的图像特征进行激活,生成相应的输出特征映射。
提出了深度哈希学习模型。本文设计的深度哈希学习模型由11层组成,其中7层需要参数,而4层不需要参数。该网络学习模型的激活函数使用Relu并含有LRN归一化层,前三个卷积层主要进行卷积操作,负责对图像特征的提取工作,后两个卷积层主要负责整合提取的特征,池化层采用的均为最大池化,主要是对输入数据进行降维操作,减少输入的参数。深度哈希学习模型的低层能够学习到更具区分性的特征,为后面端到端的有监督调优过程寻找一个更优的模型参数初始状态
提出了结合Adam算法和CNN的多媒体图像检索方法。通过在预训练阶段使用结合了辅助监督信息的联合目标函数,本文方法主要解决CNN中卷积核权值系数的更新问题,通过将Adam算法的卷积核权值系数的更新迭代提高CNN的特征搜索能力,提升神经网络的检索精度和效率,最终可以训练出一个性能较为优异的网络来实现多媒体图像检索。
提出了针对复杂场景的图像显著性检测框架。由于传统的图像显著性检测方法存在提取显著区域效率偏低和准确率不高的问题,本文结合图像的位置分布和基色对比度等信息,融合多尺度多通道特征分析,计算图像的显著性特征,摄取图像的显著区域。
主要学术成果
Songshang Zou, Hao Chen, Haoyu Zhou, Jianguo Chen. An Intelligent Image Feature Recognition Algorithm With Hierarchical Attribute Constraints Based on Weak Supervision and Label Correlation[J].IEEE Access, 2020, PP(99):1-1
Songshang Zhou, Wenshu Chen, Hao Chen.Image Classification Model Based on Deep Learning in Internet of Things[J].Wireless Communications and Mobile Computing, 2020, 1530-8677 (Online)