• 2019年第34卷第1期文章目次
    全 选
    显示方式: |
    • 基于Retinex的图像增强方法综述

      2019, 34(1):1-11. DOI: 10.16337/j.1004?9037.2019.01.001

      摘要 (2134) HTML (5410) PDF 699.54 K (4807) 评论 (0) 收藏

      摘要:Retinex作为一种源自人类视觉系统研究的颜色恒常性模型,在解决光照不均、色偏等方面都有非常广泛的应用。本文首先介绍了Retinex理论的来源与后续的发展。然后根据当前研究现状将Retinex模型分为路径模型、PDE(Partial differential equations)模型、变分模型和中央周边(Center-Surround)模型4种类型,并对每一种类型进行综述。最后介绍了Retinex在图像增强方面的典型应用,并总结4种Retinex模型的优劣,展望了Retinex的未来发展方向。

      • 0+1
      • 1+1
      • 2+1
    • 基于改进Criminisi算法的地基云图修复方法

      2019, 34(1):12-21. DOI: 10.16337/j.1004?9037.2019.01.002

      摘要 (834) HTML (2149) PDF 2.69 M (2162) 评论 (0) 收藏

      摘要:全天空成像仪(Total sky imager,TSI)对天空进行观测时,设备的结构特点会使采集到的云图信息不完整,对图像的分析造成不利影响。针对Criminisi算法修复地基云图所造成修复顺序发生错误、图像不连续以及匹配块遍历搜索时间复杂度大的问题,本文提出了一种基于改进Criminisi算法的地基云图修复方法。该算法改进了优先权计算公式,引入地基云图独特的红蓝比特征作为置信项,使得含有更多信息的像素块具有更高的优先级,在搜索匹配块的过程中,基于启发信息选择匹配区域的大小,避免了搜索到离待修复块较远的相关性较低的匹配块,也有效缩短了匹配块搜索时间,降低了算法的时间复杂度。实验结果表明,改进后的Criminisi算法具有较好的图像修复效果,且降低了时间复杂度,提高了修复效率。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
    • 基于混沌布谷鸟优化的二维Tsallis交叉熵建筑物遥感图像分割

      2019, 34(1):22-31. DOI: 10.16337/j.1004?9037.2019.01.003

      摘要 (889) HTML (1617) PDF 4.05 M (1867) 评论 (0) 收藏

      摘要:为了进一步提升建筑物遥感图像分割的准确性和运算速度,本文提出了基于混沌布谷鸟优化的二维Tsallis交叉熵的建筑物遥感图像分割方法。首先给出了二维Tsallis交叉熵的阈值选取公式,然后将Logistic混沌映射引入布谷鸟算法,进一步加快布谷鸟算法的收敛速度,最后通过该混沌布谷鸟算法优化基于二维Tsallis交叉熵的阈值寻找过程,并以得到的最优阈值分割建筑物遥感图像。大量实验结果表明,与二维倒数交叉熵法、二维Tsallis熵法、基于混沌粒子群优化的二维Tsallis灰度熵法等方法相比较,本文方法分割的目标更为准确,细节更为清晰,且运算时间更短。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
    • 双向时域特征流盲去运动模糊方法

      2019, 34(1):32-40. DOI: 10.16337/j.1004?9037.2019.01.004

      摘要 (814) HTML (2198) PDF 9.19 M (2521) 评论 (0) 收藏

      摘要:便携式成像设备在日常的生活中已经无处不在,但是因为拍摄时的抖动或者场景中的快速运动物体,所拍摄的图像或视频经常存在模糊现象,造成图像重要细节丢失。为了将模糊的视频图像恢复到清晰的状态,结合近年来的研究热点——生成对抗网络,本文提出了一种新颖的端到端的双向时域特征流盲去运动模糊方法。该方法充分利用时空连续特征信息,在三连帧图像间建立双向的时域特征传输通道。多阶段自编码去模糊网络结构和并行编码-混合解码融合方案能够融合三连帧图像多通道内容信息,并恢复出更加清晰的视频图像。实验结果表明,在不牺牲较大时间代价前提下,本文提出的方法在传统的质量评价指标(峰值信噪比和结构相似性)和视觉质量上均优于现有的去模糊算法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 基于Retinex算法的亮度分层图像增强算法

      2019, 34(1):41-49. DOI: 10.16337/j.1004?9037.2019.01.005

      摘要 (895) HTML (1903) PDF 1.56 M (2733) 评论 (0) 收藏

      摘要:在处理低照度的图像时,传统的Retinex算法虽然可以提高图像的辨识度,但是存在“光晕伪影”和图像细节表现不明显等问题,因此本文采用了引导滤波图像分层处理与多尺度Retinex算法相结合的图像增强算法。首先在HSI色彩空间中对原始图像使用引导滤波算法,将图像分成细节图像和基本图像。然后对分离出来的两个图像层构造增益系数,分别进行增强处理后再进行重构,得到一个新的亮度图像。最后,在RGB色彩空间内对新的亮度图像进行色彩恢复从而输出最终的亮度较高、还原度较好的图像。实验结果表明,本文算法使图像的边缘和细节更加突出,而且能够消除“光晕伪影”现象,客观评价指标也有较大幅度的提升。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 基于深度残差网络的人脸表情识别

      2019, 34(1):50-57. DOI: 10.16337/j.1004?9037.2019.01.006

      摘要 (1105) HTML (3722) PDF 1.40 M (2585) 评论 (0) 收藏

      摘要:针对深度卷积神经网络随着卷积层数增加而导致网络模型难以训练和性能退化等问题,提出了一种基于深度残差网络的人脸表情识别方法。该方法利用残差学习单元来改善深度卷积神经网络模型训练寻优的过程,减少模型收敛的时间开销。此外,为了提高网络模型的泛化能力,从KDEF和CK+两种表情数据集上选取表情图像样本组成混合数据集用以训练网络。在混合数据集上采用十折(10-fold)交叉验证方法进行了实验,比较了不同深度的带有残差学习单元的残差网络与不带残差学习单元的常规卷积神经网络的表情识别准确率。当采用74层的深度残差网络时,可以获得90.79%的平均识别准确率。实验结果表明采用残差学习单元构建的深度残差网络可以解决网络深度和模型收敛性之间的矛盾,并能提升表情识别的准确率。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
    • 自然场景下人脸表情数据集的构建

      2019, 34(1):58-67. DOI: 10.16337/j.1004?9037.2019.01.007

      摘要 (967) HTML (3773) PDF 2.19 M (3249) 评论 (0) 收藏

      摘要:目前人脸识别研究中表情数据集图像数量较少、表情信息单一,不利于人脸表情识别的研究。本文创建了自然场景下带标签的人脸表情数据集(Facial expression dataset in the wild, FELW),并对其进行测试。FELW表情数据集包含了多张从互联网上收集的不同的年龄、种族、性别的人脸表情图像,采用适合的方法标注每张图像带有人脸部件的状态标签和表情标签,并引入Kappa一致性检验,提高人脸表情识别率。使用传统方法和深度学习的表情识别方法对数据集进行实验分析,与其他公开的人脸表情数据集相比,FELW数据集具有更多图像和更丰富的表情类别,并包含了两种图像标签有利于表情识别的研究。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
    • 动态多视角复杂3D人体行为数据库及行为识别

      2019, 34(1):68-79. DOI: 10.16337/j.1004?9037.2019.01.008

      摘要 (842) HTML (3265) PDF 3.92 M (3645) 评论 (0) 收藏

      摘要:提供了一个较大规模的基于RGB-D摄像机的人体复杂行为数据库DMV (Dynamic and multi-view) action3D,从2个固定视角和一台移动机器人动态视角录制人体行为。数据库现有31个不同的行为类,包括日常行为、交互行为和异常行为类等三大类动作,收集了超过620个行为视频约60万帧彩色图像和深度图像,为机器人寻找最佳视角提供了可供验证的数据库。为验证数据集的可靠性和实用性,本文采取4种方法进行人体行为识别,分别是基于关节点信息特征、基于卷积神经网络(Convolutional neural networks,CNN)和条件随机场(Conditional random field,CRF)结合的CRFasRNN方法提取的彩色图像HOG3D特征,然后采用支持向量机(Support vector machine,SVM)方法进行了人体行为识别;基于3维卷积网络(C3D)和3D密集连接残差网络提取时空特征,通过softmax层以预测动作标签。实验结果表明:DMV action3D人体行为数据库由于场景多变、动作复杂等特点,识别的难度也大幅增大。DMV action3D数据集对于研究真实环境下的人体行为具有较大的优势,为服务机器人识别真实环境下的人体行为提供了一个较佳的资源。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
      • 16+1
      • 17+1
      • 18+1
      • 19+1
      • 20+1
      • 21+1
    • 分层式宽度模型的实时车型识别算法

      2019, 34(1):80-90. DOI: 10.16337/j.1004?9037.2019.01.009

      摘要 (944) HTML (1564) PDF 3.67 M (2157) 评论 (0) 收藏

      摘要:车辆车型识别技术在智能交通系统中至关重要,现有的车辆车型识别技术难以兼顾识别精度和识别速度。针对高速公路环境下的车型识别问题,提出了浅层特征层与宽度特征层相结合的分层式宽度模型实时进行车型识别。首先利用颜色空间转换和多通道HOG算法相结合,减少光照环境的影响,同时实现对车辆图像的特征提取,结合PCA降维技术,降低计算复杂度;然后对图像特征进行稀疏表示和非线性映射,减少图像特征之间的相关性;最后用岭回归学习算法对提取的样本特征进行训练,求出样本特征与样本标签之间的权重系数,实现对车辆车型的识别。在BIT-Vehicle车型数据库的实验结果表明,本文所提算法的识别精度为96.69%,识别速度高达70.3帧/s。本文算法在提高车型识别精度的同时保证了实时性,在识别精度和速度方面优于其他算法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 基于彩色-深度视频和CLDS的手语识别

      2019, 34(1):91-99. DOI: 10.16337/j.1004?9037.2019.01.010

      摘要 (917) HTML (1999) PDF 2.24 M (2311) 评论 (0) 收藏

      摘要:提出一种基于彩色-深度视频和复线性动态系统(Complex linear dynamic system, CLDS)的手语识别方法,可以保证时序建模数据与原始数据严格对应,准确刻画手语特征,从而显著提高分类精度。利用深度视频补偿RGB视频中的缺失信息,提取手语视频运动边界直方图(Motion boundary histogram, MBH)特征,得到每种行为的特征矩阵。对特征矩阵进行CLDS时序建模,输出能唯一表示该类手语视频的描述符M=(A,C),然后利用子空间角度计算各模型之间的相似度;通过改进的K最近邻(K-nearest neighbors, KNN)算法得到最终分类结果。在中国手语数据集(Chinese sign language, CSL)上的实验表明,本文方法与现有的手语识别方法相比,具有更高的识别率。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
    • 基于ELM的局部空间信息的模糊C均值聚类图像分割算法

      2019, 34(1):100-110. DOI: 10.16337/j.1004?9037.2019.01.011

      摘要 (1117) HTML (1022) PDF 1.85 M (2034) 评论 (0) 收藏

      摘要:极限学习机(Extreme learning machine, ELM)作为一种新技术具有在回归和分类中良好的泛化性能。局部空间信息的模糊C均值算法(Weighted fuzzy local information C-means, WFLICM)用邻域像素点的空间信息标记中心点的影响因子,增强了模糊C均值聚类算法的去噪声能力。基于极限学习机理论,对WFLICM进行改进优化,提出了基于ELM的局部空间信息的模糊C均值聚类图像分割算法(New kernel weighted fuzzy local information C-means based on ELM,ELM-NKWFLICM)。该方法基于ELM特征映射技术,将原始数据通过ELM特征映射技术映射到高维ELM隐空间中,再用改进的新核局部空间信息的模糊C均值聚类图像分割算法(New kernel weighted fuzzy local information C-means,NKWFLICM)进行聚类。 实验结果表明 ELM-NKWFLICM算法具有比WFLICM算法更强的去噪声能力,且很好地保留了原图像的细节,算法在处理复杂非线性数据时更高效, 同时克服了模糊聚类算法对模糊指数的敏感性问题。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 一种改进区域能量融合规则的光子计数图像增强算法

      2019, 34(1):111-121. DOI: 10.16337/j.1004?9037.2019.01.012

      摘要 (937) HTML (1622) PDF 1.87 M (1922) 评论 (0) 收藏

      摘要:为了得到融合效果更好的光子计数图像,提出一种改进区域能量融合规则的图像融合算法。由多像素光子计数器(Multi-piexl photon counter,MPPC)单一探测器在不同照度条件下扫描得到光子计数图像,并对其进行小波变换,得到高频图像和低频图像;然后计算两幅源图像高频部分的对应区域能量、邻域均方差、匹配度以及阈值,其中阈值是由局部图像的像素值和均值计算得到。如果匹配度大于或等于阈值,采用加权区域能量法确定融合图像;如果匹配度小于阈值,选取局部区域能量较大的源图像像素点的增强值作为相应融合图像中的像素点值。采用不同融合规则进行图像增强,结果证明在本文改进的融合规则下得到的光子计数图像细节更清晰,目标更易识别,评价指标中的信息熵、平均梯度以及空间频率的数值分别提高了约20%,25%和30%。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
      • 16+1
      • 17+1
      • 18+1
    • 基于相关滤波融合多特征的运动目标跟踪方法

      2019, 34(1):122-134. DOI: 10.16337/j.1004?9037.2019.01.013

      摘要 (1052) HTML (2530) PDF 5.72 M (2861) 评论 (0) 收藏

      摘要:针对复杂环境下仅使用单一图像特征跟踪精度和鲁棒性差的问题,提出一种多特征融合的相关滤波目标跟踪算法。该算法首先从目标和背景区域分别提取方向梯度直方图(Histogram of oriented gradient,HOG)特征、颜色直方图特征和卷积特征,采用固定权重方法融合HOG特征和颜色直方图特征的特征响应图,然后将该层融合结果与卷积特征响应图采用自适应权重融合策略进行融合,基于融合后的响应图估计出目标位置,并采用尺度估计方法解决目标尺度变化问题,最后采用稀疏模型更新策略进行模型更新。在OTB-2013公开标准测试集中验证本文算法性能,并与主流的目标跟踪算法进行了对比分析。实验结果表明,与其中最优算法相比,本文算法的平均距离精度值和平均重叠精度值都有所提高。本文算法由于有效地利用了HOG特征、颜色直方图特征和卷积特征,在复杂场景下目标跟踪的准确性和鲁棒性都优于其他算法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 多尺度并行坐标插值实时图像克隆算法

      2019, 34(1):135-145. DOI: 10.16337/j.1004?9037.2019.01.014

      摘要 (825) HTML (2494) PDF 5.03 M (2075) 评论 (0) 收藏

      摘要:作为一种重要的数字图像合成编辑技术,图像克隆能够将源图像中的克隆区域平滑自然地嵌入目标图像的指定位置。 传统的图像克隆技术通过分析图像的梯度域并求解泊松方程来获取图像信息, 具有算法复杂度高、内存消耗大的缺点, 从而限制了其在高分辨率图像中的实时应用。本文提出了一种改进的均值坐标计算方法, 将图像克隆转化为高效且易于实现的图像插值流程。此外本文还采用多尺度和GPGPU并行计算技术进一步提升了算法的整体运算效率, 从而能够实现对100万像素图像区域的实时克隆。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
    • 红外与可见光图像分解与融合方法研究

      2019, 34(1):146-156. DOI: 10.16337/j.1004?9037.2019.01.015

      摘要 (912) HTML (1762) PDF 3.93 M (2534) 评论 (0) 收藏

      摘要:红外与可见光图像融合旨在生成一幅新的图像,能够对场景进行更全面的描述。本文提出一种图像多尺度混合信息分解方法,可有效提取代表可见光特征分量的纹理细节信息和代表红外特征分量的边缘信息。本文方法将边缘信息进行进一步分割以确定各分解子信息的融合权重,以有效地将多尺度红外光谱特征注入到可见光图像中,同时保留可见光图像中重要的场景细节信息。实验结果表明,本文方法能够有效提取图像中的红外目标,实现在融合图像中凸显红外目标的同时保留尽可能多的可见光纹理细节信息,无论是主观视觉还是客观评价指标都优于现有的图像融合方法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
    • 基于多通道视觉注意力的细粒度图像分类

      2019, 34(1):157-166. DOI: 10.16337/j.1004?9037.2019.01.016

      摘要 (995) HTML (3256) PDF 773.83 K (2901) 评论 (0) 收藏

      摘要:视觉注意力机制在细粒度图像分类中得到了广泛的应用。现有方法多是构建一个注意力权重图对特征进行简单加权处理。对此,本文提出了一种基于可端对端训练的深度神经网络模型实现的多通道视觉注意力机制,首先通过多视觉注意力图描述对应于视觉物体的不同区域,然后提取对应高阶统计特性得到相应的视觉表示。在多个标准的细粒度图像分类测试任务中,基于多通道视觉注意的视觉表示方法均优于近年主流方法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
    • 一种基于有界变分的树叶锯齿特征提取算法研究

      2019, 34(1):167-174. DOI: 10.16337/j.1004?9037.2019.01.017

      摘要 (847) HTML (1231) PDF 1.49 M (1958) 评论 (0) 收藏

      摘要:树叶锯齿特征的提取对于研究植物内部的基因关系至关重要。为了克服现有算法的局限性,本文提出一种基于有界变分的树叶锯齿特征提取算法,以有效提取树叶锯齿的数量、深度和宽度等多维特征,从而为后续的基因分析提供重要依据。首先对树叶图像进行预处理以得到其轮廓坐标;然后计算整个叶片相邻像素点之间的斜率变分,以实现初步的角点检索;再通过估算锯齿深度进行误差补偿,从而得到锯齿角点及其凹点,最终估算出锯齿的多维特征。本文利用瑞典的白杨树叶(12 000片)对所提算法进行验证。大数据验证表明,本文算法能够批量提取树叶锯齿个数、宽度和深度等特征,其中锯齿数量的识别准确度达到86.3%。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
    • 基于标签传递的人像分割

      2019, 34(1):175-182. DOI: 10.16337/j.1004?9037.2019.01.018

      摘要 (909) HTML (1447) PDF 2.67 M (1954) 评论 (0) 收藏

      摘要:人像分割技术在人脸识别、3D人体重建及运动捕捉等实际应用中具有重要的作用,其可靠性直接影响后续处理的效果。本文以标签传递理论的目标分割算法为基础,提出了一种优化的人像分割算法。首先,引入模糊集理论,提高复杂背景图像分割的能力;然后,使用超像素过分割进行预处理,利用过分割结果优化相似度定义提高分割轮廓的平滑性和可靠性。实验结果表明,与原有标签传递算法相比,本文提出的算法可以保持较高的分割轮廓平滑度且具有更高的分割精度。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
    • 基于图像识别的分光器端口分析方法

      2019, 34(1):183-188. DOI: 10.16337/j.1004?9037.2019.01.019

      摘要 (921) HTML (1192) PDF 3.23 M (2577) 评论 (0) 收藏

      摘要:为了解决中国移动资源数据库中哑设备资源难以精确把控的问题,以分光器为切入点、图像识别角度作为突破口,提出了模拟时间延迟积分(Time delay integration,TDI)成像解析分光器端口的算法。首先对运维人员上传的图像进行筛选,保证图像数据的质量;然后利用HSV颜色空间进行端口位置和轮廓的提取;再使用图像轮廓进行杂点过滤和分光器端口分布方向拟合;最后,使用拟TDI成像算法解析端口占用情况,输出分光器端口占用情况,给出分光器的分光比、占用端口号,以提升资源数据平台对分光器资源的数据质量。结果表明该算法运行速度快,端口分析准确,具有较高的应用前景。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 基于图像处理的轮辐角度测量

      2019, 34(1):189-194. DOI: 10.16337/j.1004?9037.2019.01.020

      摘要 (956) HTML (1399) PDF 5.35 M (1965) 评论 (0) 收藏

      摘要:针对轮毂在进行X射线探伤前需要预先调整轮毂轮辐位置的问题,利用图像处理的方法实现了轮毂轮辐初始角度的测量。首先用霍夫变换去除轮毂圆之外的干扰信息。然后根据轮辐条数,在轮毂模板图像上设定一个标准扇形检测区域,在待检轮毂上转动检测区域,用灰度比较法计算出角度。实验结果表明,该方法能较好地测量轮毂轮辐初始角度,符合工业要求。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
      • 16+1
快速检索
检索项
检索词
卷期检索