2018, 33(5):769-778. DOI: 10.16337/j.1004-9037.2018.05.001
摘要:骨导麦克风是一种非声传感器,由于其语音传输通道天然屏蔽了周围环境噪声的影响,因而具有很强的抗噪性能,已在多种强噪声环境的语音通信中发挥重要作用。由于人体传导的低通性能以及传感器工艺水平的限制等,骨导语音听起来比较沉闷、不够清晰,增强骨导语音对进一步改善强噪声环境下的语音通信质量以及骨导产品的推广具有重要意义。骨导麦克风语音盲增强在语音增强阶段仅拥有骨导语音信息,相比于融合带噪气导语音的增强,这种直接的增强方式具有更广泛的应用前景。本文在分析骨导语音特点的基础上,梳理总结了无监督频谱扩展法、均衡法和谱包络转换法等3种骨导麦克风语音盲增强方法,并展望了骨导麦克风语音盲增强研究的发展方向。
2018, 33(5):779-792. DOI: 10.16337/j.1004-9037.2018.05.002
摘要:从音频信号中提取录音设备特征是司法比较研究和音频取证的前沿课题。由于录音设备识别技术受到环境、语义、说话人等因素干扰,需要攻克的难题较多,国内外的研究还处于起步阶段。为此回顾了录音设备研究的发展情况、基本理论和组成结构,特别对组成结构中非话音段检测、特征参数、识别模型和数据库建设的研究现状进行了介绍和分析。最后,进一步分析了录音设备识别存在的不足,并展望未来的研究发展方向,指出加快构建现有各品牌各型号的录音设备、各场合、各类人群的数据库建设与深度学习在录音设备中的应用是下一阶段研究的重点。
2018, 33(5):793-800. DOI: 10.16337/j.1004-9037.2018.05.003
摘要:研究了一种基于深度置信网络的语音增强算法,并针对其不足做如下改进:考虑到对应训练集中噪声种类较少,噪声特性不够丰富的情况,在频域对噪声频谱进行扰动,以丰富噪声频谱特性;考虑到不同频点的信号对系统误差的影响不一样,结合绝对听阈构造权重系数。最后选取在噪声环境下传统语音增强算法中较好的LOG-MMSE和本文改进的基于深度置信网络的语音增强算法进行了分析比较,结果证明深度置信网络的语音增强算法显示出较好性能,尤其对增强后语音质量的提升超过了LOG-MMSE方法。
2018, 33(5):801-808. DOI: 10.16337/j.1004-9037.2018.05.004
摘要:深度学习依赖于大数据在很多的任务中取得巨大成功,但目前大部分方法都依赖于严格标注的数据,或者假定仅含一个物体大致位于图片近中心位置且背景较少。而现实场景中背景复杂,出现的物体多样,增加了分类的难度,而且标注的代价很大。本文关注于弱监督场景下的分类任务,提出了基于注意力机制(Attention)结合递归神经网络的深度模型,利用图片级的标注进行多标号学习,利用损失函数进行梯度下降训练自动调整关注区域,使模型每次关注图片的局域区域,并在数据集PASCAL VOC 2007/2012上验证算法的有效性,与其他方法相比具有更强的可解释性。
2018, 33(5):809-817. DOI: 10.16337/j.1004-9037.2018.05.005
摘要:在现有高光谱遥感图像噪声估计方法中,同质区域的选取通常是最关键的步骤,有效的同质区域选取方法能够提高图像的噪声估计精度。本文充分利用了高光谱遥感图像中丰富的空间信息和光谱信息,提出了一种各向同性同质区域选取算法,其中,为了更好地区分同质区域内像元相似度,构造了一种新的兰氏-光谱角度量;结合基于多元线性回归的去相关法,通过最优区域评估高光谱遥感图像噪声水平。利用不同结构及信噪比的模拟图像和真实高光谱遥感图像进行实验,通过与现有的多种噪声估计方法比较,验证了本文方法在针对不同噪声水平、不同复杂程度的图像时更加准确和稳定。
2018, 33(5):818-825. DOI: 10.16337/j.1004-9037.2018.05.006
摘要:针对现代宽带软件无线电接收机的动态性能受到接收器件非线性效应影响而恶化的问题,本文提出基于Wiener接收模型的自适应相关性消除算法实现对非线性信道的盲均衡。该算法以正交频分复用技术(Orthogonal frequency division multiplexing,OFDM)信号为例,利用接收信号间和数据间的独立不相关性,先对宽带信号与残余谐波进行相关性检测,再根据相关性进行自适应更新补偿模型权重,消除相关性,从而抑制系统非线性。仿真结果表明,相比于过去的算法,该算法在存在大信号干扰的情况下,能大大抑制信号的非线性,使得微弱信号误码率下降,大幅提高了接收系统的灵敏度,且计算复杂度较低。
2018, 33(5):826-836. DOI: 10.16337/j.1004-9037.2018.05.007
摘要:针对单基地MIMO中相干目标的波达角(Direction-of-arrival,DOA)和多普勒频率联合估计问题,提出了一种降维-前向平滑-传播算子算法(Reduced dimension-forward spatial smoothing-propagator method,RD-FSS-PM)。该算法首先通过对接收信号进行降维变换以降低复杂度,继而利用前向平滑技术(Forward spatial smoothing,FSS)实现解相干,最后通过传播算子算法(Propagator method,PM)实现了对相干目标的波达角和多普勒频率联合估计,且无需额外配对。与传统的FSS-PM算法相比,所提算法波达角估计性能提升,多普勒频率估计性能接近而复杂度大大降低。本文同时分析了算法的理论均方误差(Mean squared error,MSE)和单基地MIMO雷达中波达角和多普勒频率联合估计问题的克拉美罗界(Cramer-Rao bound,CRB)。最后提供了详尽的仿真实验以验证算法的性能。
陈星波 , 周加兵 , 刘丁赟 , 邱朝阳 , 王刚 , 饶妮妮
2018, 33(5):837-846. DOI: 10.16337/j.1004-9037.2018.05.008
摘要:发射波形自适应能够优化雷达在检测、跟踪和抗干扰等方面的能力,但其性能的好坏与雷达目标和杂波先验知识有很强的相关性。采用最大输出信杂噪比准则设计的雷达发射波形自适应方法已经在理论上被证实可行和有效。为了提升这类方法的实际应用价值,本文利用Swerling统计模型和数字高程模型(Digital elevation model,DEM)提供的目标和杂波先验信息,针对机载相控阵雷达,分析了基于最大输出信杂噪比(Signal-to-clutter-noise ratio,SCNR)准则的发射波形自适应方法性能和实用价值。仿真结果表明,这类发射波形能够自适应地随着目标和杂波的变化而改变,并实现二者的最优匹配,在提升雷达输出信杂噪比上优于传统发射波形,具有良好的实际应用前景。
高淑蕾 , 周冕 , 薛彦兵 , 徐光平 , 高赞 , 张桦
2018, 33(5):847-854. DOI: 10.16337/j.1004-9037.2018.05.009
摘要:如何提高自然环境下或非受限环境下人脸属性识别的准确率是应用人脸属性的一个重要问题。在日常生活中,人脸姿势和光照等不可控制的因素对识别人脸属性产生了较大影响,如何在上述因素影响下提高识别的精度是我们研究人脸属性识别的关键问题。目前卷积神经网络(Convolutional neural network,CNN)在图像分类中已经取得显著性成果,本文通过采用多级子网络和排序性Dropout机制算法重新构建一个网络结构,该结构对处理人脸姿势变化等具有较强的鲁棒性,在CelebA数据集和LFWA数据集中取得较好的效果,且大大降低了网络体积。
2018, 33(5):855-864. DOI: 10.16337/j.1004-9037.2018.05.010
摘要:行人重识别问题是计算机视觉的重要研究内容之一,旨在将多个非重叠相机中的目标行人准确加以识别。当将某摄像机中的行人图像视为目标行人在该摄像机视图上的一种表示时,行人重识别可被认为是一种多视图学习问题。在此基础上提出的基于典型相关分析的行人重识别算法仅是一种线性降维算法,很难从复杂的重识别系统(如目标行人图像受低分辨率、光照及行人姿态变化等因素影响)中提取有效的高层语义信息,用于行人重识别。为此,本文提出了一种基于稀疏学习的行人重识别算法(Sparsity learning based person re-identification,SLR)。SLR首先通过稀疏学习获取目标行人在每一相机视图上的高层语义表示,然后将高层特征映射到一个公共的隐空间,使不同视图间的特征距离可比较。SLR算法的优点在于通过学习鲁棒的行人图像特征表示,能够获得更具判别性的公共隐空间,以提高算法的行人重识别性能。在VIPeR、CUHK数据集上的实验结果表明了本文算法的有效性。
2018, 33(5):865-871. DOI: 10.16337/j.1004-9037.2018.05.011
摘要:针对传统稀疏分解算法致使冗余字典中原子数量巨大的缺陷,提出一种线性调频信号的快速稀疏分解算法。这种算法根据线性调频信号本身的特点构建冗余字典中的原子,构建了两个冗余字典,通过级联的方式,完成了线性调频信号的快速稀疏分解。通过分析,采用这种级联的方式使得总的原子数量远小于一个冗余字典中的原子数量。在利用第一个冗余字典进行稀疏分解时,该算法通过快速傅里叶变换寻找最大值在另一个冗余字典中同时得到最匹配的原子。实验结果证实这种算法比其他3种采用单一冗余字典的稀疏分解算法,不仅加快了稀疏分解速度,而且具有更好的收敛性。
2018, 33(5):872-879. DOI: 10.16337/j.1004-9037.2018.05.012
摘要:为了提高合成孔径雷达图像目标识别效果,提出一种基于多线性主成分分析和张量分析的合成孔径雷达图像目标识别方法。该方法首先构建四阶张量训练样本,利用多线性主成分分析得到多线性投影矩阵;再通过投影矩阵构建核心张量,对核心张量进行线性判别分析;最后对测试样本分类识别。实验中,将本文提出的多线性主成分分析和张量分析方法在MSTAR公共数据库上进行识别实验,并与主成分分析和二维主成分分析方法进行识别率比较。实验结果表明,本文方法有效保留了图像的空间结构信息,提高了目标正确识别率。
林金朝 , 刘乐乐 , 李国权 , 柏桐 , 王慧倩 , 庞宇
2018, 33(5):880-890. DOI: 10.16337/j.1004-9037.2018.05.013
摘要:针对传统方法滤波效果不佳的问题,本文提出了基于改进集合经验模态分解(Ensemble empirical mode decomposition,EEMD)的消除心电信号基线漂移方法。该方法克服了经验模态分解(Empirical mode decomposition,EMD)模态混叠的问题,并对EEMD方法存在的问题和不足进行改进,建立集合经验模态分解方法中加入辅助白噪声大小的可依据准则,从而确定加入的辅助白噪声大小以及集合平均次数这两个重要参数。它从含噪心电信号中提取基线漂移信号,然后重构其余本征模函数(Intrinsic mode function,IMF)分量得到"干净"的心电信号,为后续的研究提供前提。经实验验证表明:相较于传统方法,这种方法能够提高信噪比、降低均方差、保持特征波形、去噪更加彻底,很好地解决了心电信号低频成分损失的问题。
2018, 33(5):891-899. DOI: 10.16337/j.1004-9037.2018.05.014
摘要:逼近理想点排序(Technique for order performance by similanrity to ideal solution,TOPSIS)是一种典型的多目标决策评价方法,被广泛应用在供应商选择等问题中。在某些针对生产的评价中,评价对象较多而且对象之间具有层级关系,决策者更关注对象之间的相对类别关系,即:好、中或是差。然而,针对这类问题的评价模型较为缺乏。因此,本文提出一种新的基于TOPSIS的三支决策评价模型。首先,选用层次分析法(Analytic hierarchy process,AHP)计算权重;然后,为了解决对象之间的层级关系,在评价之前增加了一个预分类过程;最后,使用改进的TOPSIS方法对对象进行三支评价。案例分析结果显示本文提出的方法是有效的。
2018, 33(5):900-910. DOI: 10.16337/j.1004-9037.2018.05.015
摘要:链路预测是复杂网络的一个重要研究方向,基于节点相似性的链路预测方法是最为常用的一种方法。目前大部分使用节点链接紧密度的节点相似性链路预测方法,未考虑每个共同邻居节点的差异性,即不同的节点对连边的贡献度是不同的。本文提出一种结合共同邻居节点之间的节点贡献度和链接紧密度的链路预测算法。该算法首先计算共同邻居节点之间的链接信息作为节点的链接紧密度,再定义耦合度聚簇系数表示共同邻居节点贡献度,最终将二者结合。在实际数据集上的实验结果表明,该算法比4种经典的链路预测算法(CN,AA,RA和Jaccard)和基于节点链接密度的算法CNBIDE具有更好的预测精度。
2018, 33(5):911-920. DOI: 10.16337/j.1004-9037.2018.05.016
摘要:为了增强编码系数的判别性能,提出编码系数矩阵行向量(Profiles)的Fisher判别字典(Profiles of fisher discriminative dictionary learning,PFDDL)学习算法。首先,根据Profiles能反映原子在字典学习中的使用情况,提出一种自适应的原子类标构造方法。然后,利用Profiles与原子间的一一对应关系,设计Profiles的Fisher判别准则作为判别式项,使得同类原子对应Profiles的类内散度尽可能小,不同类原子对应Profiles的类间散度尽可能大,促使字典中的同类原子尽量表示同类训练样本,提高编码系数的判别性能。在3个人脸和1个手写字体数据库上的实验结果表明,提出的算法比其他稀疏编码和字典学习算法能取得更高的分类性能。
王煜涵 , 张春云 , 赵宝林 , 袭肖明 , 耿蕾蕾 , 崔超然
2018, 33(5):921-927. DOI: 10.16337/j.1004-9037.2018.05.017
摘要:随着社交网络的日益普及,基于Twitter文本的情感分析成为近年来的研究热点。Twitter文本中蕴含的情感倾向对于挖掘用户需求和对重大事件的预测具有重要意义。但由于Twitter文本短小和用户自身行为存在随意性等特点,再加之现有的情感分类方法大都基于手工制作的文本特征,难以挖掘文本中隐含的深层语义特征,因此难以提高情感分类性能。本文提出了一种基于卷积神经网络的Twitter文本情感分类模型。该模型利用word2vec方法初始化文本词向量,并采用CNN模型学习文本中的深层语义信息,从而挖掘Twitter文本的情感倾向。实验结果表明,采用该模型能够取得82.3%的召回率,比传统分类方法的分类性能有显著提高。
2018, 33(5):928-935. DOI: 10.16337/j.1004-9037.2018.05.018
摘要:基于图像重建出的三维点云模型通常会包含许多离群点,这些离群点可能孤立存在或密集聚集在一起形成点簇,也可能分布在模型周围甚至附着在模型表面。通过一种检测方法很难有效滤除多种分布状态的离群点,因此,提出了综合的离群点监测算法。首先通过空间距离剔除与模型主体较远的离群点,并通过构建空间拓扑关系加快离群点搜索速度;然后利用边界匹配法,将较小点簇分别与最大点簇进行对比,滤除模型周围离群点簇;最后采用改进的K-means算法,根据RGB颜色值特征对点云数据进行聚簇分类,结合已识别的离群点,检测和滤除附着在模型表面的离群点。仿真实验结果表明,此方法能够有效滤除点云模型中多种分布状态的离群点。
2018, 33(5):936-944. DOI: 10.16337/j.1004-9037.2018.05.019
摘要:类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易。实际分类任务中存在大量的非均衡数据,大类与小类样本之间悬殊的数量差别给分类造成了极大的困难。本文采用实验研究的方法,验证类别混叠度量化指标指导非均衡数据分类的有效性,以减少甚至避免盲目试错带来的庞大计算开销。首先,针对两类分类问题,设计验证实验,在不同类数据非均衡率,不同别边界形状、不同特征类型、不同概率分布的非均衡仿真数据上研究类别混叠度的有效性。其次,在实验研究的基础上,分析数据的非均衡性对类别混叠度的影响规律,找出类别混叠度指导非均衡分类的有效方法。最后,在真实的非均衡数据上验证类别混叠度指导非均衡分类的实际效果。实验结果表明,对数据的非均衡率具有较强鲁棒性的类别混叠度量化指标可以有效地指导非均衡数据的分类器选择。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部