2017, 32(6):1069-1081. DOI: 10.16337/j.1004-9037.2017.06.001
摘要:语音交互技术在实际的话音驱动应用中得到日益普及。然而,当声源距离传声器较远时,由于实际环境中混响现象的影响,语音交互的性能还远不能使人满意。针对混响问题,数十年来学者们不断地进行大量的研究,并提出了很多实用的方法。特别是近期兴起的在很大程度上改变语音处理格局的深度学习技术,在单通道去混响方面也取得了很多令人瞩目的效果。然而,目前系统性总结分析基于深度学习的去混响方法与经典算法之间联系的工作仍然比较匮乏。因此,本文对单通道语音去混响技术的发展脉络进行系统的梳理和总结,并讨论了有待进一步研究的开放问题。
2017, 32(6):1082-1088. DOI: 10.16337/j.1004-9037.2017.06.002
摘要:针对传统常模算法收敛速度慢、均方误差大以及传统神经网络参数多、复杂度高的问题,提出了基于非线性Volterra信道的复数神经多项式盲均衡算法(Fuzzy neural network-complex valued neural polynomial-constant modulus algorithm,FNN-CNP-CMA)。该算法包含单层神经网络和非线性处理器的复数神经多项式,模块结构简单、复杂度低。由模糊神经网络(Fuzzy neural network, FNN)设计的模糊规则控制器能有效提高步长的控制精度。仿真实验结果表明,该算法系统结构简单、复杂度低、收敛速度快且稳态误差小,较好地解决了收敛速度与均方误差之间存在的矛盾。
2017, 32(6):1089-1096. DOI: 10.16337/j.1004-9037.2017.06.003
摘要:提出了一种适用于水声通信系统节点多用户信号获取与干扰抑制的宽带空时恒模阵列算法,实现多用户信号提取和宽带干扰的抑制。该算法与常规恒模阵列相比,具有更强的多径与干扰抑制能力。作为认知水声通信技术的重要组成部分,采用时频分析与瞬时自相关等调制特征提取算法,对宽带恒模阵列获取的多用户及干扰有效分类,从而为不同调制用户解调及干扰抑制提供解决方案。计算机仿真验证了该认知处理算法结构的良好性能。
2017, 32(6):1097-1106. DOI: 10.16337/j.1004-9037.2017.06.004
摘要:在文字检测的相关研究中,针对文字的候选框提取方法并未得到广泛关注与深入挖掘。一方面由于文字本身结构和一般物体具有较强的差异性,另一方面由于文字对检测的精度要求高。本文提出了一种针对文字的候选框提取算法,该算法首先利用全卷积网络进行快速预测文字区域,有效地减少了候选框的搜索范围,然后针对文字特性对EdgeBox算法进行改进,使之适用于自然场景文字候选框的提取。此外,本文在两个自然场景文字检测的标准数据集上对该算法进行了评测,并与其他已有的候选框提取方法进行了比较。实验结果表明本文方法相较其他算法,具有更好的性能和鲁棒性。
2017, 32(6):1107-1114. DOI: 10.16337/j.1004-9037.2017.06.005
摘要:随着扩频技术的发展,为提高应用系统的信号质量、减小同频信号的互扰、增加保密性及抗干扰性,出现了二进制偏移载波(Binary offset carrier, BOC)调制技术。针对BOC调制技术而引发的信号相关多峰、判别模糊等现象,进行副峰抑制关键技术研究,并考虑现有捕获方法存在的局限和不足,提出了一种移动相关函数捕获算法。通过相关函数的有机移动来构造具有单峰特性的相关函数,从而达到抑制副峰的目的。理论与仿真结果表明,新算法能够有效地抑制副峰,而且能够适应更低的信噪比条件,在捕获性能及副峰抑制能力方面,新算法优于现有的算法。本文方法可以为扩频信号的高效同步及系统应用提供理论基础和技术借鉴。
2017, 32(6):1115-1124. DOI: 10.16337/j.1004-9037.2017.06.006
摘要:首先从子空间对齐的角度将干扰信号功率和有用信号功率联合优化的问题建模于Grassmannian流形上,有约束的最优化问题被转化为降维的无约束的最优化问题。然后利用Grassmannian流形的几何特性,提出了一种基于Grassmannian 流形上共轭梯度算法的联合干扰对齐预编码方案。计算机仿真表明,该算法兼顾干扰信号功率的最小化和有用信号功率的最大化,可以有效提高系统的和速率性能,而且该算法可以有效解决Grassmannian流形上最陡下降算法每次寻优的 90°转折问题,具有更高的收敛速度。
2017, 32(6):1125-1133. DOI: 10.16337/j.1004-9037.2017.06.007
摘要:针对人脸部件的变换与脸部化妆,提出了一种基于部件的人脸编辑与美化算法。该算法包括人脸部件渐变与人脸化妆两部分。首先根据所有部件的特征点对人脸进行三角剖分,然后只改变需变换部件的特征点的位置,最后使用线性插值技术对像素点进行赋值,得到部件的变换图。在对不同部件的变换图进行组合后,利用基于范例的数字化妆方法,进一步实现了人脸的整体美化效果。实验结果表明,部件变换并化妆后的人脸具有真实感,美化效果比较明显,这在整容或是化妆领域都有可观的应用前景。
2017, 32(6):1134-1140. DOI: 10.16337/j.1004-9037.2017.06.008
摘要:全双工系统能实现在同一时隙与同一频率传输数据,相比于半双工系统能大大地提升数据吞吐量和频谱效率。为了进一步提高全双工多输入多输出(Multi-input and multi-output,MIMO)中继系统传输速率,本文基于放大转发(Amplify-and-forward,AF)传输模式,在全双工双向中继系统中引入梯度下降算法,将用户发送端、接收端波束成形与中继端波束成形矩阵相结合设计一种最大化速率的交替迭代算法,并构造出一种最小均方误差(Minimum mean square error,MMSE)迭代算法作为初始条件,在此基础上推导出中继接收端与发射端的波束成形矩阵表达式。仿真结果表明,本文构造的交替迭代算法收敛速度快,而且相比于迫零、最小均方误差以及最大泄信噪比算法,和速率有显著提高。
2017, 32(6):1141-1152. DOI: 10.16337/j.1004-9037.2017.06.009
摘要:高维流式大数据的产生与发展对传统机器学习和数据挖掘算法提出了诸多挑战。本文结合流式大数据流式到达的特性,首先建立自适应增量特征提取算法模型。然后,针对噪声环境,建立基于特征空间校准的增量流形学习算法模型,解决小样本问题。最后,构造流形学习的正则化优化框架,解决高维数据流特征提取过程中产生的降维误差问题,并得到最终的最优解。实验结果表明本文提出的算法框架符合流形学习算法的3个 评价指标:稳定性、提高性以及学习曲线能迅速增加到一个相对稳定的水平;从而实现了高维数据流的高效学习。
2017, 32(6):1153-1162. DOI: 10.16337/j.1004-9037.2017.06.010
摘要:k近邻(k nearest neighbor, kNN)分类作为数据挖掘中最典型的算法之一,以较高的泛化性能以及充足的理论基础被广泛应用。然而kNN在测试时需要计算待识别实例与所有训练实例之间的距离,以至于在面对大规模数据时需要大量的时间。 为此,提出一种基于分层抽样的kNN加速算法(KNN based on stratified sampling,SS-kNN)。首先将训练实例所在的空间划分为若干个实例个数相等的区域,然后从每个区域内抽取实例,最后判定待识别实例落入划 分区域中的哪一个,并从此区域以及相邻区域抽取的实例中寻找其k个近邻。与原始kNN算法以及基于随机抽样的kNN算法相比,SS-kNN算法可以获得与其相近分类精度,但将其运 行速度分别提高大约399倍和16倍。
2017, 32(6):1163-1168. DOI: 10.16337/j.1004-9037.2017.06.011
摘要:日冕物质抛射(Coronal mass ejection,CME)是空间灾害天气最主要的驱动源。在CME的众多伴生现象中,日冕暗化与之最为紧密相关。因此,对日冕暗化现象进行检测,有助于预报CME的爆发。随着观测数据量的增加,现有日冕暗化检测算法的效率亟待提升。本文基于一种半自动暗化检测算法,提出并实现该算法的并行方案,以提高算法效率,为实现日冕暗化的实时检测奠定基础。首先介绍了日冕暗化的现有工作,接着详细分析了一种半自动暗化检测方法,它在一定程度上提高了人工识别暗化区域的效率,但其效率并不能满足检测的实时性要求。然后,基于Matlab R2014a平台并行机制的特点,从数据、计算量和图像分块角度对半自动暗化检测算法提出了3种不同的并行方案,实验对比分析结果表明图像分块并行方案的效果最优。
2017, 32(6):1169-1178. DOI: 10.16337/j.1004-9037.2017.06.012
摘要:针对阵列稀疏通常会引起波束方向图旁瓣电平抬高的问题,本文提出了一种基于改进风驱动优化算法和凸优化的稀疏阵列旁瓣抑制方法。该方法首先针对传统的风驱动优化(Wind driven optimization, WDO)算法缺少普遍适用的参数设置方案,提出了一种结合高斯分布的改进风驱动优化算法。将半圆阵方向图的峰值旁瓣电平作为目标函数,采用改进的WDO算法作为全局优化算法来优化阵元位置,同时采用凸优化算法作为局部优化算法来高效求解有效阵元的最优加权系数,确保了阵元位置和权值的理想匹配。仿真结果表明,在稀疏 阵列阵元数一定的情况下,算法可有效降低旁瓣水平,具有更好的全局寻优能力和更快的收敛速度,为稀疏阵列的旁瓣抑制提供了有效的优化设计方法。
2017, 32(6):1179-1186. DOI: 10.16337/j.1004-9037.2017.06.013
摘要:分析阵面安装误差对相控阵雷达测角精度的影响,对研究和设计高精度相控阵雷达非常重要。建立了相控阵雷达阵面安装误差测角精度误差模型,分别仿真分析了阵面倾角安装误差、阵面方位法向误差和阵面不水平度对相控阵雷达测角误差的影响。与理论公式相比,推导出的简约式用于计算阵面安装误差引起的测角误差分析时精度达0.001°量级,可以为相控阵雷达测角系统精度误差指标分配及测角精度超差问题分析定位提供快速、精确的理论依据和工程指导。
2017, 32(6):1187-1197. DOI: 10.16337/j.1004-9037.2017.06.014
摘要:提出一种基于多通道联合估计的非局部均值彩色图像去噪方法,包括彩色通道联合去噪和彩色通道融合去噪两个步骤:在彩色通道联合去噪步骤,采用经典的彩色图像非局部均值去噪算法对噪声彩色图像去噪,得到预去噪图像作为彩色通道融合去噪步骤的输入;在彩色通道融合去噪步骤,采用广义多通道非局部均值去噪算法对预去噪图像再次去噪,去噪过程应用预去噪图像三通道高频成分的相似性。实验结果表明,与其他经典彩色图像去噪方法相比,本文方法在主观和客观上均具有竞争性。
2017, 32(6):1198-1207. DOI: 10.16337/j.1004-9037.2017.06.015
摘要:提出一种基于非负矩阵分解(Nonnegative matrix factorization, NMF)后验特征优化和修正分段动态时间规整(Segmental dynamic time warping, SDTW) 检索的无监督语音查询样例检测方法。该方法首先应用频域线性预测(Frequency domain linear prediction, FDLP)声学特征参数代替梅尔频率倒谱系数(Mel-frequency cepstral coefficients, MFCCs)训练高斯混合模型(Gaussian mixture model, GMM)模型,然后使用NMF算法对高斯后验特征矩阵进行分解,将得到的基矩阵作为子空间变换矩阵对原始后验特征投影,投影可以突出特征中主要分量,平滑距离矩阵。在检索阶段,使用多相邻输出得分对最佳匹配得分进行修正,用于代替标准SDTW算法的1-best输出得分。实验结果表明,在不增加检索时间的情况下,该方法相比应用MFCCs和FDLP特征的基线系统性能提升明显,检索精度分别相对提升了18.6%和18.1%。
2017, 32(6):1208-1215. DOI: 10.16337/j.1004-9037.2017.06.016
摘要:针对非合作低信噪比条件下短码二进制频移键控(Binary phase shift keying,BPSK)/直接序列扩频(Direct sequence spread spectrum,DSSS)信号的盲解扩问题,提出了一种分层的处理方法。算法首先估计序列扩频周期,然后利用短码DSSS信号的相关特性寻找短码序列的起始位,构造两个扩频周期长度的滑动窗口。通过两窗口序列内积的符号判断相邻码字的相对极性。每轮迭代通过滑动对起始位进行修正,提高算法的鲁棒性。仿真实验表明,信噪比高于-2 dB时盲解扩算法可以实现低于2×10-4的误码率,算法具有一定的工程应用价值。
2017, 32(6):1216-1222. DOI: 10.16337/j.1004-9037.2017.06.017
摘要:为了提高K-Means聚类算法在高维数据下的聚类效果,提出一种基于稀疏约束非负矩阵分解的K-Means聚类算法。该算法在最优保持原始数据本质的前提下,通过在非负矩阵分解过程中对基矩阵列向量施加l1与l2范数稀疏约束,首先挖掘嵌入在高维数据中的低维数据结构,实现高维数据的低维表示,然后利用在低维数据聚类中性能良好的K-Means算法对稀疏降维后的数据进行聚类。实验结果表明提出的算法可行,并且在处理高维数据上有效。
2017, 32(6):1223-1231. DOI: 10.16337/j.1004-9037.2017.06.018
摘要:快速l1最小化算法是一种关于求解稀疏矩阵的算法,相对于传统的主成分分析l2范数,l1范数只需要计算图像主要特征的稀疏矩阵,对噪声和异常项具有更好的鲁棒性,且在木材识别领域使用较少。局部二元模式(Local binary pattern,LBP) 是一种描述灰度范围纹理的算法,对于图像特征的描述有显著的效果。本文利用LBP提取不同木材截面RGB图像 三层纹理的特征,用l1算法对特征矩阵进行快速、准确的匹配,检测出是否有缺陷,同时通过图像分块定位缺陷的位置坐标。实验表明快速l1算法结合LBP算子对木材缺陷定位正确率达到0.9 31。
2017, 32(6):1232-1238. DOI: 10.16337/j.1004-9037.2017.06.019
摘要:基于规则分类算法提取的规则集通常存在3个问题:首先,提取的分类规则集中短规则过少,致使高质量的规则不多;其次,规则集中规则数量少,训练数据中几乎所有实例仅被规则覆盖一次;第三,虽然提取大量的规则,但是训练数据中存在一些小类样本的实例不能被任何一条规则覆盖。本文提出一种改进的基于规则的实例多覆盖分类算法(Rule-based classification with instances covered by multiple rules, RCIM),其特点是:(1)为了提高规则的质量,在选择生成规则的第1项时不仅考虑属性值的好坏,而且还考虑了属性值补的好坏;(2)一次产生尽量多,高质量的规则,而且当训练数据的实例至少被两条规则覆盖后才将其删除;(3)当遇上难以判断的测试数据时,对测试数据的各个属性值进行二次学习提取规则。算法RCIM不仅可以有效地提取大量的规则,而且较大程度地提高了规则的质量。通 过在大量数据上实验结果表明,RCIM比许多其他算法取得了更高的分类准确率。
2017, 32(6):1239-1247. DOI: 10.16337/j.1004-9037.2017.06.020
摘要:针对多物种鸟声识别中多物种鸟声样本不足的问题,尝试采用单物种鸟声样本训练多物种鸟声识别模型,并提出一种基于特征迁移的多物种鸟声识别方法。该方法引入特征迁移学习算法,利用最大均值差异(Maximum mean discrepancy,MMD)度量鸟声样本特征分布差异,将不同分布的单物种鸟声和多物种鸟声的音频特征映射为同分布的潜在音频特征,再基于同分布的音频特征构造识别模型。使得单物种鸟声样本训练的识别模型也能够适用于多物种鸟声识别 。在自然形成的多物种鸟声数据集上,算法在4项多标记评价指标上都取得了较好的识别效果;在人工构造的多物种鸟声数据集上对比试验表明,基于特征迁移的识别算法在单个物种上的正确识别率相较于对比算法最高提升了20%。
2017, 32(6):1248-1253. DOI: 10.16337/j.1004-9037.2017.06.021
摘要:针对航拍视频的特性,对经典的压缩跟踪(Compression tracking,CT)算法进行了研究,发现了CT算法在样本采集和分类取样步骤中的不足并进行了相应的改进。采用Kalman滤波器预测目标的运动路径,并将预测结果应用于样本采集,自适应地修改搜索范围。更新了分类器的取样反馈过程,先对分类结果进行判断,评分绝对值低于某一阈值的分类结果不反馈给分类器,有效地保持了分类器的正确性。在改进算法的基础上,开发了基于航拍视频的目标跟踪系统。通过与经典压缩跟踪算法在实际航拍道路视频的测试和对比,验证了本文算法的有效性和实时性。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部