2020, 35(5).
摘要:精准的高分辨率海洋环境数据,尤其是在低密度海面测量装置的海域中,对于渔业资源的规划和管理至关重要,并且可以提高渔情模拟预测的精度。在这项研究中,我们使用了两种经典方法:最优插值法(IO)和逐次矫正法(SCM),用于合并卫星遥感和海洋浮标所测得的海洋环境数据。通过使用四种不同的算法来评估遥感海洋环境数据中的偏差矫正:(1)平均偏差矫正,(2)回归方程,(3)分布变换,以及(4)空间变换。海洋环境数据由NMSDC(国家海洋科学数据中心,National Marine Scientific Data center)提供,覆盖南海海域。将自2009年1月至2010年12月收集的海表温度(Sea surface temperature, SST)数据进行统计分析,将两种数据合并技术的性能通过比较,统计分析的计算表明,采用SCM可得到更好的结果。
2020, 35(5):791-806. DOI: 10.16337/j.1004-9037.2020.05.001
摘要:通过引入目标存在状态变量,建立了结合目标检测与参数估计的统一系统模型。给出目标探测信息、检测信息和空间信息的严格定义,并证明探测信息是检测信息与已知目标存在状态的空间信息之和,从理论上解决了探测信息和检测信息的定量问题。推导出目标匹配和非匹配条件下检测信息的理论公式。提出了随机目标检测方法,并证明了目标检测定理。目标检测定理指出,检测信息是可达的,反之,任何检测器的经验检测信息不大于检测信息。本文提出的目标检测信息理论打破了纽曼-皮尔逊准则一统天下的局面,为目标检测的系统理论和设计方法开辟了新的方向。
2020, 35(5):807-823. DOI: 10.16337/j.1004-9037.2020.05.002
摘要:语音欺骗是指通过录音、语音合成(Text-to-speech, TTS)、语音转换(Voice conversion, VC)等手段,将一段非法的、未经过自动说话人验证(Automatic speaker verification, ASV)系统认证的声音进行“修改仿冒”,以达到通过ASV系统检测的目的。随着人工智能和语音欺骗技术的发展,ASV系统在安全性方面遇到了严峻的挑战。检测输入ASV系统的语音的真实性,防止欺骗语音通过ASV的验证以提高ASV系统的安全性,是近年来语音领域研究的一个热点问题。国内外学者的最新研究从声学特征选取、识别模型选择等角度出发,探索了不同的语音欺骗方法对ASV系统的影响,并深入研究了相应的语音欺骗检测技术,在一定程度上提高了ASV系统的防欺骗性能。本文介绍了语音欺骗的基本方法,给出了语音欺骗检测的框架和典型声学特征,分两大类别总结了语音欺骗检测的主要方法和最新进展,梳理了目前语音欺骗检测中仍然存在的若干技术问题,并对语音欺骗检测技术的发展方向进行了展望。
2020, 35(5):824-833. DOI: 10.16337/j.1004-9037.2020.05.003
摘要:精准的高分辨率海洋环境数据,尤其是在低密度海面测量装置的海域中,对于渔业资源的规划和管理至关重要。为此以2009年1月至2010年12月收集的南海海域海表温度(Sea surface temperature, SST)数据为样本,采用逐次校正法(Successive correction method, SCM)对卫星遥感和海洋浮标所测得的海洋环境数据进行合并,以提高大尺度下的海洋环境数据分辨率,合并结果与最优插值(Optimal interpolation, OI)方法进行了比较。结果表明,SCM和OI方法的地图检测结果虽有相似的空间分布,但由空间统计分析可知,SCM方法的平均误差和平均绝对误差更接近;留一法交叉验证表明,SCM的均方根误差更小。因此,相比传统的OI方法,SCM通用性更强,可以增加校正的迭代平滑性,具备实时提供高分辨率精准的海洋环境数据的能力。
2020, 35(5):834-841. DOI: 10.16337/j.1004-9037.2020.05.004
摘要:海量数据存储和同步是智能制造产线中的重要问题。当前数据同步的主流方法是远程同步(Remote synchronization, RSYNC)算法,采用同步增量数据的方法减少数据传输量。智能制造产线产生的数据层次结构深、目录结构复杂,导致同步时评估时间长。为此提出分层哈希编号算法进行同步,基于数据分层对数据文件编号,使用散列表记录层次信息,快速比对差异数据,并对不同类型的差异数据采用不同备份策略。实验结果表明,与标准RSYNC相比,该方法有效减少了RSYNC评估的数据量,有效降低了同步时间,提高了同步备份效率。
2020, 35(5):842-849. DOI: 10.16337/j.1004-9037.2020.05.005
摘要:在大数据环境下,随着全球网络广告传播行业的快速发展,网络广告的计算也越来越受到人们的高度关注。计算广告旨在将广告投放到特定的受众人群,以广告环境和用户特征为基础进行数据分析计算,从候选广告库中选择出最佳匹配的广告。其核心问题是通过网络广告点击转化率预测的计算,将用户点击可能性最高的广告选择出来。广告点击转化率的精确预测与媒体、广告主和用户3方的利益密切相关。该研究基于TrackMaster平台提供的真实广告数据,以特征工程的视角,分别从用户信息特征、广告信息特征、上下文特征和统计特征4个角度进行特征分析,从而挖掘出对广告点击转化率影响较大的重要特征,构建广告点击转化率预测分层模型并训练,并且结合LightGBM算法模型得出广告点击转化率的重要特征排序。实验结果表明当特征选择阈值
2020, 35(5):850-857. DOI: 10.16337/j.1004-9037.2020.05.006
摘要:x-vector系统将一段不定长的语音通过神经网络映射成固定维的矢量来表征说话人信息,该系统在文本无关的说话人确认(Speaker verification, SV)任务中取得了优异的性能。本文将其应用到文本相关的SV任务中,在x-vector模型选择上,采用残差神经网络以获得更有区分性的x-vector;在包含多字符的语句中,对每个字训练一个残差神经网络;在提取过程中,每一字单独提取一个x-vector并单独进行说话人判决,最后将多个判决得分进行融合后给出最终的识别结果。实验是在数据库RSR2015 Part Ⅲ 上进行的,提出的方法在男性和女性测试集上等错误率分别有15.34%、19.7%的下降。
2020, 35(5):858-866. DOI: 10.16337/j.1004-9037.2020.05.007
摘要:现有的跨领域情感分类方法大多只利用了单个源域到目标域的迁移特征,没有充分考虑目标域实例与不同源域之间的联系。针对此问题,本文提出一种无监督的多源跨领域情感分类模型。首先利用单个源域到目标域的迁移特征训练基分类器,并对不同的基分类器加权;然后将不同基分类器对目标域实例预测的集成一致性作为目标函数,优化该目标函数,得到不同基分类器的权重;最后利用加权后的基分类器得到目标域的情感分类结果。该模型在亚马逊产品评论数据集上和Skytrax数据集上进行了实验,并与6种基线模型进行了比较。实验结果表明,本文方法相比基线模型,在8个不同目标域的实验中分类性能均有明显提升。
2020, 35(5):867-879. DOI: 10.16337/j.1004-9037.2020.05.008
摘要:针对传统高分辨率谱估计法估计远场声源波达方向(Direction of arrival, DOA)时计算量大、对相干信号估计失准的问题,本文提出一种改进的基于圆形麦克风阵列和四阶累积量的声源二维DOA估计算法。该算法结合了圆阵定位无死角的优势和矩阵虚拟扩展获得更多声源定位信息的长处。首先利用模式空间变换将均匀圆形阵列(Uniform circular array,UCA)虚拟化成2K+1个均匀线性阵列(Uniform linear array,ULA),并应用空间平滑技术将虚拟线性阵列划分成L个子阵;接着利用四阶累积构造方法提取有效阵元信息并去掉冗余数据,通过重构矩阵得到新的接收数据;最后通过MUSIC-like算法搜索谱峰获得声源信号的方位角和俯仰角。仿真结果表明:在信噪比(Signal-to-noise ratio,SNR)较低时,相比传统的高分辨谱估计算法,本文算法可实现对远场相干信号的高精度估计;同时本文算法也具有更低的均方根误差性能,且能有效减少运行时间。
2020, 35(5):880-891. DOI: 10.16337/j.1004-9037.2020.05.009
摘要:语音的电子伪装是指采用变声设备或语音处理软件改变说话人的个性特征,以达到故意隐藏该说话人身份的目的。电子伪装语音还原是指通过技术手段将伪装语音变回原声,这对基于语音的身份鉴别有重要意义。本文将频域和时域伪装语音的还原问题抽象为伪装因子的估计问题,通过基于i-vector的自动说话人确认方法估计伪装因子,并引入对称变换进一步提高估计效果。该方法借助于i-vector的噪声鲁棒性,提高了真实含噪场景下伪装因子的估计精度,从而改进了噪声条件下电子伪装语音的还原效果。在干净语音库TIMIT上训练i-vector并在含噪语音库VoxCeleb1上对本文方法进行测试,结果表明,伪装因子估计的错误率从基线系统的9.19%降低为4.49%,还原语音在自动说话人确认等错误率和听觉感知方面也取得了提升。
2020, 35(5):892-902. DOI: 10.16337/j.1004-9037.2020.05.010
摘要:模糊函数主脊(Ambiguity function main ridge, AFMR)切面特征能较好地反映不同信号结构上的本质差别,是解决当前复杂体制雷达辐射源信号分选难题的可行参数,而快速、智能地搜索模糊函数主脊切面是增加其切面特征实用性的重要问题。为此,本文构建了一种结合均匀初始化策略和改进非线性收敛因子的改进自适应灰狼算法来搜索典型6种雷达辐射源信号的模糊函数主脊切面并提取切面特征,并与穷举法和标准灰狼算法进行对比。实验结果表明,所提方法在搜索AFMR切面并提取特征时,平均耗时仅为1.49 s,相较于穷举法和标准灰狼优化算法,效率分别提高了75.7%和19.0%,具有较优的时效性。在固定信噪比(Signal-to-noise ratio, SNR)环境下,当SNR不低于0 dB时,提取到特征值的平均聚类准确率为96.4%,在0~20 dB动态信噪比环境下,平均聚类准确率可达95.2%,具有较好的准确性、抗噪性能及较强的类内聚集性和类间分离能力,证实了所提方法的可行性与有效性。
2020, 35(5):903-909. DOI: 10.16337/j.1004-9037.2020.05.011
摘要:针对室内环境中WiFi信号强度易受外界干扰,其不稳定性使得在指纹数据库中进行匹配时准确性较低,定位精度不高的问题,提出一种基于室内指纹定位的优化算法。该算法分别对指纹数据库和匹配算法进行优化。数据库优化采用限幅和滑动平均滤波进行预处理,并根据室内环境分配采样点所属区域编号,构建多维指纹数据库;匹配算法优化首先根据支持向量机(Support vector machine,SVM)对待定位点分类,获取其对应的区域编号,再将欧氏距离、曼哈顿距离和切比雪夫距离三者结合得到位置估计。最后,结合行人航位推算(Pedestrian dead reckoning, PDR)算法将得到的步长与航向角一同进行粒子滤波(Particle filtering, PF)实现定位。实验表明:本文的算法将定位精度提高了13.92%。
2020, 35(5):910-919. DOI: 10.16337/j.1004-9037.2020.05.012
摘要:盲源分离(Blind source separation, BSS)是一种从混合信号中提取和恢复源信号的信号处理方法。在众多BSS算法中,主偏度分析(Principal skewness analysis, PSA)算法是近年来出现的一种以三阶统计量为目标函数的BSS算法,其运算速度快于常规的BSS算法,但因其采用了串行的计算方式,在使用中存在误差累积问题。针对这一问题,本文在PSA算法基础上进行改进,提出了一种并行PSA算法。该算法以并行计算代替串行计算,可以同时估计出各个独立成分对应的方向,避免了误差累积问题。数值仿真实验表明,与PSA算法相比,并行PSA算法既保持了计算速度,同时提高了对源信号的估计准确性。
2020, 35(5):920-929. DOI: 10.16337/j.1004-9037.2020.05.013
摘要:LEACH协议是无线传感器网络中分布式成簇网络协议中的经典算法。但网络中的簇头能量消耗不平均、节点死亡时间出现的早等问题较为严重,本文提出了改进的基于分区和能量距离因子的LEACH-EDP协议。通过提出距离修正和剩余能量修正因子来修正簇头选举阈值函数,对部署实施区域分区,针对区域进行各种增益参数权重的调整,从而延缓网络中死亡节点的第一次出现,使WSN的存活时间得到一定的延长。仿真实验表明,与传统LEACH协议进行对比,LEACH-EDP协议死亡节点的出现推迟了79.5%,网络死亡时间延迟了57.4%。
2020, 35(5):930-941. DOI: 10.16337/j.1004-9037.2020.05.014
摘要:问答系统是一种以准确且自然的语言来回答用户提问的系统。本文对其中涉及的“命名实体识别”环节尝试了一些改进措施:针对传统单向模板匹配耗时耗力的问题,提出一种双向格子结构的长短时记忆网络(Lattice Bi-LSTM),解决了命名实体识别中对句子处理不当和对分词结果具有依赖性的两大问题。与单向结构相比,双向结构能更好地利用句子信息,使输出结果更具鲁棒性,从而更准确地捕获语义信息;针对传统方法未考虑实体间相似度的非线性耦合性问题,提出一种利用周期性核函数将“相似”实体准确链接到知识库中去的方法。对提出的两种改进方法进行了实验验证,结果表明:与经典方法相比,所用方法具有显著的改进效果。
2020, 35(5):942-955. DOI: 10.16337/j.1004-9037.2020.05.015
摘要:提出了一种新的物理主机资源利用阈值边界管理策略(Physical host resource utilization thresholds management strategy, RUT-MS)。RUT-MS把云数据中心的虚拟机迁移过程进一步划分为超负载主机检测、虚拟机选择、虚拟机放置第1阶段、低负载主机检测和虚拟机放置第2阶段。使用一种迭代权重线性回归方法来预测物理资源的阈值上限,避免超负载的物理主机数量的增加;采用最小能量消耗策略完成虚拟机选择过程;使用多维物理资源的均方根来确定其资源使用阈值下限,减少低负载物理主机数量。实验结果表明: RUT-MS物理资源利用阈值边界管理策略使云数据中心的能量消耗和虚拟机迁移次数明显减少,SLA(Service level agreement)违规率和SLA及能量消耗联合指标只有少量的增加。
2020, 35(5):956-964. DOI: 10.16337/j.1004-9037.2020.05.001
摘要:为了在攻击形式多样化、入侵数据海量及多维化的环境中快速、准确地识别网络攻击,提出了一种融合Fisher-PCA特征提取与深度学习的入侵检测算法。通过Fisher特征选择算法选出重要的特征组成特征子集,然后基于主成分分析法(Principal component analysis,PCA)将特征子集进行降维,提取出了分类能力强的特征集。构建了一种新的深度神经网络(Deep neural networks,DNN)模型对网络攻击数据和正常数据进行识别与分类。在KDD99数据集上进行实验,结果表明:与传统的人工神经网络(Artificial neural network, ANN)和支持向量机(Support vector machine, SVM)算法相比,这种入侵检测算法的准确率分别提高了12.63%和6.77%,误报率由原来的2.31%和1.96%降为0.28%;与DBN4 和PCA-CNN算法相比,在准确率和检测率保持基本相同的同时有着更低的误报率。
2020, 35(5):965-977. DOI: 10.16337/j.1004-9037.2020.05.017
摘要:提出了基于LDA主题模型和直觉模糊TOPSIS的农产品在线评论情感分析方法。该方法使用情感词典对在线评论进行情感倾向分析,并计算农产品的积极情感值;运用LDA主题模型计算各个属性的权重,结合直觉模糊TOPSIS方法计算农产品的综合评价值;采用SPSS统计分析软件进行有效性检验。结果表明,综合评价值与月销售量、积极情感值呈显著的正相关性,说明该方法具有合理性,为挖掘农产品在线评论中的情感信息提供一种新的思路。
2020, 35(5):978-990. DOI: 10.16337/j.1004-9037.2020.05.018
摘要:针对有源压制干扰下的相控阵雷达(Phased array radar, PAR)多目标跟踪时间资源优化配置问题,提出了一种基于互信息(Mutual information, MI)的配置算法。采用MI准则作为目标跟踪性能量化指标,推导了包含时间变量的雷达回波与路径增益矩阵MI表达式,建立了时间资源优化配置模型,并采用改进的遗传算法实现了模型求解。仿真结果表明,该算法能在有源压制干扰条件下最大化有效跟踪目标数,并提高有效跟踪目标的整体跟踪性能。
2020, 35(5):991-1000. DOI: 10.16337/j.1004-9037.2020.05.019
摘要:研究了勾股模糊数信息环境下属性值间存在内在关联性的多属性决策问题。首先定义了基于t-模和t-余模的勾股模糊数运算;将Heronian平均融入到聚合算子的构建过程中;讨论了勾股模糊Heronian平均算法的3个特征性质和经常使用的特例。然后构建了改进的勾股模糊决策模型,该模型在考虑输入属性值之间关联性的同时,提高了决策的使用范围。最后通过多属性决策实例验证了改进的决策模型合理有效。
2020, 35(5):1001-1010. DOI: 10.16337/j.1004-9037.2020.05.020
摘要:针对视频多屏显示系统无法依据分屏数量进行超高清视频自适应分屏传输的问题,提出了异构多核的视频流传输方法。该方法首先采用基于ARM处理器的嵌入式系统实现多任务处理与实时监控;然后通过FPGA实现对视频流的接收、转换、处理及分屏输出显示的硬件加速。系统可以根据输入信号实时配置FPGA的工作参数,实现分辨率和分屏数量可变的超高清视频流分屏显示。最后采用Zynq UltraScale+MPSOC XCZU7EV多核异构处理器开发平台对本文系统进行测试,结果表明:4K视频多路分屏画面拼接无明显错位,同步一致,较好地满足了视频多路分屏显示要求。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部