2016, 31(6):1067-1082.
摘要:随着信息技术的迅猛发展,尤其是互联网行业的广泛应用,越来越多的领域出现了对海量、高速到达的数据实时处理需求。如何从浩瀚的“数据海洋”中挖掘有用的知识变得尤为重要。传统批处理模式的机器学习算法在面临 大数据时变得力不从心,而在线学习通过流式计算框架,在内存中直接对数据实时运算,为大数据的学习提供了有力的工具,这类在线学习框架有望应对大数据背景下机器学习任务面临的困境与挑战。本文总结了经典和目前主流的在线学习算法,主要包括:(1)在线线性学习算法;(2)基于核的在线学习算法;(3)其他经典的在线学习算法;(4)在线学习算法的优化理论。本文介绍在线学习与深度学习结合方法的研究现状,探讨在线学习算法研究中的关键问题与应用场景,最后展望了在线学习下一步的研究方向。
2016, 31(6):1083-1096.
摘要:图像插值利用图像已知采样点的灰度值估计未知采样点的灰度值,是图像数据的一种生成过程。图像插值的目的在于通过升采样的方式提高图像的分辨率。本文分析了图像插值与图像超分辨率重建的区别;综述了目前常用的图像插值算法及其优缺点;对基于边缘的插值算法中涉及到的边缘作出了自己的理解与阐述;同时,从主观和客观两方面介绍了当前图像插值质量的评估标准,并用实验结果说明不同降采样方式对图像插值结果的影响;最后给出了未来图像插值的发展形势及前景。
2016, 31(6):1097-1105.
摘要:“去繁存精”的光谱数据解耦方法可去除高维光谱数据的大量冗余,提炼其特征谱段,是光谱仪器得以广泛应用的重要基础。应用各异性和光谱特征优选方法普适性所构成的矛盾,在一定程度上制约了光谱仪 器的应用。本文提出了序列前向选择(Sequential forward selection,SFS) 的光谱特征自适应数据挖掘方法,生成最优变量组合作为支持向量机(Support vector machine,SVM)分类模型的输入,在对光谱数据降维的同时,实现了高精度的数据分类。本文方法可有效解决大量光谱数据的多类分类问题,并在红木分类中得到了实际验证和应用,为破 解因光谱特征峰高度混叠而难以进行主观经验特征选择的困境提供了新思路。
2016, 31(6):1106-1114.
摘要:数字喷泉码是一种无码率码。相较于传统的固定码率的分组码,数字喷泉码能够很好地适应信道的变化,并且能够有效地避免大规模数据传输中的“反馈风暴”问题。由于数字喷泉码没有固定的码率,因此其传输协议与传统的分组码有着很大的区别。本文介绍了几种现有的喷泉码数据传输协议,并在此基础上提出了一种新的喷泉传输协议。该协议以一种特殊的帧结构作为基本传输单元,极大地减小了时延对系统性能的影响。最后对提出的协议进行了性能分析,并给出协议中参数对协议性能的影响。
2016, 31(6):1115-1126.
摘要:针对高速公路交通事故容易引发大规模拥堵的问题,提出了一种基于视频的快速检测算法,实现了事件信息的快速反馈。首先利用平稳序列法获取背景,并由背景差法获取前景。然后在使用凸包占有率对遮挡进行检测的基础上,采用改进的卡尔曼滤波特征匹配跟踪算法对车辆进行跟踪。最后通过对交通流的速度和流量进行检测,建立速度、流量与交通流状态之间的映射关系,运用模糊推理方法判别交通事件的发生。实验结果证明,本文提出的 方法能有效地获取前景信息,并能实时有效地对高速公路上的交通事件进行检测。
2016, 31(6):1127-1131.
摘要:由于常模盲均衡算法(Constant modulus blind equalization,CMA)收敛速度和均方误差都不甚理想,且对多模信号均衡时会发生相位旋转,本文提出了基于模因算法的多模盲均衡算法(Multi-modulus blind equalization algorithm based on memetic algorithm,MA-MMA)。该算法将多模盲均衡算法(Multi-modulus blind equalization algorithm,MMA)代价函数的倒数作为模因算法(Memetic algorithm,MA)的适应度函数,利用MA全局优化机制和局部深度搜索能力,在每次全局搜索后对全部新产生的个体进行局部深度搜索,将全局和局部搜索得到的最优个体解向量作为MMA的初始最优权向量。仿真结果表明,与传统的CMA,MMA以及基于遗传算法的多模盲均衡算法相比,MA-MMA 的收敛速度最快,稳态误差最小,输出信号星座图最清晰。
2016, 31(6):1132-1140.
摘要:最优测试序列的设计是故障诊断过程中必须解决的非确定多项式(Non-deterministic polynomial,NP)完全问题。基于自适应差分进化算法,提出一种惯性速度差分进化(Inertial velocity differential evolution,IVDE)算法,通过增加额外的惯性速度项求解复杂电子系统最优测试序列问题(Optimal test sequence problem,OTP)。为求解该优化问题设计了个体的状态与测试序列编码方式,构建了包含故障隔离率(Fault isolation rate,FIR)等指标的个体适应度函数,通过优化生成诊断决策树来减少测试设备和测试成本。仿真结果表明,IVDE算法可以求得既满足FIR要求,又减少测试成本的测试序列。与粒子群优化算法(Particle swarm optimizer,PSO)、遗传算法(Genetic algorithm,GA)等其他算法相比,IVDE可以求解OTP,得到更好的解。
2016, 31(6):1141-1147.
摘要:针对已有分类器在结构形式和训练方法的不足,构建了一个以二维深度置信网络(2D deep belief networks,2DDBN)为架构的弱监督分层深度学习车辆识别算法。首先,将传统一维的深度置信网络(Deep belief networks,DBN)扩展成2D-DBN,并构建相应分类器结构,从而能够直接以二维图像像素矩阵作为输入; 其次,在传统无监督训练的目标函数中,引入了一个具有适当权重的判别度正则化项,将原有无监督训练转化为带有较弱监督性的弱监督训练方式,从而使提取的特征较传统无监督特征更具判别性。多组对比实验表明,本文所提算法在识别率等指标上要优于已有深度学习算法。
2016, 31(6):1148-1155.
摘要:基于低秩正则化的非局部低秩约束(Nonlocal low-rank regularization, NLR)算法利用相似块的结构稀疏性,获得了目前最好的重构结果。但是它仅仅利用了图像的非局部信息,忽略了图像像素间的局部信息,不能有 效地重建图像的边缘,同时Logdet函数不能很好地替代矩阵秩,因为它跟真实解之间存在着不可忽视的差距。因此,本文提出了一种基于局部和非局部正则化的压缩感知图像重建方法,同时考虑图像的非局部低秩性和图像像素的局部稀疏梯度性。选择利用Schatten-p 范数来替代矩阵秩,同时选择交替方向乘子算法求解产生的非凸优化问题。实验 结果表明,与传统的稀疏性先验重建算法和NLR算法相比,本文算法能够获得更高的图像重构质量。
2016, 31(6):1156-1163.
摘要:在模糊信息系统中,通过有序加权平均(Ordered weighted averaging,OWA)算子计算对象相似度,可以建立λ截集的相容关系。当λ的值确定后,OWA算子中量词参数(α,β)的选取直接关系到不可区分关系的建立以及信息粒的粗细。因此合理选取参数(α,β)是值得进一步研究的问题。本文采用粗糙集三支决策理论,研究模糊信息系统 OWA算子参数选择的相关内容。基于参数的激进、中庸和消极语义,确定OWA算子(α,β)的3种常用取值;进而研究相似度、相容类、双向近似和三支区域在3种参数选择下的性质关系。最后利用实例验证分析了模糊量词参数语义解释的合理性。本文采用三支决策创新视角,得到模糊信息系统OWA算子的深入性质,为相关模糊量词参数提供语义解释与选择依据。
2016, 31(6):1164-1170.
摘要:低复杂度视频编码越来越受到人们的关注。压缩感知理论具有同时采样和压缩信号的特点,可用于低复杂度视频编码设计。针对基于随机观测矩阵的传统压缩感知(Compressive sensing, CS)理论很难实际应用这一问题,提出采用结构化观测矩阵的CS算法对视频编解码。探讨了结构化观测矩阵的特点和构造方法,分析了不同类型结构化观测矩阵实现信号精确重构的理论,设计了基于结构化观测矩阵的CS视频编解码算法。实验证明了所提算法的有效性,同时由于结构化观测矩阵高效、易于硬件实现,因此该算法在低复杂度视频场合具有良好的应用前景。
2016, 31(6):1171-1177.
摘要:为了对教学视频这一专门类别视频进行自动标注,本文首先提取视频中的字幕信息,通过文本预处理后,使用视频中的字幕文本信息内容结合潜在狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型方法获得视频镜头在主题上的概率分布,通过计算主题概率分布差异,进行语义层面镜头分割。然后以镜头为样本,使用安全的半监督支持向量机(Safe semi-supervised support vector machine,S4VM)方法,通过少量的标注镜头样本,完成对未标注镜头的自动标注。实验结果表明,本文方法利用字幕文本信息和LDA模型,有效完成了视频的语义镜头分割,不仅可以对镜头完成标注,而且可以对整个视频进行关键词标注。
2016, 31(6):1178-1184.
摘要:为满足车联网中定位精度的要求, 本文提出了一种伪距双差车辆相对定位算法,该算法通过车辆间伪距信息的车到车(Vehicle-to-vehicle,V2V)交互,抵消了公共误差及不同接收机的时钟偏移量,提高了伪距双差的车辆定位精度。通过对比分析伪距双差算法与全球定位系统(Global position system,GPS)单点定位算法的距离误差均方根,证明了伪距双差算法的定位精度。仿真结果表明采用伪距双差算法(Double differencing relative,DDR) 的相对定位技术在公共可见卫星 数大于4时,其相对定位性能优于GPS单点定位方法。
2016, 31(6):1185-1191.
摘要:针对传统空时结构宽带波束形成器结构复杂、计算量大和稳健性差的问题,提出低复杂度的稳健宽带波束形成算法。首先给出频率变化时阵列响应相位,分析频率变化与角度变化对阵列响应相位的影响。通过对期望信号不同频点施加阵列响应幅度和相位约束,补偿不同频率间的阵列响应相位差来实现无需延迟线或FIR/IIR滤波器结构的稳健宽带波束形成。然后分析频率和角度同时变化对阵列响应相位的影响,在期望信号来向附近引入辅助方位角,进一步提高期望信号来向趋于零度和相对带宽较小时算法的稳健性。理论分析与仿真实验表明,本文算法结构简单,计算复杂度较低且具有较好的稳健性。
2016, 31(6):1192-1198.
摘要:针对基于压缩数据采集的数据聚合需要高效的路由转发树协议,以便更好地采集到从传感器节点到sink节点的编码数据,提出了一种新型高效节能的分布式压缩数据收集方法。该方法中每个传感器节点均可独自寻找父节点,并构建一部分路由树,无需利用中心节点来构建所有转发树,从而允许每个传感器节点对转发树的构建和维护做出局部决策。仿真实验结果表明,相比传统的压缩数据收集方法,新方法的复杂性较低并且开销降低近50%。
2016, 31(6):1199-1204.
摘要:从序列SAR影像中选取全部有效的相干像元是提高SAR干涉变形监测空间密度和可靠性的重要保障。针对地基SAR的局域性、连续观测、数据量大、零基线干涉、相干性强和空间分辨率不一致等特点,在研究其成像特点的基础上,提出从海量时序地基SAR干涉图中提取相干目标的双阈值法,利用隔河岩水利工程区域1 330幅地基SAR影像对该方法进行了检验,实验结果证明该方法可有效提取可靠的相干像元,并指出当地基SAR影像多于600幅时,小于0.3的平均相干系数阈值对相干目标数量几乎没有影响,而振幅离差指数阈值是影响地基SAR相干目标数量的主要因素。
2016, 31(6):1205-1212.
摘要:由于语义可理解性及共享性,视觉属性作为刻画对象的中间特征表示在众多领域得到了广泛应用。视觉属性学习中,大量的人工成本用于属性定义和标注,因此难以避免地引入了主观偏见,属性表示的类别判别性难以保证,尤其面临对判别性要求较高的细粒度识别任务时更为明显。复合属性符合人类认知规律以及对象复杂多模分布的事实,从刻画对象的分布入手,以较低廉的代价建立兼具一定描述能力及较好判别能力的特征表示,以应对细粒度识别任务对判别特征和判别模型的较高要求。在细粒度识别代表性公开数据集CUB上验证了所提方法的有效性。在细粒度识别任务中,复合属性表现出比人工定义的属性以及类别判别属性更优的性能。
2016, 31(6):1213-1219.
摘要:块对角化(Block diagonalization, BD)预编码算法通过两次奇异值分解实现多用户间干扰消除并将下行多用户多输入多输出(Multi-user multiple-input multiple-output, MU-MIMO)信道解耦成多个独立 的单用户MIMO(Single-user MIMO, SU-MIMO)信道,但其计算复杂度也随着用户数量和矩阵维数的增加而增加 。在MU-MIMO下行系统中,提出基于格基缩减的改进块对角化传输策略,将BD算法的第2次奇异值分解替换为基于格基缩减的线性检测,可得到比传统BD传输策略更好的误码率性能以及更低的计算复杂度。
2016, 31(6):1220-1227.
摘要:大多数研究者对微博倾向性分析过多关注的是情感词、形容词和否定词,忽略了 关联词对其情感倾向的影响。为了提高微博情感倾向性分析的准确率,提出了融合关联词的微博倾向性分析方法,考虑微博文本中形容词、程度副词以及关联词之间的组合关系。 本文充分考虑了关联词的结构特点并在已有词典的基础上构建专门用于微博倾向性分析的微博词典、否定词词典和关联词词典,同时考虑到网络新词对微博倾向性的影响,还构建 了一个全新的网络新词词典。借助支持向量机(Support vector machine,SVM)将微博文本分为负向、正向和中性3 类,通过结合情感词典和SVM的方法提高微博文本倾向性分析的准确率。通过对COASE 2014 数据实验可以表明,本文方法对微博倾向性分析取得了较好的效果。
2016, 31(6):1228-1233.
摘要:移动通信基站端为了更有效地进行模式切换,需要测量一些物理量,例如信号与干扰加噪声比(Signal to interference plus noise ratio,SINR)、用户的移动速度等。本文利用上行正交频分复用(Orthogonal frequency division multiplexing, OFDM)系统中的解调参考信号(De-modulation reference signal,DMRS)频域信道信息,在计算自相关系数时引入修正因子和限制因子,有效地减小了噪声影响,并且使自相关系数计算公式适用于有或无直射径的不同信道条件。在不同信道模型和信噪比(Signal to noise ratio,SNR)下进行的仿真结果表明,本文方法可以稳定、准确地估计终端移动速度。
2016, 31(6):1234-1241.
摘要:传统的基于评分预测的协同过滤算法在计算用户之间相似性时只针对用户共同评过分的物品计算评分差异,然而由于不同用户共同评分的物品数目不同,使得计算标准不统一,从而导致推荐质量不理想。本文在传统算法的基础上进行改进,新算法在计算相似性的时候一方面考虑了用户共同评分的物品数,另一方面还考虑了物品的热门程度对用户相似性计算的影响。实验结果表明,新算法在推荐准确率和召回率上都比传统算法提高了1倍以上。研究还发现在算法中使用Pearson相关系 数明显好于使用欧氏距离作相似性度量标准得到的推荐效果。
2016, 31(6):1242-1249.
摘要:大型阵列采用子阵级处理方法可以用小的代价获得较好的处理性能。本文提出一种均匀线阵(Uniform linear array,ULA)子阵级处理方法,该方法综合考虑子阵划分及子阵级幅度权矢量对阵列输出性能的影响,运用粒子群算法(Particle swarm optimization,PSO)将子阵划分方式及子阵级幅度权值进行联合优化。通过仿真发现,该联合优化方法可以充分利用阵列划分方式的自由度,在已知阵列输出性能的前提下,准确地提供一组阵列划分方式及子阵级幅度权值。与常规方法相比,联合优化方法降低了阵列设计的计算量及阵列设计周期,并且可以得到性能更有针对性的方向图。本文方法也为大型阵列进行子阵划分提供了理论依据。
2016, 31(6):1250-1258.
摘要:针对传统电气化铁路接触网检测在稳定性和准确性方面的不足,提出了以自动 识别的杆号作为接触网杆定位和图像索引检测依据的接触网自动检测系统。该系统介绍了多帧图像杆号识别过程,比较了形状上下文(Shape context,SC)算法、角点典型形状上下文特征(Corner representative shape context,CRSC )算法和重心形状上下文(Center shape context,CSC)算法,确定了将 CSC算法作为杆号识别的算法。实验结果表明,该算法具有实时性好、可靠性高等优点,能够满足时速300 km左 右的接触网实时检测要求,为电气化铁路定位检测提供了一种稳定性好、检测速度快的方法。
2016, 31(6):1259-1264.
摘要:针对分布区域广、结构复杂的系统,提出了有序树模型来实时、有效地实现故障检测。通过分析复杂结构系统的布局特性,构建了有序树模型,实现了对检测数据关联性的有效表示;利用有序树结点间的关联性和传感器的测量值,估算出相应结点的数据计 算值;根据相应结点测量值与估计值的关系,推算出管道运行工况,实现对复杂系统故障的检测。通过仿真验证了该方法故障检测的有效性,为系统的维护提供了理论依据。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部