2021, 36(3):391-417. DOI: 10.16337/j.1004-9037.2021.03.001
摘要:小目标检测长期以来是计算机视觉中的一个难点和研究热点。在深度学习的驱动下,小目标检测已取得了重大突破,并成功应用于国防安全、智能交通和工业自动化等领域。为了进一步促进小目标检测的发展,本文对小目标检测算法进行了全面的总结,并对已有算法进行了归类、分析和比较。首先,对小目标进行了定义,并概述小目标检测所面临的挑战。然后,重点阐述从数据增强、多尺度学习、上下文学习、生成对抗学习以及无锚机制等方面来提升小目标检测性能的方法,并分析了这些方法的优缺点和关联性。之后,全面介绍小目标数据集,并在一些常用的公共数据集上对已有算法进行了性能评估。最后本文对小目标检测技术的未来发展方向进行了展望。
2021, 36(3):418-435. DOI: 10.16337/j.1004-9037.2021.03.002
摘要:多粒度数据是一种特殊的、有用的数据类型,它通过对论域(研究对象的集合)采用不同的粒化方式使得数据能够在多个粒度空间中进行呈现,在此基础上可以开展数据的多层次知识发现研究。商空间理论、序贯三支决策、多粒度粗糙集、多尺度数据分析模型和多粒度形式概念分析是几种常见的、有效的多粒度数据分析方法,已受到人们的广泛关注。本文对基于粒计算的多粒度数据分析研究工作进行综述,给出每一类多粒度数据分析方法的理论框架、基本概念以及主要研究思想,并指出多粒度数据分析研究中存在的若干问题,为该领域的后续研究提供理论参考。
2021, 36(3):436-448. DOI: 10.16337/j.1004-9037.2021.03.003
摘要:随着数据采集技术的蓬勃发展,各个领域的时空数据不断累积,迫切需要探索高效的时空数据预测方法。深度学习是一种基于人工神经网络的机器学习方法,能有效地处理大规模的复杂数据,因而研究基于深度学习的时空序列预测方法具有十分重要的意义。在这一背景下,针对已有的预测方法进行归纳和总结,首先回顾了深度学习在时空序列预测中的应用背景和发展历程,介绍了时空序列的相关定义、特点及分类;然后按照时空序列数据的类别介绍了基于网格数据的预测方法、基于图数据的预测方法和基于轨迹数据的预测方法;最后总结了上述预测方法,并对当前面临的一些问题及可能的解决方案进行了探讨。
2021, 36(3):449-467. DOI: 10.16337/j.1004-9037.2021.03.004
摘要:开放式行人再识别是在一个未知的空间环境中,候选行人库中并不一定包含有待检索的行人,被视为图像检索的子问题,是比封闭式行人再识别更具挑战和更为实用的应用研究。本文首先总结了开放式行人再识别的发展历程,与封闭式行人再识别的异同,开放式行人再识别建模过程和数据集的比较分析;然后重点总结了开放式行人再识别技术的研究方法,它们分别是以数据为驱动的研究方法、以效率为驱动的研究方法和以实际应用为驱动的研究方法;最后对开放式行人再识别技术的研究难点和未来发展进行了较为详细的分析和探讨。
2021, 36(3):468-476. DOI: 10.16337/j.1004-9037.2021.03.005
摘要:车辆重识别目的是通过不同的摄像机来识别同一辆车。但是由于车辆图像类内差异性大、类间相似性大,使得车辆重识别成为一个极具挑战性的任务。本文提出了一个基于双分支网络特征融合的车辆重识别方法来解决这一问题。该方法使用2个分支和批擦除策略提取并融合全局特征和局部特征,以突出车辆图像的类内相似性和类间差异性;并且采用圆损失代替传统的三元组损失和交叉熵损失的组合来构造目标函数。最后使用本文方法在VeRi-776和VehicleID两个公共数据集上进行实验,结果表明其检索精度比现有方法提高5%左右,证明了本文方法的有效性。
2021, 36(3):477-488. DOI: 10.16337/j.1004-9037.2021.03.006
摘要:由于传统的人脸识别算法效果容易受制于光照、表情、遮挡以及稀疏大噪声等外界因素的影响,如何有效提取数据特征、进一步提升算法的鲁棒性,是传统人脸识别方法发展的关键所在。本文将多矩阵低秩分解应用在人脸特征提取中,充分利用多张人脸之间的结构相似性,探索人脸图像集的低秩子空间,进而结合低秩矩阵恢复模型来提取测试样本的低秩特征。最后, 利用主成分分析(Principal component analysis, PCA)算法对所提取的特征矩阵进行进一步降维,并运用稀疏表示方法分类。实验结果表明,当样本中存在一定的椒盐噪声时,本文算法在AR、Yale和CMU_PIE人脸库上均具有较好的识别精度,验证了本文算法对椒盐噪声的鲁棒性。
2021, 36(3):489-497. DOI: 10.16337/j.1004-9037.2021.03.007
摘要:视频异常事件检测与定位旨在检测视频中发生的异常事件,并锁定其在视频中发生的位置。但是视频场景复杂多样,并且异常发生的位置随机多变,导致发生的异常事件难以被精准定位。本文提出了一种基于卷积自编码器分块学习的视频异常事件检测与定位方法,首先将视频帧进行均匀划分,提取视频帧中每一块的光流和方向梯度直方图(Histogram of oriented gradient, HOG)特征,然后为视频中的不同图块分别设计卷积自编码器以学习正常运动模式特征,最后在异常事件检测过程中利用卷积自编码器的重构误差大小进行异常判断。该方法可以有效地针对视频不同区域进行特征学习,提升了异常事件定位的准确度。所提方法在UCSD Ped1、UCSD Ped2、CUHK Avenue三个公开数据集上进行实验,结果表明该方法能够准确定位异常事件,并且帧级别AUC(Area under the curve)平均提升了5.61%。
2021, 36(3):498-508. DOI: 10.16337/j.1004-9037.2021.03.008
摘要:现有的集成技术大多使用经过训练的各个分类器来组成集成系统,集成系统的庞大导致产生额外的内存开销和计算时间。为了提高集成分类模型的泛化能力和效率,在粗糙集属性约简的研究基础上,提出了一种基于属性约简的自采样集成分类方法。该方法将蚁群优化和属性约简相结合的策略应用在原始特征集上,进而得到多个最优的特征约简子空间,以任意一个约简的特征子集作为集成分类的特征输入,能在一定程度上减少分类器的内存消耗和计算时间;然后结合以样本的学习结果和学习速度为约束条件的自采样方法,迭代训练每个基分类器。最后实验结果验证了本文方法的有效性。
2021, 36(3):509-518. DOI: 10.16337/j.1004-9037.2021.03.009
摘要:不平衡数据分类是机器学习领域的重要研究方向之一,现有不平衡学习算法大多针对二分类而无法满足多分类需求。本文面向多类不平衡数据分类问题,通过结合粗糙集、重采样方法以及动态集成分类策略设计了一种新的多分类模型。该模型运用综合采样方式和粗糙集属性约简技术获得多个平衡数据子集,在此基础上实现动态集成分类模型的构建。真实数据集上的22组实验验证了该模型与两种经典算法相比对少数类样本具有更好的预测性能,可成为多类不平衡数据分类的可选策略。
2021, 36(3):519-528. DOI: 10.16337/j.1004-9037.2021.03.010
摘要:传统的多标签学习算法一般没有考虑标签的不均衡性,从而忽略了标签不平衡给分类带来的影响。但统计发现,目前常用的多标签数据集均存在标签不均衡问题,且少数类标签往往更加重要。基于此,本文提出了一种基于分类间隔增强的不平衡多标签学习算法(Imbalanced multi-label learning algorithm based on classification interval enhanced, MLCIE),旨在利用各标签分类间隔的重构来增强分类器对少数类标签样本的学习效率,提升样本标签质量,从而减少多标签不平衡对分类器学习精度的影响。首先利用各标签密度与条件熵计算各标签的不确定性系数;然后构建分类间隔增强矩阵,将各标签独有的密度信息融入到原始标签矩阵中,获取平衡的标签空间;最后使用极限学习机作为线性分类器进行分类。本文在11个多标签标准数据集上与其他7种多标签学习算法进行对比实验,结果表明本文算法在解决标签不平衡问题上有一定效果。
2021, 36(3):529-543. DOI: 10.16337/j.1004-9037.2021.03.011
摘要:特征选择作为多标记学习任务中关键预处理步骤,能够有效地解决高维多标记数据存在的维度灾难问题。在现有大部分的多标记学习中,标记是以逻辑分布的形式刻画,即示例中相关标记的重要性相同;然而,在许多现实生活中,每个示例的标记重要程度呈现差异性。本文提出了一种基于模糊相似性的标记增强算法,通过衡量示例中标记的模糊相关性,将传统的多标记数据转换为标记分布数据;分析了标记分布数据中在标记上的标记差异性和在特征上的模糊相对辨识关系,给出了在标记空间和特征空间上的模糊辨识度,并构造了衡量特征辨识能力的特征重要度;在此基础上,构建面向标记分布数据的特征选择算法,能获得按特征重要度降序的特征选择结果。最后通过在多个多标记数据集上实验对比和分析,进一步验证了算法的有效性和可行性。
2021, 36(3):544-555. DOI: 10.16337/j.1004-9037.2021.03.012
摘要:稀疏子空间聚类(Sparse subspace clustering, SSC)算法在处理高光谱遥感影像时,地物的划分精度较低,为了提高地物划分精度,本文提出了一种基于信息熵的加权块稀疏子空间聚类算法(Weighted block sparse subspace clustering algorithm based on information entropy, EBSSC)。信息熵权重与块对角约束的引入,可以在仿真实验前获得两像素属于同一类别的先验概率,从而正向干预模型求解出的解趋于块对角结构的最优近似解,使模型获得对抗噪声和异常值的性能,从而提高模型分类的判别能力,以获得更好的地物划分精度。在3个经典高光谱遥感数据集上的实验结果表明,本文算法聚类高光谱影像的效果优于现有的几个经典流行的子空间聚类算法。
2021, 36(3):556-564. DOI: 10.16337/j.1004-9037.2021.03.013
摘要:针对属性权重未知,属性值为语言型Z-number的多属性决策问题,提出了一种基于云模型与丰富度评估的偏好排序组织方法(Preference ranking organization method for enrichment evaluation, PROMETHEE)的决策方法。首先,引入语言尺度函数,然后利用其建立转化模型完成语言型Z-number向云模型的转化。此外,通过定义云可能度函数,建立属性权重求解公式及构建正弦偏好函数,进而计算方案的优先指数,通过计算方案的正负方向优序级别值得到备选方案综合优序级别值,进而得到方案排序。最后通过算例及比较分析验证本方法的有效性和可行性。
2021, 36(3):565-576. DOI: 10.16337/j.1004-9037.2021.03.014
摘要:心率变异性(Heart rate variability, HRV)被广泛用于临床自主神经系统评估和心率异常分类,传统的HRV分析基于心电图(Electrocardiogram, ECG)、光容积图(Photoplethysmography, PPG)和远程光容积图(Remote PPG, RPPG),这些方法存在诸多不足:(1)ECG检测需在皮肤涂抹刺激性的耦合剂并附加电极,不宜长期监测且ECG设备价格昂贵;(2)PPG和RPPG测量时存在环境光学噪声,以及肤色不同形成的个体差异性较大;(3)ECG和PPG检测属于接触式,容易带给患者不适感。基于以上不足,提出了一种基于心冲击图(Ballistocardiogram,BCG)的HRV分析方法,该方法降低了传统设备用于HRV分析的成本,利用非接触检测减轻了患者不适感,独特的检测原理避免了个体差异性问题,在长期心血管疾病检测中起着至关重要的作用。实验中采用逆传播(Back propagation,BP)神经网络模型对心率异常进行预测分类,准确率达到80%,表明了该方法的先进性和可靠性。
2021, 36(3):577-586. DOI: 10.16337/j.1004-9037.2021.03.015
摘要:针对现代电子战电磁环境复杂,复合干扰信号有效特征难提取,识别难度大的问题,提出了一种基于伪平滑魏格纳-威利分布(Smoothed pseudo Wigner-Ville distribution,SPWVD)和改进AlexNet的复合干扰识别算法。该算法利用SPWVD对复合干扰信号进行时频分析,再利用图像处理技术对时频特征进行降维,最后结合改进的AlexNet模型,采用多个小的卷积核替代大的卷积核,删除全连接层7和局部响应归一化模块等手段,来减小网络参数从而加快计算速度,完成复合干扰信号的识别。仿真结果表明,在干(信)噪比为0 dB时,目标信号和6种复合干扰信号的识别率均在90%以上。与AlexNet模型相比,改进后的网络在识别准确率上有明显提高。
2021, 36(3):587-594. DOI: 10.16337/j.1004-9037.2021.03.016
摘要:针对文本聚类问题中因为维度灾难以及特征信息丢失而导致的聚类效果低效问题,本文提出一种基于特征矩阵优化与改进主成分分析(Principal component analysis, PCA)降维的聚类算法。在原基于文档频率和逆词频(Term frequency inverse document frequency, TF-IDF)算法的基础上提出ALFW(Adaptive length frequency weight)权重优化方案,使得特征矩阵的分布性更好,特征项的表征更加明显。在降维处理上,采用信息论中的联合熵标准对PCA算法进行了优化,提出UE-PCA(United entropy-PCA)算法对稀疏高维数据进一步降维,更好地保留了原高维数据的真实性。仿真实验表明,本文提出的算法(K-means+UE-PCA+ALFW)对比其他同类型算法取得了更好的表现效果。
2021, 36(3):595-604. DOI: 10.16337/j.1004-9037.2021.03.017
摘要:针对加密流量难以识别的问题,提出一种利用神经网络提取通信双方建链信息以识别加密流量的方法。该方法首先获取加密连接建立阶段的交互流量,将流量数据转化为灰度图,然后利用卷积神经网络提取其图像特征,进而提取加密数据流的类别特征。由于在建链阶段就可提取类别信息,所以该方法具有早期识别特性,这能使加密流量的识别与管控实现有机结合。另外,针对背景流量属性集无限大、训练数据不完备的问题,提出将随机数据加入到背景流量中进行数据增强的近似完备法。在真实环境中进行测试,结果显示该方法的准确率达到95.4%,识别耗时为0.1 ms,明显优于对照算法。
杨卫哲,秦永彬,黄瑞章,王凯,程华龄,唐瑞雪,程欣宇,陈艳平
2021, 36(3):605-620. DOI: 10.16337/j.1004-9037.2021.03.018
摘要:在关系抽取中,神经网络模型是目前最常用的技术之一,然而现有神经网络模型很少考虑句子中两个实体之间的结构特征。该文针对关系抽取任务的特点,提出了基于神经网络模型的句子结构获取方法。该方法通过对关系实例中两个实体的位置进行特殊标记,使神经网络模型能够有效捕获句子中关于实体的结构信息。为了验证方法的有效性,分别采用两种主流的神经网络模型进行对比实验,实验结果表明,该方法在ACE 2005中文关系抽取数据集上的抽取性能得到显著提升,超出对比工作约11个百分点,表明该方法能有效提升关系抽取任务的性能。
2021, 36(3):621-628. DOI: 10.16337/j.1004-9037.2021.03.019
摘要:“低、慢、小”飞行器的监控是低空空域开放的一个技术难题,制约通航的发展速度。本文针对“低、慢、小”航空器运行特点,设计一种低成本、小体积和低功耗的导航通信设备,该设备集成了GPS、北斗、伽利略导航源以及北斗短报文通信功能,利用民航的ADS-B通信数据链及北斗短报文接收系统,不仅将“低、慢、小”飞行器纳入了民航的通信导航监视/空中交通管理(Communication navigation surveillance/air traffic management,CNS/ATM)监管体系,规避了在融合空域内与运输机的运行风险,还解决了ADS-B数据链在障碍物遮挡、超视距等情况下无线信号丢失的问题。同时采用航迹外推、误差修正等技术,确保飞行器航迹连续性以及位置精度的准确性。并通过轿车及通航飞机搭载该设备进行飞行比对验证,功能及性能都优于现有的ADS-B机载通信导航设备,为实现低空空域飞行器“看得见、能识别、能处置”的目标提供一种技术解决方法。
您是本站第 访问者
通信地址:南京市御道街29号 南京航空航天大学(明故宫校区)
邮编:210016 传真:025-84892742
电话:025-84892742 E-mail:sjcj@nuaa.edu.cn
技术支持:北京勤云科技发展有限公司
网站版权: © 《数据采集与处理》 编辑部