• 2025年第40卷第6期文章目次
    全 选
    显示方式: |
    • “面向6G移动通信的收发理论基础”专栏序言

      2025, 40(6):1381-1381. DOI: 10.16337/j.1004-9037.2025.06.001

      摘要 (5) HTML (4) PDF 305.35 K (3) 评论 (0) 收藏

      摘要:

      • 0+1
      • 1+1
    • 基于深度学习的阵列天线自适应波束形成研究综述

      2025, 40(6):1382-1411. DOI: 10.16337/j.1004-9037.2025.06.002

      摘要 (3) HTML (4) PDF 1.26 M (4) 评论 (0) 收藏

      摘要:随着阵列天线规模不断增加、抗干扰场景日益复杂,传统的自适应波束形成方法往往计算量大,深度学习凭借其强大的数据驱动能力,为突破传统自适应波束形成的性能瓶颈提供了新思路。本文系统综述了深度学习在阵列天线波束形成领域的研究现状和发展趋势。首先,回顾了从Howells-Applebaum自适应处理器到基于凸优化的鲁棒波束形成等传统波束形成算法的发展历程。其次,详细分析了卷积神经网络(Convolutional neural network, CNN)、循环神经网络(Recurrent neural network, RNN)、长短期记忆(Long short-term memory, LSTM)网络等深度学习模型在波束形成中的创新应用。研究表明,深度学习方法凭借其强大的非线性建模能力、端到端优化特性和环境适应性,在提升系统性能方面具有显著优势。特别地,在移动通信领域,基于深度学习的波束形成方法显著提升了大规模多输入多输出(Multiple input multiple output, MIMO)系统的计算效率和环境适应能力。在雷达信号处理中,深度学习模型有效增强了抗干扰性能和目标检测精度。在声学信号处理方面,深度神经网络实现了更精确的声源定位和噪声抑制。最后,本文探讨了网络架构创新、实时处理优化、鲁棒性增强、跨场景迁移学习、理论基础深化和新型应用拓展等未来研究方向。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 基于OTFS的通感一体化感知目标参数估计新算法

      2025, 40(6):1412-1423. DOI: 10.16337/j.1004-9037.2025.06.003

      摘要 (2) HTML (5) PDF 1.84 M (3) 评论 (0) 收藏

      摘要:在太赫兹频段利用具有叠加导频的正交时频空间(Orthogonal time frequency space, OTFS)-通信感知一体化(Integrated sensing and communication, ISAC)车联网系统,能够实现车辆间的高速数据传输,同时进行高精度参数感知。首先,建立并分析了OTFS信号调制模型、通信信号模型和感知信号模型,并在接收端推导了包含角度信息的感知信道新模型。其次,提出了基于均匀网格的多重信号分类(Multiple signal classification,MUSIC)角度粗估计算法和黄金分割法的MUSIC角度细估计算法。最后,提出了基于最大似然估计准则的信道时延和多普勒频移整数部分参数估计和分数部分参数估计算法。仿真结果表明,所提出的算法能够实现精确的角度、距离和速度等感知参数估计。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
    • 非地面网络场景中基于全局超分去噪的信道估计

      2025, 40(6):1424-1433. DOI: 10.16337/j.1004-9037.2025.06.004

      摘要 (1) HTML (7) PDF 2.50 M (4) 评论 (0) 收藏

      摘要:在非地面网络(Non-terrestrial network, NTN)场景中,为克服大多普勒频偏对通信的影响,提出一种基于全局信息提取超分辨率和去噪的神经网络(Global information super resolution denoising neural network, GSRDnNet)。此方法将最小二乘估计(Least square, LS)算法得到的导频处信道估计矩阵视为低分辨率小尺寸图像,将其作为神经网络的输入,输入数据经过GSRDnNet网络处理之后将得到更为精确的高分辨率图像,即时频资源块完整的信道响应矩阵。采用4种NTN-抽头延迟线(Tapped delay line, TDL)A,B,C,D信道模型进行仿真验证,仿真结果表明GSRDnNet相比于传统LS算法,均方误差(Mean squared error, MSE)提升3.37~8.83 dB,相比于实际信道估计(Practical channel estimation, PCE)算法,MSE提升2.11~6.06 dB,相比于需要预插值处理的超分辨率卷积神经网络(Super resolution convolutional neural network, SRCNN)+去噪卷积神经网络(Denoising convolutional neural network, DnCNN)方法,MSE性能提升1.37~4.40 dB。且较SRCNN+DnCNN ,GSRDnNet网络模型的输入仅考虑导频处的信道估计矩阵,因此不仅拥有更高的估计精度,计算复杂度也降低了约84%。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
    • 基于频谱效率公平性的XL-MIMO系统预编码优化

      2025, 40(6):1434-1444. DOI: 10.16337/j.1004-9037.2025.06.005

      摘要 (3) HTML (4) PDF 1.67 M (3) 评论 (0) 收藏

      摘要:本文研究了在近场信道模型下基于频谱效率公平性的超大规模多输入多输出(Extremely large-scale multiple-input-multiple-output,XL-MIMO)下行系统的预编码优化问题。考虑在该近场信道模型,即小区内同时存在视距(Line-of-sight,LOS)和非视距(Non LOS,NLOS)的非平稳混合信道,其中LOS信道采用球面波模型,而NLOS信道则采用瑞利模型。以频谱效率的几何平均值作为优化目标,从而确保用户间的公平性并优化系统整体的频谱效率。为了处理复杂的优化目标函数,首先对其采用泰勒展开的一阶近似作为新的目标函数。接着,使用拉格朗日对偶变换和二次变换将原始优化问题转化为更容易求解的等价问题。最后,为了降低计算复杂度,采用了快速迭代收缩阈值算法与投影梯度下降算法结合的投影快速迭代收缩阈值算法(Projection fast iterative shrinkage threshold algorithm,PFISTA)来解决等效优化问题。仿真结果显示,以几何平均值作为目标函数能够降低用户频谱效率之间的差异,实现用户频谱效率的均衡提升。此外,PFISTA在获得与现有方法相当性能的同时,具有较低的计算复杂度。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
    • 面向通感一体化的跳频线性调频信号设计与检测方法

      2025, 40(6):1445-1463. DOI: 10.16337/j.1004-9037.2025.06.006

      摘要 (2) HTML (5) PDF 3.26 M (5) 评论 (0) 收藏

      摘要:针对以感知波形为基础的信号在通感一体化(Integrated sensing and communication, ISAC)系统中面临通信速率低、易被截获等问题,本文设计了一种基于正交相移键控(Quadrature phase shift keying, QPSK)与线性调频信号(Linear frequency modulation, LFM)的多路跳频传输架构。该架构利用多个LFM信号同时在重叠的频谱区间传输以提高符号速率,并通过LFM子载波的跳频特性实现加密通信。此外,通过结合动态前导码与数据的时分复用机制,该方案有效地提升了多路LFM信号的路径索引和参数估计精度。针对符号解调,本文提出两种基于非相干离散啁啾傅里叶变换(Noncoherent discrete chirp Fourier transform, NC-DCFT)的多峰值检测算法。仿真结果表明,在相同符号速率约束下,本文所提出的多路并行架构在误码率方面优于传统单路方案,当信噪比为0 dB时,4路并行架构的误码率相较于单路方案降低了一个数量级。同时,动态前导码方案满足不同场景下的路径索引识别需求,在信噪比为0 dB时,归一化均方差均低于10-2。此外,面向功率均衡、功率差异显著及载波参数保护间隔较小3种复杂场景设计的符号检测算法,在其适配场景下均可实现误码率低于10-2。最后,跳频机制显著增强了系统的抗截获能力,即使50%参数泄露,第3方对信号的恢复概率(Probability of accurate recovery, PAR)仍被压制在7%以下,验证了该方案的鲁棒性与应用价值。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
      • 16+1
      • 17+1
      • 18+1
      • 19+1
      • 20+1
    • 多无人机强弱信号混叠下的检测与识别方法

      2025, 40(6):1464-1476. DOI: 10.16337/j.1004-9037.2025.06.007

      摘要 (3) HTML (5) PDF 2.41 M (6) 评论 (0) 收藏

      摘要:由于不同无人机(Unmanned aerial vehicle, UAV)的距离差异,混叠信号往往具有不同的信噪比,且低空环境下存在各类干扰信号,进一步增加了识别的难度。针对上述问题,本文提出了多无人机混叠信号下的联合检测-分离-识别方案,该方案通过信号检测、信号分离和信号识别3个步骤,有效提升了不同信噪比混叠信号的检测与识别性能。首先,采用YOLO检测器在时频图上定位潜在无人机信号,在此基础上,提出了一种基于随机偏差的数据增强方法,以降低信号分离过程中的偏差。接着,利用YOLO分类器提取信号的带宽与持续时间特征,完成不同无人机信号的分类。最后,为进一步提高同型号无人机信号识别的精度,提出了加入注意力机制的ResNet模型和优化的Bagging集成学习方法。基于公开数据集的实验结果表明,所提方案在干扰信号与同型号无人机共存场景下的识别性能优于已有方案。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
    • 基于指针网络深度强化学习NOMA用户配对和功率分配方案

      2025, 40(6):1477-1489. DOI: 10.16337/j.1004-9037.2025.06.008

      摘要 (1) HTML (4) PDF 2.35 M (2) 评论 (0) 收藏

      摘要:为了解决非正交多址接入(Non-orthogonal multiple access, NOMA)在不完美串行干扰消除(Serial interference cancellation, SIC)条件下的快速配对和功率分配问题,提出一种基于深度强化学习的NOMA用户配对和功率优化方案。首先,考虑多用户NOMA不完美SIC的场景,以用户配对和用户发射功率分配因子为优化变量构建最大化系统可达通信速率的优化问题。分析了不完美SIC条件下用户使用NOMA配对的条件,并推出该条件下最大可达速率的用户功率分配。其次,将用户配对问题当作组合优化的问题,基于实时性的要求使用改进的指针网络设计了一种新型用户配对方案。仿真结果表明,该方案能够有效提升NOMA系统的可达速率,达到了最优的穷搜算法的99.8%,并具有实时性和适应用户数量动态变化的优势。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
    • 一种MS-TMA卫星安全通信策略与其性能分析

      2025, 40(6):1490-1504. DOI: 10.16337/j.1004-9037.2025.06.009

      摘要 (3) HTML (2) PDF 3.75 M (3) 评论 (0) 收藏

      摘要:随着5G、6G通信的发展,能够提供全球无缝覆盖能力的卫星通信成为了不可或缺的重要角色。而鉴于卫星通信开放的信道特性,卫星通信的安全性受到越来越多的重视,尤其是国防和军事通信对卫星安全通信的需求更加强烈。文中基于多星与终端多天线(Multi-satellite and terminal multi-antenna, MS-TMA)收发的卫星通信系统的架构,从隐蔽安全通信的理论出发,提出了一种卫星安全通信策略,并对其安全通信性能进行了理论分析与仿真,研究成果对卫星安全通信理论的推进和应用发展具有重要的参考价值。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
      • 15+1
      • 16+1
      • 17+1
      • 18+1
      • 19+1
      • 20+1
      • 21+1
      • 22+1
      • 23+1
      • 24+1
      • 25+1
      • 26+1
    • 基于二维激光雷达和多视角相机数据级融合的3D-RGB点云成像

      2025, 40(6):1505-1517. DOI: 10.16337/j.1004-9037.2025.06.010

      摘要 (1) HTML (2) PDF 3.39 M (5) 评论 (0) 收藏

      摘要:当前,基于激光和视觉的三维重建技术在地形场景的测量中具有广泛的应用。尽管目前已经开发出多种基于激光雷达和相机的三维成像方法,但各自存在一定的局限性。具体而言,RGB-D相机虽然能够同时捕获颜色和深度信息,但其精度往往低于LiDAR,而3D激光雷达虽然能够提供高精度的空间信息,却缺乏颜色信息,且其成本通常较高。本文提出了一种基于二维激光雷达与多视角相机数据级融合的3D-RGB成像方法,采用二维激光雷达与4组不同视角相机得到了3D-RGB点云数据,通过3D-RGB点增强、特征平面检测提取与全局一致对齐技术实现准确、稠密的3D-RGB成像。首先,通过RGB与点云信息融合提升数据质量,并利用特征平面检测优化几何结构表达。随后,结合全局一致对齐策略,降低累积误差,提高整体成像精度。实验结果表明,该方法相比多线激光雷达方案在成像密度和精度上具有优势,整体误差小于0.15 m,验证了其在复杂环境下的三维重建与环境勘测应用潜力。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
    • 基于卷积神经网络的多雷达协同抗欺骗式干扰方法

      2025, 40(6):1518-1526. DOI: 10.16337/j.1004-9037.2025.06.011

      摘要 (0) HTML (3) PDF 1.73 M (1) 评论 (0) 收藏

      摘要:现有多站融合技术聚焦于利用回波的幅度相关性和空间定位等直观特征,同时人工特征提取的全面性不足,易导致信号资源的浪费、特征提取不全和判别算法不够通用等问题。为解决这些问题,创新性地提出了一种融合多雷达协同检测与卷积神经网络的干扰识别策略,利用卷积神经网络深入挖掘回波数据中的未知信息,提取真假目标在多维深层特征上的差异,超越单一的空间相关性差异,实现欺骗干扰判别。最后,仿真实验验证了提出方法抗欺骗干扰的可行性,并分析了目标尺寸、多站雷达布站和相位误差对所提算法的影响。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
    • 基于TCN的USRP调制信号识别算法

      2025, 40(6):1527-1537. DOI: 10.16337/j.1004-9037.2025.06.012

      摘要 (2) HTML (2) PDF 2.79 M (3) 评论 (0) 收藏

      摘要:针对自动调制识别(Automatic modulation recognition,AMR)中未充分利用原始信号时序信息、识别率低的问题,提出基于频域降噪和时序卷积网络(Temporal convolutional network,TCN)的信号模式识别算法。实验使用标准数据集RML2016.10a,引入频域去噪模块(Frequency domain denoising module,FDDM)有效抑制环境噪声,将信号的I/Q分量转换为A/P分量,并进行向量归一化处理提升稳定性。最后,将预处理后的信号输入TCN网络进行分类识别。结果表明,该算法在处理复杂调制方式时(如16 QAM和64 QAM),平均识别率高于循环门控单元(Gated recurrent unit,GRU)、长短期记忆网络(Long short-term memory,LSTM)、经济高效的卷积神经网络(Memory-cost-efficient convolutional neural network,MCNet)、经济高效的混合神经网络(Cost-efficient hybrid deep learning network,CGDNet)和去噪自动编码器(Denoising auto-encoder,DAE)等模型。此外,通过通用软件无线电外设(Universal software radio peripheral,USRP)采集的实际I/Q数据验证,该算法在加性高斯白噪声(Additive white Gaussian noise,AWGN)信道下表现出良好的鲁棒性和应用潜力。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
    • 基于时频特征融合的伪造语音检测算法

      2025, 40(6):1538-1555. DOI: 10.16337/j.1004-9037.2025.06.013

      摘要 (1) HTML (3) PDF 3.11 M (2) 评论 (0) 收藏

      摘要:针对伪造语音检测精度不高和泛化性弱的难题,提出一种基于时频特征融合的伪造语音检测算法。首先,为了挖掘语音片段能量分布不均、基频波动异常,以及提取语义连贯性的细微差别,提出一种多分支特征融合网络,分别从音高、音强以及能量分布来挖掘真假语音的差异痕迹,以更好地表征真假语音的频率变化、振幅变化和峰值差异,提高伪造语音检测的准确率。其次,经典的坐标注意力机制未能对语音时频域的细粒度差异进行有效挖掘,为此提出一种时频坐标注意力机制,分别从时域和频域两个方向对能量分布和基频波动异常进行联合编码,以更好地表征频谱图中的共性高频能量异常,提升模型的泛化性。最后,设计了一种自适应联合损失优化函数,通过平衡不同分支网络的权重,进一步提升模型对伪造语音中高频能量异常及语义不连贯性的学习能力。在ASVspoof 2019逻辑访问数据集上进行了性能评估,实验结果表明,与现有的工作相比,所提方法在等错误率(Equal error rate, EER)和最小归一化串联检测代价函数(Minimum normalized tandem detection cost function, min t-DCF)两个指标上均取得较好性能,分别降低了0.34%和0.014。此外,在应对极难检测的未知攻击A17时,同样展现出较高的泛化性,其中EER和min t-DCF分别下降了3.952 2%和0.136 4。当应对未知类型的欺骗攻击时, 同样表现出较好的泛化性。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
    • 一种基于特征融合的声音事件检测方法

      2025, 40(6):1556-1567. DOI: 10.16337/j.1004-9037.2025.06.014

      摘要 (2) HTML (3) PDF 1.56 M (2) 评论 (0) 收藏

      摘要:现有的基于深度学习的声音事件检测方法多使用传统的二维卷积,然而其平移不变性的特点并不适用于声音信号,这使得模型难以检测复杂的声音事件。针对上述问题,本文提出一种基于特征融合的混合卷积神经网络模型,通过计算频谱图的分布来自适应地生成卷积核,动态地提取与声音信号保持物理一致性的局部特征;同时并行地使用自注意力算法提取全局特征,捕获频谱图的长距离特征关联;为消除局部特征与全局特征的语义差异,将两种不同的特征表示有效结合,提出一种特征融合模块。为进一步提升模型对声音事件的检测性能,提出一种基于多尺度注意力机制的双向门控单元,对融合后的特征信息进行充分整合,突出事件帧并抑制背景帧。在DCASE2020数据集上的实验结果表明,本文方法的F1分数达到52.57%,优于现有的其他方法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
    • 基于改进自适应卡尔曼滤波的鸟鸣声降噪方法

      2025, 40(6):1568-1580. DOI: 10.16337/j.1004-9037.2025.06.015

      摘要 (1) HTML (3) PDF 3.05 M (1) 评论 (0) 收藏

      摘要:在海岛湿地等环境中,声学环境较为复杂,常伴有风声、雨声、海浪声等各种噪声。为了有效解决鸟鸣声处理中的这些干扰,提高鸟类物种识别的准确性,针对海岛湿地等复杂声环境下鸟鸣声实时在线监测中的噪声干扰问题,提出了一种基于自适应卡尔曼滤波-线性预测编码(Adaptive Kalman filtering with linear predictive coding, A-KF-LPC)的降噪方法。通过对鸟鸣声信号进行加权滤波,增强了A-KF-LPC滤波的稳定性,另外采用A-KF-LPC滤波对噪声进行抑制,并对声信号中不确定微小片段进行精确估计,逐步逼近真实情况。通过仿真,验证了A-KF-LPC滤波的性能,证明其能有效降噪。实验结果表明,在不同信噪比(Signal to noise ratio, SNR)条件下,相较于传统卡尔曼滤波、最小均方误差(Least mean squares, LMS)滤波,A-KF-LPC滤波的鸟鸣声信号降噪方法能更有效地去除噪声;在-10 dB噪声完全覆盖信号的条件下仍能滤除部分噪声。本研究提出的A-KF-LPC滤波在声学信号处理领域具有重要的应用意义,为鸟类湿地生态系统研究提供了一种高效可行的解决方案,并具有潜在的应用前景。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
    • 基于改进反向蒸馏网络的电子元器件表面缺陷检测

      2025, 40(6):1581-1595. DOI: 10.16337/j.1004-9037.2025.06.016

      摘要 (1) HTML (3) PDF 4.27 M (4) 评论 (0) 收藏

      摘要:针对电子元器件表面缺陷类型复杂、尺寸微小难检测问题,本文提出了一种基于改进反向蒸馏网络的电子元器件表面缺陷检测模型。首先模型采用无监督学习的方法,有效降低了对大量标注数据的依赖;其次,通过运用反向蒸馏网络架构,改变了传统蒸馏网络中教师模型单向指导学生模型的模式,提高了模型在表面缺陷检测任务中的适应性;然后在反向蒸馏网络模型的学生解码器中,引入了感受野注意力卷积模块,以增强模型对微小缺陷的检测能力;最后采用余弦相似度作为损失函数训练学生网络和瓶颈模块。本文采用自建的电子元器件表面缺陷检测数据集进行实验,结果显示本文模型显著提高了检测精度,在接受者操作特征曲线下面积(Area under the receiver operating characteristic curve,AUROC)图像级指数和像素级指数上分别达到了86.7%和89.1%,在每区域重叠率曲线下面积(Area under the per-region-overlap curve, AUPRO)像素级指数上达到了69.4%。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
    • 基于混合卷积增强和内容感知注意力的跨模态行人重识别

      2025, 40(6):1596-1607. DOI: 10.16337/j.1004-9037.2025.06.017

      摘要 (1) HTML (3) PDF 2.51 M (2) 评论 (0) 收藏

      摘要:跨模态行人重识别作为计算机视觉领域的研究热点,旨在解决不同成像条件下的行人匹配问题。现有研究着重于提取模态共享特征,但不能充分挖掘、鉴别行人身份至关重要的细节特征。为了解决该问题,提出了一种基于混合卷积增强和内容感知注意力(Hybrid convolutional enhancement and content-aware attention, HCECA)的跨模态行人重识别方法,旨在提取更富含细节信息的行人特征。首先,在主干网络中嵌入混合卷积增强(Hybrid convolutional enhancement, HCE)模块,捕获更丰富的跨模态特征表示,提高特征的区分度和鲁棒性。然后,通过内容感知注意力(Content-aware attention, CA)模块来挖掘丰富的细节信息,以提升行人特征的区分性。最后,在SYSU-MM01和RegDB数据集上进行了实验。提出的HCECA在SYSU-MM01数据集的全搜索模式下,Rank-1和平均精度均值(Mean average precision,mAP)分别达到72.21%和69.89%,在RegDB数据集上可见-红外模式下,Rank-1和mAP分别达到92.23%和85.08%,均优于现有的跨模态行人重识别方法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
    • 基于多尺度双分支双注意力的点云分类网络

      2025, 40(6):1608-1624. DOI: 10.16337/j.1004-9037.2025.06.018

      摘要 (3) HTML (2) PDF 3.42 M (2) 评论 (0) 收藏

      摘要:尽管Transformers在三维点云处理中已取得显著进展,但高效且准确地学习有价值的低频和高频信息仍然是一个挑战。此外,现有方法大多侧重于局部空间信息,忽略了全局空间的信息,从而导致信息的丢失。本文提出了一种新的点云学习网络,称为多尺度双分支双注意力网络。首先,在点云的提取过程中,与在固定的尺度上寻找邻近点的提取方法相比,利用多尺度K近邻(K-nearest neighbor,KNN)的方法不仅保留了局部结构细节,还更有效地捕获了全局几何信息。其次,本文引入了双分支双注意力架构提取不同空间特征,提出了局部窗口注意力与全局通道内容注意力双注意力机制,分别提取网络的低频信息与高频信息。在此基础上,本文在分类头中引入GR-KAN(Group-rational Kolmogorov-Arnold)层代替传统使用的多层感知器(Multilayer perceptron,MLP)层,其能够更灵活地处理非线性特征,使得网络对复杂的数据集更加敏感。最后,大量实验表明,本文提出的模型在ModelNet40数据集获得了93.8%的准确率,在ScanObjectNN数据集上获得了86.5%准确率,显示了其在三维点云处理中优越的性能和广阔的应用前景。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
      • 14+1
    • 基于局部通道编码的轻量化人体姿态估计算法

      2025, 40(6):1625-1636. DOI: 10.16337/j.1004-9037.2025.06.019

      摘要 (0) HTML (2) PDF 3.35 M (2) 评论 (0) 收藏

      摘要:针对当前姿态估计模型存在计算复杂度高以及参数量大的问题,本文提出一种轻量级姿态估计算法。首先,在特征提取过程中引入局部通道编码(Partial channel encoding, PCE)模块,结合卷积神经网络与视觉编码器的优势,分别提取图像的局部特征和全局特征;接着在多尺度特征融合过程中引入加权特征融合,增强模型的多尺度特征融合能力以避免模型轻量化带来的精度降低的问题;之后在回归预测的过程中将人体检测和分类部分共享检测头,提高模型在姿态估计任务中的识别效率;最后将CIoU损失函数更换为PIoU损失函数,让模型更注重对中高质量检测框的识别准确度。实验结果表明,本文提出的模型相比于基础模型,参数量下降27%,计算量下降18%,准确度提升0.2%,既保证了识别的准确度,又可以实现检测算法的轻量化,为实现实时准确的姿态估计提供了有效手段。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
    • 基于FACNNCN的高分遥感影像场景分类方法

      2025, 40(6):1637-1649. DOI: 10.16337/j.1004-9037.2025.06.020

      摘要 (4) HTML (2) PDF 5.81 M (4) 评论 (0) 收藏

      摘要:高分遥感影像场景分类旨在对复杂的地表场景影像进行精确认知,对于高分遥感影像的理解和信息提取具有重要的意义。本文提出了一种高分遥感影像场景方法,该方法基于特征聚合卷积神经网络(Feature aggregated convolution neural network, FACNN)和向量胶囊网络(Capsule network, CapsNet),即FACNNCN网络。通过增加聚合特征提升场景分类中影像特征的区分力和鲁棒性,并基于向量胶囊网络表征场景影像中地物与场景的空间关系,有效弥补了当前基于卷积神经网络的高分遥感影像场景分类方法中普遍存在的场景影像特征提取不充分、地物空间特征欠考虑的不足。本文提出的方法在2个公共高分遥感影像场景分类数据集(UC Merced Land-Use和NWPU-RESISC45)上进行了测试,实验结果表明该方法的分类精度优于相关的对比方法。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
      • 8+1
      • 9+1
      • 10+1
      • 11+1
      • 12+1
      • 13+1
    • 基于变步长多邻域搜索的异构车辆路由方法

      2025, 40(6):1650-1660. DOI: 10.16337/j.1004-9037.2025.06.021

      摘要 (4) HTML (4) PDF 1.24 M (2) 评论 (0) 收藏

      摘要:车辆路径规划问题是一类经典的、被证明为NP-hard的组合优化问题,其常被应用于交通物流与智能制造领域当中。然而,这类问题通常假设车辆具有同质性,难以刻画实际场景中车辆对不同商品种类运输能力的差异。为此,本文提出一种新的异构车辆路由问题(Heterogeneous vehicle routing problem,HVRP),通过引入商品种类属性与车辆运输能力约束,构建了描述车辆-订单匹配关系的整数规划模型,目标为最小化总运输距离。通过车辆类型对于商品种类的运输能力实现了车辆对客户可服务关系的形式化描述。为实现HVRP的高效求解,提出了变步长多邻域搜索(Variable step multi-neighborhood search,VSMNS)算法,并设计了路径编码与链表结合的解表示方法。最后,将 VSMNS 与遗传算法、混合遗传算法与人工蜂群算法在15个测试案例上进行对比实验。实验结果表明,VSMNS不仅在解质量上取得了优异的表现,且随问题规模的增大,算法性能优势更加显著。消融实验进一步验证了算法中的各个组件的作用,显示了所设计的局部算子的先进性。

      • 0+1
      • 1+1
      • 2+1
      • 3+1
      • 4+1
      • 5+1
      • 6+1
      • 7+1
快速检索
检索项
检索词
卷期检索