摘要
针对相控阵雷达多目标跟踪下的威胁度等级不同,以目标位置估计的贝叶斯克拉美罗下界(Bayesian Cramer‑Rao lower bound,BCRLB)为分配准则,本文建立了一种基于威胁度的多目标跟踪时间资源分配优化模型,该模型以威胁度为基准将待跟踪目标分为两类,不同类别采用不同的时间资源分配方法。由于该模型及优化算法运行耗时巨大,该文还提出了一种基于反向传播(Back propagation,BP)神经网络的多目标跟踪时间资源拟合方法。计算机仿真表明,该模型及方法可以使各目标跟踪维持最佳状态,同时BP神经网络耗时降低2 000多倍。
关键词
相控阵雷达因其特有的电子转向阵列天线,具有灵活的波束调转能力,并可以根据任务要求快速调整波束指向和停留时间,此功能使得相控阵雷达能够快速自适应的定位目标并调整停留时
到目前为止,在目标跟踪中已经有一些雷达资源最优分配方面的优秀研究。对于限定系统性能条件下最小化雷达资源使用量的研究,文献[
随着机器学习不断地发展完善,相关的理论和研究成果不断涌现。目前还没有运用机器学习做雷达资源管理的相关研究,而与机器学习相结合的目标跟踪研究已初见成效。文献[
本文基于上述研究工作,将相控阵雷达多目标跟踪环境中的所有目标按照一定的威胁度分为有威胁和无威胁两类,针对不同类别的目标选择不同的资源分配方式。对于能对我方产生威胁的目标,例如不断向我方逼近的目标,该类目标要以高跟踪精度为目的对其进行资源分配;而为对我方没有威胁的目标,例如己方目标或不断远离我方的目标,只需满足一定的跟踪精度来维持航迹,以节省跟踪时间为目的对其进行资源分配。在此基础上,以目标位置估计的贝叶斯克拉美罗下界(Bayesian Cramer‑Rao lower bound,BCRLB)作为分配准则,建立了多目标跟踪资源分配模型,并采用遗传算法对其求解。针对模型的非线性性质导致求解过程消耗大量时间的问题,进一步提出采用反向传播(Back propagation,BP)神经网络算法来代替求解过程,将前面复杂的求解过程转换成了网络模型拟合问题。仿真结果证明了本文方法在保证了所有目标的跟踪维持在最佳状态的同时,极大地缩短了计算所消耗的时间。
假设雷达的发射功率为,根据雷达方程,可得到接收的回波功率为
(1) |
式中,为雷达发射与接收天线增益,为雷达所用波长,为目标的雷达散射截面积(Radad cross section,RCS),为目标与雷达间距离。设在第个目标在第个采样间隔中波位驻留在目标上的时间为,发射信号的脉冲重复周期为,则相参积累的脉冲数为。由此得到脉冲回波信噪比为
(2) |
式中,为玻尔兹曼常数,为发射信号的带宽,为雷达接收机噪声系数,为标准室温。可以看出,除了驻留时间,其他参数都是已知的确定值,回波信噪比是以驻留时间为唯一变量的函数。
为了证明本文方法同样适用于机动目标的跟踪,所以将匀速直线运动CV,圆周运动CT,匀加速运动CA,作为目标的运动方式。它们具有相同的状态转移方
(3) |
式中:为目标在第个采样间隔时的状态向量,为状态转移矩阵,为过程噪声,其是均值为零,协方差为的高斯白噪声。不同的运动模型下的状态向量、状态转移矩阵和过程噪声是不同的,以下给出它们的表达式。
在本文中,测量目标的距离和方位角,假设雷达在第个采样间隔照射第个目标,则目标的量测方程可以表示为
(7) |
式中
(8) |
式中:和为目标相对于雷达的距离和方位角,为雷达所在位置。
(9) |
式中: 和分别为目标距离和方位角估计均方差的克拉美罗
(10) |
式中:为光速,和分别为回波信号的带宽和波长,为天线孔径,由
BCRLB包含了目标运动状态和驻留时间等一系列变量,同时为这些变量参数估计的均方误差(Mean square error,MSE)提供了一个下限,所以本文将它作为评估目标跟踪精度的标准。假设目标估计的状态为,它是量测方程的函数,则目标状态估计的MSE可表示为
(11) |
式中 为目标状态的贝叶斯信息矩阵(Bayesian information matrix, BIM),它可以表示
(12) |
式中为目标先验Fisher信息矩阵(Fisher information matrix, FIM),它取决于目标的状态,可表示为
(13) |
表示数据的FIM,其表达式为
(14) |
式中表示量测方程的雅克比矩阵,表示通过状态转移方程进行的状态估计。
(15) |
BCRLB不仅为离散时间系统的无偏估计提供了MSE的下界,而且还常用于判断估计的有效性,因此可以将它作为衡量目标跟踪有效性以及时间分配的指标,本文以目标距离估计的BCRLB作为时间分配的标准,计算得到
(22) |
式中表示目标距离估计的BCRLB,目标状态估计的BCRLB矩阵表达式为
(23) |
对于多目标的跟踪,以同一个标准来对所有的目标进行资源分配是不合理的。如不断远离雷达的目标,这类目标对我方没有威胁,对其进行长时间照射获取高精度的跟踪没有意义,浪费雷达的资源。为了有效地控制环境和所跟踪的目标,将需要跟踪的目标以威胁度为标准划分为两类,其中可由目标的速度与距离共同决定。目标与雷达距离越近,相对雷达径向速度越大,其威胁度越大,反之威胁度就越小。因此定义临界距离与临界径向速度。目标威胁度可通过得到。其中表达式为
(24) |
这一类的目标视为无威胁目标,对其进行维持跟踪;这一类的目标视为有威胁目标,对其进行精跟踪。该算法的目的是使所有目标的跟踪维持在最佳状态,此问题的模型可以表示为
(25) |
式中为采样间隔中用于跟踪的总时间,为所跟踪目标的总数,为无威胁目标的个数,为有威胁目标的个数,设定为区分目标是否具有威胁的临界值,为所设定的跟踪误差阈值。针对上述模型中为两个目标函数求解问题,本文提出了一种基于威胁度的多目标跟踪驻留时间最优分配算法。通过该算法可以求出每个目标的驻留时间。这样可以在每个跟踪周期开始之前获得下一个跟踪周期中各个目标所需的驻留时间。根据所分配的时间采用扩展卡尔曼滤波(Extended Kalman filter, EKF)来估计各个目标的状态。该两步优化算法具体步骤如下。
(1)根据所有目标在第个采样周期的状态,求出每个目标威胁度,以为界限将所有目标分为两类。不同类别的目标采用不同的标准来进行资源分配。
(2)首先对无威胁目标进行驻留时间分配,根据得到目标状态的一步预测,由这个预测状态可以得出回波信噪比,将其中的驻留时间用代替。通过式(
(3)令,计算出,如果,令,反之则;
(4)对无威胁目标所分配的驻留时间求和得,令作为有威胁目标驻留时间的总和。再通过步骤(2)中的计算过程,可以得到。
(5)经过以上步骤可将原模型转化为
(6)利用遗传算法求解出,保存,与各个目标状态相对应。
BP神经网络是一种性能优异的机器学习算法,它不仅在分类问题中有较好的应用,而且对于连续值的回归预测也有着良好的稳定性。因为可以通过各个目标的状态计算得到对应的驻留时间,因此可以把每一个采样间隔中的所有目标状态作为特征,对应的驻留时间作为输出,得到组训练数据的形式为
(26) |
式中:表示网络的输入,为第个目标的状态,为训练样本的输出值,为第个目标的驻留时间。以上述数据样本构建神经网络进行训练,其网络结构如
(27) |
(28) |
式中为激活函数。根据前向传播所计算的输出值,将其与对应样本的输出值作对比计算代价函数,使用梯度下降法并结合反向传播算法调整所有层的参数,以最小化代价函数,直到调整后的参数满足训练目标精度或者达到训练次数。其整体的代价函数为
(29) |
通过上述过程即可得出神经网络通过训练数据学习出的模型,具体流程如

图1 BP神经网络结构
Fig.1 BP neural network structure

图2 BP神经网络拟合流程图
Fig.2 BP neural network fitting flowchart
为了验证所提算法的有效性,本节设计了两个对比试验:(1)雷达在相同背景下经过时间资源优化分配与平均分配,对比分析两种分配模式下的雷达跟踪性能与驻留时间分配结果;(2)分别通过时间资源优化分配算法与BP神经网络算法,比较两种方法所得到的时间分配结果以及计算所耗时间。
在实验场景中,假设相控阵雷达位于坐标原点,且分时对各目标进行跟踪,本次仿真设置所跟踪的目标数为,每个目标的运动方式都不一样,他们的初始状态如
(30) |
式中为蒙特卡洛模拟次数,本次仿真取,为目标的实际位置,为在第次蒙特卡洛模拟中获得的目标估计位置。目标的真实轨迹与预测轨迹如

图3 目标的真实轨迹与预测轨迹
Fig.3 Real trajectory and predicted trajectory of target
取多组不同的目标初始状态,得到多个不同的运动轨迹,每条轨迹以30个采样间隔为一段滑窗来取3段数据,从而得到以各个目标的状态为输入,对应目标优化后的驻留时间为输出的数据集,数据量为2万,将得到的数据代入BP神经网络中训练,得到相应的网络模型。考虑到所选数据量有限,为了避免过拟合,网络层数为3,隐藏层神经元个数定为10,训练次数设为300次,训练目标精度为。
为了证明本文提出时间资源分配方法的有效性,将平均分配时间资源方案用作比较试验,即波束在每一个目标上驻留时间。
由

图4 优化方案下各目标的BCRLB和RMSE
Fig.4 BCRLB and RMSE of the each target under optimization scheme
为了说明本文所提算法相较于平均分配方案的优势,

图5 优化方案和平均分配方案各个目标BCRLB
Fig.5 BCRLB for each objective of the optimization plan and the average allocation plan

图6 基于BCRLB的时间分配优化结果
Fig.6 Time allocation optimization results based on BCRLB

图7 基于MI的时间分配优化结果
Fig.7 Time allocation optimization results based on MI
取5组数据集以外的目标状态分别代入本文优化算法以及神经网络模型中,所得的驻留时间分配结果如

图8 两种方法所得各个目标驻留时间
Fig.8 Dwell time of each target obtained by the two methods
统计本文优化算法和BP神经网络算法计算所消耗的时间,结果如
本文提出了基于BP神经网络算法的相控阵雷达多目标跟踪时间资源分配方案。首先根据目标运动状态,以目标威胁度为标准对目标类型进行划分。其次推导具有时间变量的目标距离估计BCRLB,将其作为分配准则,根据目标的威胁度来选择合适的跟踪方式。最后利用BP神经网络算法代替优化过程,快速拟合出各个目标分配的驻留时间。仿真结果表明,本文所提方案可以根据目标是否具有威胁动态地分配时间资源,同时极大地缩短了计算过程所消耗的时间,证明了该方案的有效性。
参考文献
Moo P W, Ding Z, Coordinated radar resource management for networked phased array radars[J]. IET Radar, Sonar & Navigation, 2015, 9(8): 1009-1020. [百度学术]
秦童,戴奉周,刘宏伟.单波束相控阵雷达的时间资源联合分配算法[J].西安电子科技大学学报,2016,43(5):1-5. [百度学术]
Qin Tong, Dai Fengzhou, Liu Hongwei. Joint time resource allocation algorithm for single beam phased array radar [J]. Journal of Xidian University, 2016, 43 (5): 1-5. [百度学术]
王祥丽,易伟,孔令讲.基于多目标跟踪的相控阵雷达波束和驻留时间联合分配方法[J]. 雷达学报, 2017,6(6):602-610. [百度学术]
Wang Xiangli, Yi Wei, Kong Lingjiang. Jointly assigned phased array radar beam and dwell time based on multi-target tracking [J]. Journal of Radar, 2017, 6 (6): 602-610. [百度学术]
McIntyre G A, Hintz K J. Sensor measurement scheduling: An enhanced dynamic, preemptive algorithm[J]. Optical Engineering, 1998,37: 517-523. [百度学术]
刘先省,周林,杜晓玉.基于目标权重和信息增量的传感器管理方法[J]. 电子学报,2005, 33: 1683-1687. [百度学术]
Liu Xiansheng, Zhou Lin, Du Xiaoyu. Sensor management method based on target weight and information increment[J]. Chinese Journal of Electronics, 2005, 33: 1683-1687. [百度学术]
刘先省,申石磊,潘泉.基于信息熵的一种传感器管理算法[J].电子学报,2000, 28(9):39-41,22. [百度学术]
Liu Xiansheng, Shen Shilei, Pan Quan. A sensor management algorithm based on information entropy[J]. Chinese Journal of Electronics, 2000, 28(9): 39-41, 22. [百度学术]
卢建斌,胡卫东,郁文贤.基于协方差控制的相控阵雷达资源管理算法[J]. 电子学报,2007,35(3): 402-408. [百度学术]
Lu Jianbin, Hu Weidong, Yu Wenxian. Phased array radar resource management algorithm based on covariance control[J]. Chinese Journal of Electronics, 2007, 35(3);402-408. [百度学术]
毛依娜.相控阵雷达在跟踪模式下的资源管理及任务调度研究[D].西安:西安电子科技大学,2011. [百度学术]
Mao Yina. Research on resource management and task scheduling of phased array radar in tracking mode [D]. Xi'an: Xidian University, 2011. [百度学术]
党庆一.机器学习算法的船舶路径跟踪误差估计[J].舰船科学技术,2018,40(24):28-30. [百度学术]
Dang Qingyi. Ship path tracking error estimation based on machine learning algorithm[J]. Ship Science and Technology, 2018, 40 (24): 28-30. [百度学术]
叶锴,祝怡翔.一种基于机器学习的雷达目标跟踪算法[J].信息技术,2019, 43(10):158-160,164. [百度学术]
Ye Yi, Zhu Yixiang. A radar target tracking algorithm based on machine learning [J]. Information Technology, 2019, 43(10): 158-160, 164. [百度学术]
Ristic B, Arulampalam S, Gordon N, Beyond the Kalman filter particle filters for tracking applications[M]. Norwell, USA: Artech House, 2004. [百度学术]
Sun H L, Xu H F, Wang Y. Asymptotic analysis of sample average approximation for stochastic optimization problems with joint chance constraints via conditional value at risk and difference of convex functions[J].Journal of Optimization Theory and Applications,2014,161(1):257-284. [百度学术]
Tichavsky P, Muravchik C H, Nehorai A. Posterior Cramér-Rao bounds for discrete-time nonlinear filtering[J].IEEE Transactions on Signal Processing, 1998, 46(5):1386‑1396. [百度学术]