网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于DWT‑VMD混合信号分解技术的人体活动识别  PDF

  • 陈金瑶
  • 李瑞祥
  • 王星
  • 施伟斌
上海理工大学光电信息与计算机工程学院,上海 200093

中图分类号: TP391

最近更新:2024-06-13

DOI:10.16337/j.1004-9037.2024.03.020

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

在人类活动识别的应用环境中,从原始传感器数据中提取更加有效的特征仍具有挑战性。针对该问题,利用离散小波变换(Discrete wavelet transform, DWT)和变分模式分解(Variational mode decomposition,VMD)的混合信号分解技术提取原始信号中的显著特征向量。在UCI‑HAR数据集与SCUT‑NAA数据集上,利用多种机器学习分类算法,例如K近邻、随机森林、LightGBM和XGBoost,对DWT‑VMD混合信号分解算法的有效性进行了实验。实验结果表明,与未使用混合信号分解技术相比,使用该技术后识别准确率均有所提高,其中UCI‑HAR数据集分类准确率达到98.91%,与未加入分解算法相比提高了1.79%;SCUT‑NAA数据集分类准确率达到95.52%,提高了3.2%。在人体活动识别中,利用DWT‑VMD混合信号分解技术,能够提取原始信号中更有效的特征,提高识别准确率,具有一定的实用性。

引 言

检测、解释和识别人体在行走、跑步、就餐、躺下和坐下等不同活动过程中的动作,通常被称为人类活动识别(Human activity recognition, HAR)。人类活动识别是一个重要的研究领域,因为它是许多实际应用的基础需求,如医疗保

1、监控活2、情景感知计3、体育运4和智能家5等。

人类活动识别主要是基于传感器和基于计算机视觉系统进行研究的。由于传感器位置不固定,数据可能存在一定的误

6;而计算机视觉系统通常受到多种因素的影响,例如运动模糊、角度、路径上的障碍物,以及在复杂环境中变化的光照条7。在这两种方法中,传感器因其轻便、易于携带、可安装在不同位置、相对低能耗等优点而受到研究人员的青睐。基于传感器的活动识别通常通过融合不同的传感器原始数据和提取对机器学习方法至关重要的高质量特征来进5。然而无论采用何种融合方法,不相关或冗余的特征都不会有助于活动识别,甚至会降低其性能,同时还会增加计算成8。获得高质量的鲁棒特征集对于提高精度和降低计算成本非常重要,这在研9中已经得到认可。

信号处理技术,特别是分解方法,已被用于提高不同领域的精度,包括地球物

10、图像分11、热剖面分12和电能质量分13等。虽然HAR被认为是一个非线性和非平稳问14,但线性和非线性分析的方法都被使用15‑16。离散小波变换(Discrete wavelet transform, DWT)在线性系统中应用广泛,它能同时展示信号的频率和时间特性,相较于傅里叶变换更具有高分辨率的能17。另一方面,变分模式分解(Variational mode decomposition, VMD)适用于非线性和非平稳系统,能有效避免模式混叠问题,根据实际信号的频域特性进行自适应分18。然而,目前还没有发现关于VMD应用于人体活动识别的文献报导。传统的VMD方法只能对原始信号进行频域分解,分解后的每个变分模态函数(Variational mode function, VMF)的频率带宽定义是相同的,无法适应各种不同的人体活动信号。并且,传统单一的信号分解技术不能得到时间序列的全局特征。DWT‑VMD混合信号分解技术与单一的VMD和DWT方法相比,可以更加准确地提取人体活动信号中时域和频域信息,同时去除噪声和干扰。DWT‑VMD混合信号分解技术可以对原始信号分别进行小波变换和变分模态分解,通过小波变换得到的子带信号补充VMFs在频率带宽上的不足,使得分解之后的信号频带适应各种不同类型的人体活动信号。此外,DWT‑VMD混合信号分解技术通过对每一个原始信号进行分解,得到子带信号与VMF提取相应特征,最终将所有子带和VMF的特征向量组合成一个全局特征向量,以支持活动分类。因此,DWT‑VMD混合信号分解技术可以提高其可靠性、鲁棒性和准确性,从而更加精确地识别人体活动信号。

基于以上分析,本文提出了一种基于DWT‑VMD混合信号分解技术的人体活动识别模型。利用DWT和VMD技术分解来自传感器的原始信号,并提取分解信号的显著特征向量,将两个特征矩阵进行级联。分别利用K近邻(K‑nearest neighbor,KNN)、随机森林(Random forest, RF)、LightGBM和XGBoost这4种分类器模型进行训练,对多种人类活动进行分类。

本文主要贡献如下:(1) 提出了一种基于DWT‑VMD信号分解的人体活动识别方法,该方法能够从不同尺度和不同频带的信号中提取出不同的特征,从而更准确地反映不同活动对应的信号特征;(2) 通过多组实验验证了所提出方法在人体活动识别中的有效性和实用性;(3) 该研究成果为人体活动监测、健康管理和运动康复等领域提供了新的思路和方法,具有重要的学术价值和应用价值。此外,DWT和VMD作为信号处理领域中广泛应用的方法之一,本文的研究成果也进一步拓展了其在人体活动识别领域的应用。

1 基于DWT‑VMD的人体活动识别模型

1.1 人体活动识别基本流程

活动识别过程一般分为以下4个基本步骤:(1)在环境和受试者身体上部署合适的传感器,监测和收集用户的活动以及环境状态的变化;(2)使用数据分析算法收集、存储和整理所获得的信息;(3)设计活动识别模型,使用收集到的数据中的突出特征进行适当的训练;(4)从收集到的数据中实现推断用户活动。

1.2 数据采集与预处理

研究中使用了UCI‑HAR和SCUT‑NAA两个公开数据集,分别进行数据预处理。数据集的70%作为训练数据,30%用作测试数据。

1.2.1 UCI‑HAR数据集

UCI‑HAR数据集包括30位受试者,通过放置在其身上的传感器(三星Galaxy SII智能手机)收集活动数据。测量6种日常行为:站立、躺、坐、行走、下楼和上楼。在数据采集过程中,加速度计和陀螺仪组件分别采集加速度和角速度数据,结果数据包含10 299个实例,采样频率为50 Hz

19。采用2.56 s固定时间宽度、50%重叠的滑动窗口进行数据分割。

1.2.2 SCUT‑NAA数据集

SCUT‑NAA是一个基于三维加速度计的活动数据集,包含来自44名受试者(34名男性和10名女性)的1 278个样本,在自然环境下收集,采样设备包括加速度计ADXL330、微处理器ADuC7026、蓝牙收发模块、闪存数据存储模块和键盘模块。采样装置分别布置在受试者的腰带上、裤子口袋和衬衫口袋里。每个受试者被要求进行10项活动。因此,SCUT‑NAA是一个具有平衡类的三维加速数据集。每个记录的信号代表单个活动,采样频率固定在100 Hz

20。采用窗口大小为3 s以及50%重叠的滑动窗口进行数据分割。

1.3 算法基本框架

基于DWT‑VMD混合信号分解技术的人体活动识别框架如图1所示。首先对原始数据进行预处理,去除传感器噪声和异常值的影响。然后,利用DWT和VMD技术对预处理后的信号进行分解,为了有效地捕捉非平稳加速度计中的不连续性或奇异性,将离散小波变换分别应用于两个公开的数据集,并从子带中提取出显著的统计特征。同样,为了处理来自传感器的非平稳信号,将原始数据通过VMD技术分解为若干个VMF,以提取突出的时频域特征。最后利用DWT和VMD的混合判别特征训练分类器模型,识别用户活动。

图1  基于DWT‑VMD混合信号分解技术的人体活动识别框图

Fig.1  Block diagram of human activity recognition based on DWT‑VMD hybrid signal decomposition

1.4 信号分解

1.4.1 离散小波变换

在实际的小波变换应用中,由于连续小波变换的计算复杂性,DWT被更广泛地使用。DWT非常适用于噪声滤波、奇异点检测和数据压缩。对于时间序列数据,DWT是一种有效的时间尺度多分辨率分析工具。通过将原始信号划分为近似和详细系数,DWT提取了输入信号中的重要特征。它利用滤波器组对信号进行多分辨率分解,计算时间相对较短。DWT由两类滤波器组成,即高通滤波器(High pass filter, HPF)和低通滤波器(Low pass filter, LPF)。LPF和HPF都有一个截止频率,该频率为输入信号带宽的一半。一般来说,小波分析集成了滤波和下采样操作,输入信号采样下降了2倍。对于信号xn的DWT可表示为

DWTj,k=12j-+xnφ*n-k×2j2j (1)

式中:φ(n)指母小波*表示复共轭运算。

DWT将信号分解成详细信息和粗略近似信息,如图2所示。使用高通滤波器hn和低通滤波器gn对原始信号xn进行滤波,第一级信号分解分别为

yhk=nxnh2k-n (2)
ygk=nxng2k-n (3)

图2  DWT分解原理图

Fig.2  Schematic diagram of DWT decomposition

在第一级,HPF和下采样器给出细节系数D1,然后LPF和下采样器一起产生近似系数A1。随后,A1被进一步分解以方便从输入信号中提取重要的细节系数。因此,DWT分别在低频和高频下提供良好的频域和时域分辨率。在这项工作中,为了提取非平稳信号的细微变化,使用了五级分解,子带为D1~D4A1。尽管加速度计信号容易出现高波动和振荡,但它们仍然表现出一定的统计特征。针对各种人类活动采集的信号具有周期性的特点,利用DWT将原始传感器信号变换到时频域,提取各种统计特征。确定来自这些子带的各种统计测量,以识别特征向量的主要参数。在这项工作中,利用Haar小波作为母小波,它具有良好的时间局部化和计算效率。DWT分解后信号的近似系数和细节系数如图3所示。

图3  原始信号与五级DWT的所有系数

Fig.3  Raw signal and all coefficients of 5-level DWT

1.4.2 变分模式分解

VMD方法将经典的维纳滤波扩展到多个自适应频段,将模型估计问题转化为变分问题,不断更新模型及其中心频率,通过傅里叶逆变换将模型变换到时间域。从该模型可以得到一组模型及其各自的中心频率,从而可以从这些模型重构输入信号,解调后的每种模式都是平滑的。

VMD的目标是将输入信号f分解成若干子信号uk,这些子信号uk的叠加构成输入信号f,即

f=f¯+Δ=k=1Muk+rn (4)

式中:f¯为原始信号,Δ表示噪声信号,rn余项。这里,每个子信号uk具有中心频率wk,并且它具有有限的频带。中心频率wk由分解确定,相应的约束条件为

minuk,wk ktδt+jπt*ukte-jwkt22s.t. kuk=f (5)

式中:k为模态数,t为时间,δt为冲激函数。通过使用二次罚项和拉格朗日乘子将变分模型求解为无约束变分模型,可得

Luk,wk,λ=αktδt+jπt*ukte-jwkt22+ft-kukt22+λt,ft-kuk (6)

式中:λ为拉格朗日乘子,α为正则化因子。通过引入乘数交替方向法(Alternating direction method of multipliers, ADMM),相应的结果分别为

u^kn+1w=f^w-iku^iw+λ^w21+2αw-wk2 (7)
wkn+1=0wu^kw2dw0u^kw2dw (8)
λ^n+1wλ^nw+τf^w-ku^kn+1w (9)

式中τ为噪声容限的参数。上述方程的收敛条件为

ku^kn+1-u^kn22u^kn22<ε (10)

对于给定的判别精度ε>0,当式(10)满足时,整个迭代结束,最后得到K个窄带模态分量,完成信号频段的自适应分割,从而避免了模式混叠。

VMD算法涉及的参数有模态数K、正则化因子α、噪声容差参数τ和精度判别ε,其中参数K代表了模态的个数。模态过少会导致数据分割不足,部分分量被包含在其他模态中,而过多的模态将导致捕获额外的噪声或模式复

18。因此,参数K会对性能产生影响。其他参数可根据文献[18]进行一般设置。本文正则化因子α为3 000,噪声容忍参数τ为0,精度判别ε1×10-7。利用中心频率判断模态数K的步骤如图4所示。首先设置初始K=2,然后判断VMF的中心频率是否相近,如相近则设置K=K-1,如不相近,则令K=K+1,重复以上步骤,直至确定K值。设置K=7,VMD分解信号的VMF及其中心频率如图5所示。当K=6时,出现了中心频率相近的VMF,此为过分解现象,因此最终将K设置为5。

图4  确定K参数流程图

Fig.4  Flow chart of parameter K determination

图5  K=7时VMD模态分量及其频谱

Fig.5  VMD modal components and their spectrums when K=7

1.5 特征提取

常用的特征参数分为4类,包括时域特征参数、频域特征参数、波形指标和其他特征参数。为了选择能够区分动作信号的特征参数,从时域、频域、波形指标和熵理论这几个方面进行分析。根据文献[

21‑22]选取均值、方差、标准差、最小值、频率均方根、频率标准差、峰度和偏度这8个特征参数,对信号进行分析。表1给出了统计特征的相关描述。

表1  统计特征详细描述
Table 1  Detailed description of statistical characteristics
特征公式
均值 μ=1ni=1nxi
方差 σ2=1ni=1nxi-μ2
标准差 σ=i=1nxi-μ2n
最小值 Amin=min xi
频率均方根 RMSF=k=1Nfk2P(k)k=1NP(k)
频率标准差 σp2=k=1Nfk-μf2P(k)k=1NP(k)
峰度 Ku=1ni=1nxi-μσ3
偏度 Sk=1ni=1nxi-μσ4

从输入数据中提取DWT和VMD的统计特征后,需要对这些特征进行融合。融合方法可分为3类:数据级融合、特征级融合和决策级融

23。特征级融合是指将从原始传感器获得的多个特征组合在一起,然后再应用于分类或回归任务之前。本文对处理后的数据进行特征级融合,获得了一个由DWT和VMD级联的特征矩阵,并将其作为分类器的输入。

1.6 算法复杂度分析

1.6.1 离散小波变换的算法复杂度分析

对于原始传感器信号进行离散小波分解,并提取其系数的特征。对每个信号进行四层离散小波变换,需进行4次迭代,每次迭代需要进行2次卷积和2次下采样,因此时间复杂度为O(4Nlog2N)N为信号长度。离散小波分解后会得到5个系数,分别对每个系数向量进行特征提取,均值、方差、标准差、最小值、峰度和偏度的计算时间复杂度均为O(N),频率均方根和频率标准差的计算需要进行一次快速傅里叶变换,其时间复杂度为O(Nlog2N),因此总的时间复杂度为O(4Nlog2N+5(8N+2Nlog2N))=O(Nlog2N)

在进行小波分解时,需要存储每个系数的值,进行所需的空间复杂度为O(5N),即O(N)。特征提取过程中,需要保存一些中间变量,一般情况下特征提取的空间复杂度可以视为常数。

1.6.2 变分模态分解的算法复杂度分析

在默认情况下,VMD算法需要进行迭代求解,因此其时间复杂度为O(KN3)。那么在K=5的情况下,VMD的时间复杂度为O(5N3)。再对分解信号进行特征提取,总的时间复杂度为O(5N3+5(8N+2Nlog2N))=O(N3+Nlog2N)

原始信号需要存储N个采样点,分解后生成K个分解信号,每个信号的长度都是N,因此分解后的带通信号所需的空间为O(5N),即O(N)

综上所述,本文所提出的模型时间复杂度为O(N3+Nlog2N),空间复杂度为O(N)

1.7 分类算法

从普适性的角度来看, KNN、RF、LightGBM(LGBM)和XGBoost(XGB)这4种分类器都是比较经典的机器学习算法,在各种应用场景中都有较好的表现,并且被广泛应用。

(1) KNN算法是一种基于实例的分类器,其原理是根据样本之间的距离来确定其所属类

24。本文采用文献[24]为KNN分类器设置的默认参数进行实验。

(2) RF算法是一种集成学习算法,它使用多个决策树进行分类或回归,每个决策树在不同的子样本上训练,并通过随机特征子集进行划

24。为了避免过拟合,本文采用文献[24]提供的随机森林分类器,并将随机状态设置为0,bootstrapping参数设置为false。

(3) LGBM算法是一种增强集成模型,它可以将耦合的弱学习器转换为潜在模型。LGBM具备高速和低内存消耗的特点,同时能保持较高的精度。本文使用LGBM分类器的默认参数进行实验,并将随机状态设置为500。

(4) XGB算法是一种常用的预测算法,它集成了决策树以构建强大的回归器。XGB使用损失函数的二阶泰勒展开,并通过正则化项控制树的复杂度。为了提高性能并降低模型复杂度,采用文献[

24]中提供的XGB分类器,默认参数中将n_estimators设置为1 000,并保持其他参数的默认设置。

总的来说,KNN适用于小数据集和多分类问题,RF适用于高维数据和防止过拟合的问题,LGBM和XGB适用于大规模数据集和高维数据,并且可以加快训练速度和提高准确率。为了验证DWT‑VMD混合信号分解技术带来的性能提升,选择这4种分类器分别进行测试,在保证测试效率的同时,也能得到更加全面的结果。

2 实验仿真与结果分析

2.1 实验环境

在配备英特尔酷睿i7‑8700处理器8核3.2 GHz CPU、16 GB内存存储和NVIDIA GeForce GTX 1050 TI 4 GB‑128位显卡的台式机上进行了实验。实验在Python3.9.2的计算环境中运行。所有分类器均采用10次交叉验证,以准确率作为性能指标,比较不同算法的有效性。

2.2 评估指标

活动识别性能可通过准确率、精度、召回率及F1分数等指标综合考虑分类器的识别情况来评估。其活动识别性

25指标的分类结果混淆矩阵如表2所示。

表2  分类结果混淆矩阵
Table 2  Classification result confusion matrix
真实情况预测情况
正例反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)

准确率(Acc)是分类模型正确预测的样本数量与总样本数量之比,可表示为

Acc=TP+TNTP+TN+FN+FP (11)

精度(Pre)是分类模型预测为正的样本中实际为正的样本数量与预测为正的样本数量之比,可表示为

Pre=TPTP+FP (12)

召回率(R)是分类模型预测为正的样本中实际为正的样本数量与实际为正的样本数量之比,可表示为

R=TPTP+FN (13)

F1‑score(F1)是精度和召回率之间的平衡度量,可表示为

F1=2×Pre×RPre+R (14)

2.3 实验结果与分析

2.3.1 与前人工作对比

将本文算法与目前先进的算法进行比较,文献[

26]提出了一种基于数据挖掘的人类活动识别技术,多种机器学习算法在UCI‑HAR数据集上进行验证,其中KNN的识别率为89.99%;文献[27]提出了基于智能手机的惯性传感器预测人体运动的逻辑模型树(Logistic model tree, LMT)机器学习方法,其中使用多种机器学习算法进行对比验证,结果显示,LMT在UCI‑HAR数据集上RF的识别率为97.75%;文献[28]提出了一种基于UCI‑HAR数据集的LGBM分类方法,在LGBM算法中加入GOSS和EFB算法,其识别率为93.61%;文献[29]提出了一种MSENet方法,可以对不同传感器数据之间的关系进行建模,同时采用特征融合技术对不同传感器信号进行融合,并在多种机器学习算法上进行验证,其中在UCI‑HAR数据集上XGB识别率可达88.73%;文献[30]提出了一种新型深度学习方法LGSTNet,将其分别与CNN、2D‑CNN和3D‑CNN算法进行了对比实验,在UCI‑HAR数据集上LGSTNet的识别率为95.69%,运行时间为35.45 min,3D‑CNN识别率为94.28%,运行时间为33.21 min;文献[31]利用保秩判别分析(Rank preserving discriminant analysis, RPDA)和KNN进行行为识别,其在SCUT‑NAA数据集上进行算法有效性验证,准确率为89.1%;文献[32]提出了基于线性预测分析(Linear predictive analysis, LPA)的特征提取方法,在SCUT‑NAA数据集上进行验证,RF准确率可达90%。

本文算法与历史研究对比结果如表3所示。可以观察到,在机器学习方面,本文提出的基于DWT‑VMD混合信号分解技术的人体活动识别算法达到了比前人更高的识别准确率。在深度学习方面,不同数据集的大小对算法的运行时间有较大影响,由于SCUT数据集较大,处理过程需要更多的时间,但是本文算法仍然取得了较好的成绩,远远快于深度学习算法。深度学习虽然在许多问题上取得了显著成果,但是需要复杂的神经网络结构、长时间的训练和高效的硬件资源。与之相比,本文算法基于简洁的数学模型,能在短时间内得到精确的结果。值得一提的是,本文算法在准确率方面也超过深度学习算法。总之,相对历史机器学习算法和深度学习算法,本文算法具有更显著的优势,可以获得更高的识别准确率和更快的计算速度。

表3  本文方法与历史研究对比
Table 3  Comparison between the proposed method and historical research
数据集来源算法AccPreRF1时间/min
UCI‑HAR 文献[26] KNN 0.899 9 0.87 0.83
本文方法 0.913 3 0.91 0.91 0.91 7.1
文献[27] RF 0.918 5 0.91 0.91 0.91
本文方法 0.975 0 0.97 0.97 0.97 7.1
文献[28] LGBM 0.931 6
本文方法 0.988 7 0.98 0.98 0.98 10.3
文献[29] XGB 0.887 3 0.88 0.88
本文方法 0.989 1 0.99 0.99 0.99 10.6
文献[30] 3D‑CNN 0.946 8 33.21
SCUT‑NAA 文献[31] KNN 0.891 0
本文方法 0.907 9 0.91 0.91 0.91 12.1
文献[32] RF 0.900 0
本文方法 0.915 2 0.92 0.92 0.91 12.1

2.3.2 DWT‑VMD混合信号分解算法的有效性

为了验证DWT‑VMD混合信号分解算法的有效性,分别加入DWT、VMD以及DWT‑VMD混合信号分解算法,测试对分类结果的影响。

以SCUT‑NAA数据集的XGB分类算法为例,结果如图6所示。图6(a)为未加入任何分解算法的混淆矩阵,图6(b)为仅加入DWT算法的混淆矩阵,图6(c)为仅加入VMD算法的混淆矩阵,图6(d)为加入DWT‑VMD混合信号分解算法的混淆矩阵。在图6中可以观察到,上楼下楼、走路快走、踏步倒走这几种类别通常容易被混淆,主要原因是SCUT‑NAA数据集在单次数据采集中只使用了一个传感器采集数据,在运动过程中传感器所获取的运动数据变化是有限而且相似的。

图6  SCUT-NAA数据集加入不同分解算法的混淆矩阵

Fig.6  Confusion matrices adding different decomposition algorithms on SCUT-NAA dataset

图6(a)和(b)可以看出,DWT分解算法的加入对下楼、上楼、踏步和倒走的准确率均有提高,其中上楼提高了6%,踏步提高了4.4%。由图6(a)和(c)对比可见,加入VMD算法后,上下楼,踏步和倒走识别率也有所提升,其中踏步提高了3.3%。从图6(a)和(d)中可以看出,除跳和放松外,所有活动均有提升,其中上楼识别率提高了10.4%,踏步提高了7.1%,下楼提高了6.7%,倒走提高了5.1%。由此可见,DWT和VMD的统计特征对易混淆的人体活动具有更好的区分特性。DWT算法可以将信号分解成不同频率区间的子带信号,从而提取出信号的频率特征,并且可以通过选择不同尺度的子带信号来获取不同时间间隔的局部特征。这一特性有助于区分易混淆的运动模式,如上楼和下楼、踏步和倒走,在时间和频率上表现不同,因此在使用DWT算法进行特征提取时,这些运动模式之间的差异更为明显,从而提高了它们的识别准确率。VMD算法可以进一步帮助提取人体动作的模态特征,并减小由于噪声等原因产生的振动干扰。

为了验证本文所提议框架的有效性,分类器被独立测试了10次,在UCI‑HAR和SCUT‑NAA数据集上的平均性能指标分别如表4表5所示。由于VMD算法分解的每个VMF在时间和频率上都具有平滑性,即相邻时刻和频率上的振幅变化不会太大,信号中存在高频噪声时,VMD算法可能会将其分解到低频成分中,导致频率带宽增大,从而影响分类准确率。从表4可观察到,仅加入VMD算法相比于未加入分解算法,KNN的准确率等指标均有下降,而其他分类算法并未受到影响。这种频率带宽问题在原始数据量较大时尤为明显,SCUT‑NAA数据集比UCI‑HAR数据集大很多,因此在表5使用SCUT‑NAA数据集进行分类时,仅加入VMD算法的分类性能均有所下降。

表4  UCI‑HAR数据集的分类算法性能
Table 4  Classification algorithm performance on UCI‑HAR dataset
分类方法信号分解方法Acc准确率方差PreRF1
KNN 未加入分解算法 0.886 2 0.004 7 0.88 0.88 0.88
仅加入DWT 0.878 5 0.004 3 0.88 0.88 0.88
仅加入VMD 0.835 4 0.012 4 0.84 0.84 0.84
加入DWT‑VMD 0.913 3 0.003 9 0.91 0.91 0.91
RF 未加入分解算法 0.960 3 0.006 9 0.96 0.96 0.96
仅加入DWT 0.969 6 0.009 3 0.97 0.97 0.97
仅加入VMD 0.973 2 0.004 8 0.97 0.97 0.97
加入DWT‑VMD 0.975 0 0.003 2 0.97 0.97 0.97
LGBM 未加入分解算法 0.969 8 0.001 4 0.97 0.97 0.97
仅加入DWT 0.975 0 0.007 8 0.98 0.98 0.98
仅加入VMD 0.985 0 0.007 3 0.98 0.98 0.98
加入DWT‑VMD 0.988 7 0.010 2 0.98 0.98 0.98
XGB 未加入分解算法 0.970 9 0.002 1 0.97 0.97 0.97
仅加入DWT 0.965 1 0.002 2 0.96 0.96 0.96
仅加入VMD 0.980 9 0.009 6 0.98 0.98 0.98
加入DWT‑VMD 0.989 1 0.001 6 0.99 0.99 0.99
表5  SCUT‑NAA数据集的分类算法性能
Table 5  Classification algorithm performance on SCUT‑NAA dataset
分类方法信号分解方法Acc准确率方差PreRF1
KNN 未加入分解算法 0.891 1 0.003 1 0.89 0.89 0.89
仅加入DWT 0.901 6 0.004 8 0.90 0.90 0.90
仅加入VMD 0.887 1 0.002 2 0.89 0.89 0.89
加入DWT‑VMD 0.907 9 0.001 4 0.91 0.91 0.91
RF 未加入分解算法 0.903 5 0.001 2 0.90 0.90 0.90
仅加入DWT 0.905 7 0.002 3 0.91 0.91 0.90
仅加入VMD 0.872 7 0.009 6 0.87 0.87 0.87
加入DWT‑VMD 0.915 2 0.004 8 0.92 0.92 0.91
LGBM 未加入分解算法 0.914 3 0.009 8 0.91 0.91 0.91
仅加入DWT 0.918 0 0.009 3 0.92 0.92 0.92
仅加入VMD 0.900 1 0.005 6 0.90 0.90 0.899
加入DWT‑VMD 0.939 3 0.001 6 0.94 0.94 0.94
XGB 未加入分解算法 0.923 2 0.002 1 0.92 0.92 0.92
仅加入DWT 0.938 9 0.010 9 0.93 0.93 0.93
仅加入VMD 0.920 8 0.003 7 0.92 0.92 0.92
加入DWT‑VMD 0.955 2 0.002 2 0.96 0.95 0.95

表4表5可以观察到,仅加入单一分解算法与未加入分解算法相比,分类准确率或提高或降低,而加入DWT‑VMD混合分解算法的识别准确率在两个数据集上均得到了显著提高,且都比仅加入单一分解算法的准确率高,说明VMD与DWT的特征可以在人体活动识别中相互补充。4种ML算法在UCI‑HAR和SCUT‑NAA两个数据集上的分类准确率都在90%以上,可以看出XGB分类器的效果最好,其次是LGBM。其中,对于UCI‑HAR数据集的识别情况,LGBM算法在加入DWT‑VMD混合信号分解算法后,与未加入分解算法相比识别准确率提高了1.79%,总体识别准确率达到98.77%;XGB算法在加入混合信号处理技术后,识别准确率提高了1.84%,总体识别准确率达到98.91 %。对于SCUT‑NAA数据集, LGBM算法在加入DWT‑VMD混合信号分解算法后,识别准确率提高了2.5%,总体识别准确率达到93.93%;XGB算法在加入混合信号处理技术后,识别准确率提高了3.2%,总体识别准确率可达95.52 %。

3 结束语

本文提出了一种基于DWT‑VMD混合信号分解技术的人体活动识别方法。首先通过DWT‑VMD混合信号分解技术处理来自UCI‑HAR和SCUT‑NAA数据集的原始信号,将原始数据进行五级DWT分解,并提取显著的统计特征。利用VMD技术分解出VMF,提取时频域的统计特征。然后使用特征级的数据融合技术融合两个特征矩阵,作为分类器的输入,采用了十倍交叉验证方法进行训练。分别对KNN、RF、LGBM和XGB这4种分类器模型的性能进行了评价。实验结果表明,对于UCI‑HAR数据集的最高准确率可达98.91%,比未加入分解算法提高了1.79%;对于SCUT‑NAA数据集的最高识别准确率可达95.52%,提高了3.2%。虽然该方案在分类性能上有明显的提高,但也存在一定的局限性。今后工作可以设计一种轻量级机器学习算法,将该算法部署到移动设备上,以构建基于活动识别的实时辅助医疗应用程序。

参考文献

1

OSMANI V, BALASUBRAMANIAM S, BOTVICH D. Human activity recognition in pervasive health-care: Supporting efficient remote collaboration[J]. Journal of Network & Computer Applications, 2008, 31(4): 628-655. [百度学术] 

2

SHAO L, JI L, LIU Y, et al. Human action segmentation and recognition via motion and shape analysis[J]. Pattern Recognition Letters, 2012, 33(4): 438-445. [百度学术] 

3

KWAPISZ J R, WEISS G M, MOORE S A. Activity recognition using cell phone accelerometers[J]. ACM SIGKDD Explorations Newsletter, 2011, 12(2): 74-82. [百度学术] 

4

HSU Y L, YANG S C, CHANG H C, et al. Human daily and sport activity recognition using a wearable inertial sensor network[J]. IEEE Access, 2018, 6: 31715-31728. [百度学术] 

5

RAMASAMY RAMAMURTHY S, ROY N. Recent trends in machine learning for human activity recognition—A survey[J].Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2018, 8(4): 1245-1255. [百度学术] 

6

CHEN K, ZHANG D, YAO L,et al. Deep learning for sensor-based human activity recognition: Overview, challenges, and opportunities[J]. ACM Computing Surveys, 2021,54(4): 1-40. [百度学术] 

7

IOSIFIDIS A, TEFAS A, PITAS I. View-invariant action recognition based on artificial neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(3): 412-424. [百度学术] 

8

HE H, TAN Y, ZHANG W. A wavelet tensor fuzzy clustering scheme for multi-sensor human activity recognition[J]. Engineering Applications of Artificial Intelligence, 2018,70: 109-122. [百度学术] 

9

DANG L M, MIN K, WANG H. Sensor-based and vision-based human activity recognition: A comprehensive survey[J]. Pattern Recognition, 2020, 108: 107561-107585. [百度学术] 

10

CHEN S, LIU P, TANG D. Identification of thin-layer coal texture using geophysical logging data: Investigation by wavelet transform and linear discrimination analysis[J]. International Journal of Coal Geology, 2021, 239(2): 103727-103743. [百度学术] 

11

ZHANG D. Fundamentals of image data mining, analysis, features, classification and retrieval[J]. Journal of Print and Media Technology Research, 2019, 9(2): 120-130. [百度学术] 

12

PANDIT S, SHARMA S. On the use of wavelets for analysis of nanofluid flow and thermal transmission through asymmetric porous channel[J]. Proceedings of the National Academy of Sciences, India Section A: Physical Sciences, 2022,92(4): 571-583. [百度学术] 

13

NOLASCO D H, COSTA F B, PALMEIRA E S, et al. Wavelet-fuzzy power quality diagnosis system with inference method based on overlap functions: Case study in an AC microgrid[J]. Engineering Applications of Artificial Intelligence, 2019, 85: 284-294. [百度学术] 

14

NARAYANAN R M, FAIRCHILD D P. Classification of human motions using empirical mode decomposition of human micro-Doppler signatures[J]. IET Radar Sonar Navigation, 2014, 8(5): 425-434. [百度学术] 

15

TIAN Y, ZHANG J, WANG J, et al. Robust human activity recognition using single accelerometer via wavelet energy spectrum features and ensemble feature selection[J]. Systems Science & Control Engineering: An Open Access Journal, 2020, 8(1): 83-96. [百度学术] 

16

XU H, LIU J, HU H, et al. Wearable sensor-based human activity recognition method with multi-features extracted from Hilbert-Huang transform[J]. Sensors, 2016, 16(12): 2048-2074. [百度学术] 

17

ABDU-AGUYE M G, GOMAA W. Competitive feature extraction for activity recognition based on wavelet transforms and adaptive pooling[C]//Proceedings of International Joint Conference on Neural Networks (IJCNN). [S.l.]: IEEE, 2019. [百度学术] 

18

DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62(3): 531-544. [百度学术] 

19

AHMED N, RAFIQ J I, ISLAM M R. Enhanced human activity recognition based on smartphone sensor data using hybrid feature selection model[J]. Sensors, 2020, 20(1): 317-336. [百度学术] 

20

孙伟,姜伟,黄恒,.EEMD降噪的行人活动识别方法[J].导航定位学报,2021,9(3): 41-47. [百度学术] 

SUN Wei, JIANG Wei, HUANG Heng, et al. Predestrian activity recognition method with EEMD denoising[J]. Journal of Navigation and Positioning, 2021,9(3): 41-47. [百度学术] 

21

ZHOU Y, ZHANG Y, YANG D. Pipeline signal feature extraction with improved VMD and multi-feature fusion[J]. Systems Science & Control Engineering: An Open Access Journal, 2020, 8(1): 318-327. [百度学术] 

22

JOSHUVA A, KUMAR R S, SIVAKUMAR S. An insight on VMD for diagnosing wind turbine blade faults using C4.5 as feature selection and discriminating through multilayer perceptron[J]. AEJ—Alexandria Engineering Journal, 2020, 59(5): 3863-3879. [百度学术] 

23

WEBBER M, ROJAS R F. Human activity recognition with accelerometer and gyroscope: A data fusion approach[J]. IEEE Sensors Journal, 2021, 21(15): 16979-16989. [百度学术] 

24

SWAMI A, JAIN R. Scikit-learn: Machine learning in python[J]. Journal of Machine Learning Research, 2013, 12(10): 2825-2830. [百度学术] 

25

戴健威,李瑞祥,陈金瑶,.基于启发式集成特征选择的人体活动识别[J].数据采集与处理,2022,37(4): 860-871. [百度学术] 

DAI Jianwei, LI Ruixiang, CHEN Jinyao, et al. Human activity recognition based on heuristic ensemble feature selection[J]. Journal of Data Acquisition and Processing, 2022,37(4): 860-871. [百度学术] 

26

LAVANYA B, GAYATHRI G S. Exploration and deduction of sensor-based human activity recognition system of smart-phone data[C]//Proceedings of IEEE International Conference on Computational Intelligence and Computing Research (ICCIC). [S.l.]: IEEE, 2017. [百度学术] 

27

NEMATALLAH H, RAJAN S, CRET A M. Logistic model tree for human activity recognition using smartphone-based inertial sensors[C]//Proceedings of IEEE Sensors. [S.l.]: IEEE, 2019. [百度学术] 

28

SHAO Z, GUO J, ZHANG Y, et al. LightBGM for human activity recognition using wearable sensors[C]//Proceedings of 2021 International Conference on Intelligent Transportation, Big Data & Smart City (ICITBS). [S.l.]: IEEE, 2021: 668-671. [百度学术] 

29

LUO F, KHAN S, HUANG Y. Activity-based person identification using multimodal wearable sensor data[J]. IEEE Internet of Things Journal, 2023,10(2): 1713-1723. [百度学术] 

30

ZHENG G. A novel attention-based convolution neural network for human activity recognition[J]. IEEE Sensors Journal, 2021, 21(23): 27015-27025. [百度学术] 

31

TAO D, JIN L, WANG Y. Rank preserving discriminant analysis for human behavior recognition on wireless sensor networks[J]. IEEE Transactions on Industrial Informatics, 2014,10(1): 813-823. [百度学术] 

32

LI R, LI H, SHI W. Human activity recognition based on LPA[J]. Multimedia Tools and Applications, 2020, 79(41): 31069-31086. [百度学术]