摘要
在人类活动识别的应用环境中,从原始传感器数据中提取更加有效的特征仍具有挑战性。针对该问题,利用离散小波变换(Discrete wavelet transform, DWT)和变分模式分解(Variational mode decomposition,VMD)的混合信号分解技术提取原始信号中的显著特征向量。在UCI‑HAR数据集与SCUT‑NAA数据集上,利用多种机器学习分类算法,例如K近邻、随机森林、LightGBM和XGBoost,对DWT‑VMD混合信号分解算法的有效性进行了实验。实验结果表明,与未使用混合信号分解技术相比,使用该技术后识别准确率均有所提高,其中UCI‑HAR数据集分类准确率达到98.91%,与未加入分解算法相比提高了1.79%;SCUT‑NAA数据集分类准确率达到95.52%,提高了3.2%。在人体活动识别中,利用DWT‑VMD混合信号分解技术,能够提取原始信号中更有效的特征,提高识别准确率,具有一定的实用性。
检测、解释和识别人体在行走、跑步、就餐、躺下和坐下等不同活动过程中的动作,通常被称为人类活动识别(Human activity recognition, HAR)。人类活动识别是一个重要的研究领域,因为它是许多实际应用的基础需求,如医疗保
人类活动识别主要是基于传感器和基于计算机视觉系统进行研究的。由于传感器位置不固定,数据可能存在一定的误
信号处理技术,特别是分解方法,已被用于提高不同领域的精度,包括地球物
基于以上分析,本文提出了一种基于DWT‑VMD混合信号分解技术的人体活动识别模型。利用DWT和VMD技术分解来自传感器的原始信号,并提取分解信号的显著特征向量,将两个特征矩阵进行级联。分别利用K近邻(K‑nearest neighbor,KNN)、随机森林(Random forest, RF)、LightGBM和XGBoost这4种分类器模型进行训练,对多种人类活动进行分类。
本文主要贡献如下:(1) 提出了一种基于DWT‑VMD信号分解的人体活动识别方法,该方法能够从不同尺度和不同频带的信号中提取出不同的特征,从而更准确地反映不同活动对应的信号特征;(2) 通过多组实验验证了所提出方法在人体活动识别中的有效性和实用性;(3) 该研究成果为人体活动监测、健康管理和运动康复等领域提供了新的思路和方法,具有重要的学术价值和应用价值。此外,DWT和VMD作为信号处理领域中广泛应用的方法之一,本文的研究成果也进一步拓展了其在人体活动识别领域的应用。
活动识别过程一般分为以下4个基本步骤:(1)在环境和受试者身体上部署合适的传感器,监测和收集用户的活动以及环境状态的变化;(2)使用数据分析算法收集、存储和整理所获得的信息;(3)设计活动识别模型,使用收集到的数据中的突出特征进行适当的训练;(4)从收集到的数据中实现推断用户活动。
研究中使用了UCI‑HAR和SCUT‑NAA两个公开数据集,分别进行数据预处理。数据集的70%作为训练数据,30%用作测试数据。
UCI‑HAR数据集包括30位受试者,通过放置在其身上的传感器(三星Galaxy SII智能手机)收集活动数据。测量6种日常行为:站立、躺、坐、行走、下楼和上楼。在数据采集过程中,加速度计和陀螺仪组件分别采集加速度和角速度数据,结果数据包含10 299个实例,采样频率为50 H
基于DWT‑VMD混合信号分解技术的人体活动识别框架如

图1 基于DWT‑VMD混合信号分解技术的人体活动识别框图
Fig.1 Block diagram of human activity recognition based on DWT‑VMD hybrid signal decomposition
在实际的小波变换应用中,由于连续小波变换的计算复杂性,DWT被更广泛地使用。DWT非常适用于噪声滤波、奇异点检测和数据压缩。对于时间序列数据,DWT是一种有效的时间尺度多分辨率分析工具。通过将原始信号划分为近似和详细系数,DWT提取了输入信号中的重要特征。它利用滤波器组对信号进行多分辨率分解,计算时间相对较短。DWT由两类滤波器组成,即高通滤波器(High pass filter, HPF)和低通滤波器(Low pass filter, LPF)。LPF和HPF都有一个截止频率,该频率为输入信号带宽的一半。一般来说,小波分析集成了滤波和下采样操作,输入信号采样下降了2倍。对于信号的DWT可表示为
(1) |
式中:指母小波
DWT将信号分解成详细信息和粗略近似信息,如
(2) |
(3) |

图2 DWT分解原理图
Fig.2 Schematic diagram of DWT decomposition
在第一级,HPF和下采样器给出细节系数D1,然后LPF和下采样器一起产生近似系数A1。随后,A1被进一步分解以方便从输入信号中提取重要的细节系数。因此,DWT分别在低频和高频下提供良好的频域和时域分辨率。在这项工作中,为了提取非平稳信号的细微变化,使用了五级分解,子带为D1~D4和A1。尽管加速度计信号容易出现高波动和振荡,但它们仍然表现出一定的统计特征。针对各种人类活动采集的信号具有周期性的特点,利用DWT将原始传感器信号变换到时频域,提取各种统计特征。确定来自这些子带的各种统计测量,以识别特征向量的主要参数。在这项工作中,利用Haar小波作为母小波,它具有良好的时间局部化和计算效率。DWT分解后信号的近似系数和细节系数如

图3 原始信号与五级DWT的所有系数
Fig.3 Raw signal and all coefficients of 5-level DWT
VMD方法将经典的维纳滤波扩展到多个自适应频段,将模型估计问题转化为变分问题,不断更新模型及其中心频率,通过傅里叶逆变换将模型变换到时间域。从该模型可以得到一组模型及其各自的中心频率,从而可以从这些模型重构输入信号,解调后的每种模式都是平滑的。
VMD的目标是将输入信号分解成若干子信号,这些子信号的叠加构成输入信号,即
(4) |
式中:为原始信号,表示噪声信号,余项。这里,每个子信号具有中心频率,并且它具有有限的频带。中心频率由分解确定,相应的约束条件为
(5) |
式中:为模态数,为时间,为冲激函数。通过使用二次罚项和拉格朗日乘子将变分模型求解为无约束变分模型,可得
(6) |
式中:为拉格朗日乘子,为正则化因子。通过引入乘数交替方向法(Alternating direction method of multipliers, ADMM),相应的结果分别为
(7) |
(8) |
(9) |
式中为噪声容限的参数。上述方程的收敛条件为
(10) |
对于给定的判别精度,当
VMD算法涉及的参数有模态数、正则化因子、噪声容差参数和精度判别,其中参数代表了模态的个数。模态过少会导致数据分割不足,部分分量被包含在其他模态中,而过多的模态将导致捕获额外的噪声或模式复

图4 确定K参数流程图
Fig.4 Flow chart of parameter K determination

图5 K=7时VMD模态分量及其频谱
Fig.5 VMD modal components and their spectrums when K=7
常用的特征参数分为4类,包括时域特征参数、频域特征参数、波形指标和其他特征参数。为了选择能够区分动作信号的特征参数,从时域、频域、波形指标和熵理论这几个方面进行分析。根据文献[
特征 | 公式 |
---|---|
均值 | |
方差 | |
标准差 | |
最小值 | |
频率均方根 | |
频率标准差 | |
峰度 | |
偏度 |
从输入数据中提取DWT和VMD的统计特征后,需要对这些特征进行融合。融合方法可分为3类:数据级融合、特征级融合和决策级融
对于原始传感器信号进行离散小波分解,并提取其系数的特征。对每个信号进行四层离散小波变换,需进行4次迭代,每次迭代需要进行2次卷积和2次下采样,因此时间复杂度为,为信号长度。离散小波分解后会得到5个系数,分别对每个系数向量进行特征提取,均值、方差、标准差、最小值、峰度和偏度的计算时间复杂度均为,频率均方根和频率标准差的计算需要进行一次快速傅里叶变换,其时间复杂度为,因此总的时间复杂度为。
在进行小波分解时,需要存储每个系数的值,进行所需的空间复杂度为,即。特征提取过程中,需要保存一些中间变量,一般情况下特征提取的空间复杂度可以视为常数。
从普适性的角度来看, KNN、RF、LightGBM(LGBM)和XGBoost(XGB)这4种分类器都是比较经典的机器学习算法,在各种应用场景中都有较好的表现,并且被广泛应用。
(1) KNN算法是一种基于实例的分类器,其原理是根据样本之间的距离来确定其所属类
(2) RF算法是一种集成学习算法,它使用多个决策树进行分类或回归,每个决策树在不同的子样本上训练,并通过随机特征子集进行划
(3) LGBM算法是一种增强集成模型,它可以将耦合的弱学习器转换为潜在模型。LGBM具备高速和低内存消耗的特点,同时能保持较高的精度。本文使用LGBM分类器的默认参数进行实验,并将随机状态设置为500。
(4) XGB算法是一种常用的预测算法,它集成了决策树以构建强大的回归器。XGB使用损失函数的二阶泰勒展开,并通过正则化项控制树的复杂度。为了提高性能并降低模型复杂度,采用文献[
总的来说,KNN适用于小数据集和多分类问题,RF适用于高维数据和防止过拟合的问题,LGBM和XGB适用于大规模数据集和高维数据,并且可以加快训练速度和提高准确率。为了验证DWT‑VMD混合信号分解技术带来的性能提升,选择这4种分类器分别进行测试,在保证测试效率的同时,也能得到更加全面的结果。
在配备英特尔酷睿i7‑8700处理器8核3.2 GHz CPU、16 GB内存存储和NVIDIA GeForce GTX 1050 TI 4 GB‑128位显卡的台式机上进行了实验。实验在Python3.9.2的计算环境中运行。所有分类器均采用10次交叉验证,以准确率作为性能指标,比较不同算法的有效性。
活动识别性能可通过准确率、精度、召回率及F1分数等指标综合考虑分类器的识别情况来评估。其活动识别性
真实情况 | 预测情况 | |
---|---|---|
正例 | 反例 | |
正例 | TP(真正例) | FN(假反例) |
反例 | FP(假正例) | TN(真反例) |
准确率(Acc)是分类模型正确预测的样本数量与总样本数量之比,可表示为
(11) |
精度(Pre)是分类模型预测为正的样本中实际为正的样本数量与预测为正的样本数量之比,可表示为
(12) |
召回率(R)是分类模型预测为正的样本中实际为正的样本数量与实际为正的样本数量之比,可表示为
(13) |
F1‑score(F1)是精度和召回率之间的平衡度量,可表示为
(14) |
将本文算法与目前先进的算法进行比较,文献[
本文算法与历史研究对比结果如
数据集 | 来源 | 算法 | Acc | Pre | R | F1 | 时间/min |
---|---|---|---|---|---|---|---|
UCI‑HAR |
文献[ | KNN | 0.899 9 | 0.87 | 0.83 | — | — |
本文方法 | 0.913 3 | 0.91 | 0.91 | 0.91 | 7.1 | ||
文献[ | RF | 0.918 5 | 0.91 | 0.91 | 0.91 | — | |
本文方法 | 0.975 0 | 0.97 | 0.97 | 0.97 | 7.1 | ||
文献[ | LGBM | 0.931 6 | — | — | — | — | |
本文方法 | 0.988 7 | 0.98 | 0.98 | 0.98 | 10.3 | ||
文献[ | XGB | 0.887 3 | — | 0.88 | 0.88 | — | |
本文方法 | 0.989 1 | 0.99 | 0.99 | 0.99 | 10.6 | ||
文献[ | 3D‑CNN | 0.946 8 | 33.21 | ||||
SCUT‑NAA |
文献[ | KNN | 0.891 0 | — | — | — | — |
本文方法 | 0.907 9 | 0.91 | 0.91 | 0.91 | 12.1 | ||
文献[ | RF | 0.900 0 | — | — | — | — | |
本文方法 | 0.915 2 | 0.92 | 0.92 | 0.91 | 12.1 |
为了验证DWT‑VMD混合信号分解算法的有效性,分别加入DWT、VMD以及DWT‑VMD混合信号分解算法,测试对分类结果的影响。
以SCUT‑NAA数据集的XGB分类算法为例,结果如

图6 SCUT-NAA数据集加入不同分解算法的混淆矩阵
Fig.6 Confusion matrices adding different decomposition algorithms on SCUT-NAA dataset
由
为了验证本文所提议框架的有效性,分类器被独立测试了10次,在UCI‑HAR和SCUT‑NAA数据集上的平均性能指标分别如
分类方法 | 信号分解方法 | Acc | 准确率方差 | Pre | R | F1 |
---|---|---|---|---|---|---|
KNN | 未加入分解算法 | 0.886 2 | 0.004 7 | 0.88 | 0.88 | 0.88 |
仅加入DWT | 0.878 5 | 0.004 3 | 0.88 | 0.88 | 0.88 | |
仅加入VMD | 0.835 4 | 0.012 4 | 0.84 | 0.84 | 0.84 | |
加入DWT‑VMD | 0.913 3 | 0.003 9 | 0.91 | 0.91 | 0.91 | |
RF | 未加入分解算法 | 0.960 3 | 0.006 9 | 0.96 | 0.96 | 0.96 |
仅加入DWT | 0.969 6 | 0.009 3 | 0.97 | 0.97 | 0.97 | |
仅加入VMD | 0.973 2 | 0.004 8 | 0.97 | 0.97 | 0.97 | |
加入DWT‑VMD | 0.975 0 | 0.003 2 | 0.97 | 0.97 | 0.97 | |
LGBM | 未加入分解算法 | 0.969 8 | 0.001 4 | 0.97 | 0.97 | 0.97 |
仅加入DWT | 0.975 0 | 0.007 8 | 0.98 | 0.98 | 0.98 | |
仅加入VMD | 0.985 0 | 0.007 3 | 0.98 | 0.98 | 0.98 | |
加入DWT‑VMD | 0.988 7 | 0.010 2 | 0.98 | 0.98 | 0.98 | |
XGB | 未加入分解算法 | 0.970 9 | 0.002 1 | 0.97 | 0.97 | 0.97 |
仅加入DWT | 0.965 1 | 0.002 2 | 0.96 | 0.96 | 0.96 | |
仅加入VMD | 0.980 9 | 0.009 6 | 0.98 | 0.98 | 0.98 | |
加入DWT‑VMD | 0.989 1 | 0.001 6 | 0.99 | 0.99 | 0.99 |
分类方法 | 信号分解方法 | Acc | 准确率方差 | Pre | R | F1 |
---|---|---|---|---|---|---|
KNN | 未加入分解算法 | 0.891 1 | 0.003 1 | 0.89 | 0.89 | 0.89 |
仅加入DWT | 0.901 6 | 0.004 8 | 0.90 | 0.90 | 0.90 | |
仅加入VMD | 0.887 1 | 0.002 2 | 0.89 | 0.89 | 0.89 | |
加入DWT‑VMD | 0.907 9 | 0.001 4 | 0.91 | 0.91 | 0.91 | |
RF | 未加入分解算法 | 0.903 5 | 0.001 2 | 0.90 | 0.90 | 0.90 |
仅加入DWT | 0.905 7 | 0.002 3 | 0.91 | 0.91 | 0.90 | |
仅加入VMD | 0.872 7 | 0.009 6 | 0.87 | 0.87 | 0.87 | |
加入DWT‑VMD | 0.915 2 | 0.004 8 | 0.92 | 0.92 | 0.91 | |
LGBM | 未加入分解算法 | 0.914 3 | 0.009 8 | 0.91 | 0.91 | 0.91 |
仅加入DWT | 0.918 0 | 0.009 3 | 0.92 | 0.92 | 0.92 | |
仅加入VMD | 0.900 1 | 0.005 6 | 0.90 | 0.90 | 0.899 | |
加入DWT‑VMD | 0.939 3 | 0.001 6 | 0.94 | 0.94 | 0.94 | |
XGB | 未加入分解算法 | 0.923 2 | 0.002 1 | 0.92 | 0.92 | 0.92 |
仅加入DWT | 0.938 9 | 0.010 9 | 0.93 | 0.93 | 0.93 | |
仅加入VMD | 0.920 8 | 0.003 7 | 0.92 | 0.92 | 0.92 | |
加入DWT‑VMD | 0.955 2 | 0.002 2 | 0.96 | 0.95 | 0.95 |
由
本文提出了一种基于DWT‑VMD混合信号分解技术的人体活动识别方法。首先通过DWT‑VMD混合信号分解技术处理来自UCI‑HAR和SCUT‑NAA数据集的原始信号,将原始数据进行五级DWT分解,并提取显著的统计特征。利用VMD技术分解出VMF,提取时频域的统计特征。然后使用特征级的数据融合技术融合两个特征矩阵,作为分类器的输入,采用了十倍交叉验证方法进行训练。分别对KNN、RF、LGBM和XGB这4种分类器模型的性能进行了评价。实验结果表明,对于UCI‑HAR数据集的最高准确率可达98.91%,比未加入分解算法提高了1.79%;对于SCUT‑NAA数据集的最高识别准确率可达95.52%,提高了3.2%。虽然该方案在分类性能上有明显的提高,但也存在一定的局限性。今后工作可以设计一种轻量级机器学习算法,将该算法部署到移动设备上,以构建基于活动识别的实时辅助医疗应用程序。
参考文献
OSMANI V, BALASUBRAMANIAM S, BOTVICH D. Human activity recognition in pervasive health-care: Supporting efficient remote collaboration[J]. Journal of Network & Computer Applications, 2008, 31(4): 628-655. [百度学术]
SHAO L, JI L, LIU Y, et al. Human action segmentation and recognition via motion and shape analysis[J]. Pattern Recognition Letters, 2012, 33(4): 438-445. [百度学术]
KWAPISZ J R, WEISS G M, MOORE S A. Activity recognition using cell phone accelerometers[J]. ACM SIGKDD Explorations Newsletter, 2011, 12(2): 74-82. [百度学术]
HSU Y L, YANG S C, CHANG H C, et al. Human daily and sport activity recognition using a wearable inertial sensor network[J]. IEEE Access, 2018, 6: 31715-31728. [百度学术]
RAMASAMY RAMAMURTHY S, ROY N. Recent trends in machine learning for human activity recognition—A survey[J].Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2018, 8(4): 1245-1255. [百度学术]
CHEN K, ZHANG D, YAO L,et al. Deep learning for sensor-based human activity recognition: Overview, challenges, and opportunities[J]. ACM Computing Surveys, 2021,54(4): 1-40. [百度学术]
IOSIFIDIS A, TEFAS A, PITAS I. View-invariant action recognition based on artificial neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(3): 412-424. [百度学术]
HE H, TAN Y, ZHANG W. A wavelet tensor fuzzy clustering scheme for multi-sensor human activity recognition[J]. Engineering Applications of Artificial Intelligence, 2018,70: 109-122. [百度学术]
DANG L M, MIN K, WANG H. Sensor-based and vision-based human activity recognition: A comprehensive survey[J]. Pattern Recognition, 2020, 108: 107561-107585. [百度学术]
CHEN S, LIU P, TANG D. Identification of thin-layer coal texture using geophysical logging data: Investigation by wavelet transform and linear discrimination analysis[J]. International Journal of Coal Geology, 2021, 239(2): 103727-103743. [百度学术]
ZHANG D. Fundamentals of image data mining, analysis, features, classification and retrieval[J]. Journal of Print and Media Technology Research, 2019, 9(2): 120-130. [百度学术]
PANDIT S, SHARMA S. On the use of wavelets for analysis of nanofluid flow and thermal transmission through asymmetric porous channel[J]. Proceedings of the National Academy of Sciences, India Section A: Physical Sciences, 2022,92(4): 571-583. [百度学术]
NOLASCO D H, COSTA F B, PALMEIRA E S, et al. Wavelet-fuzzy power quality diagnosis system with inference method based on overlap functions: Case study in an AC microgrid[J]. Engineering Applications of Artificial Intelligence, 2019, 85: 284-294. [百度学术]
NARAYANAN R M, FAIRCHILD D P. Classification of human motions using empirical mode decomposition of human micro-Doppler signatures[J]. IET Radar Sonar Navigation, 2014, 8(5): 425-434. [百度学术]
TIAN Y, ZHANG J, WANG J, et al. Robust human activity recognition using single accelerometer via wavelet energy spectrum features and ensemble feature selection[J]. Systems Science & Control Engineering: An Open Access Journal, 2020, 8(1): 83-96. [百度学术]
XU H, LIU J, HU H, et al. Wearable sensor-based human activity recognition method with multi-features extracted from Hilbert-Huang transform[J]. Sensors, 2016, 16(12): 2048-2074. [百度学术]
ABDU-AGUYE M G, GOMAA W. Competitive feature extraction for activity recognition based on wavelet transforms and adaptive pooling[C]//Proceedings of International Joint Conference on Neural Networks (IJCNN). [S.l.]: IEEE, 2019. [百度学术]
DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE Transactions on Signal Processing, 2014, 62(3): 531-544. [百度学术]
AHMED N, RAFIQ J I, ISLAM M R. Enhanced human activity recognition based on smartphone sensor data using hybrid feature selection model[J]. Sensors, 2020, 20(1): 317-336. [百度学术]
孙伟,姜伟,黄恒,等.EEMD降噪的行人活动识别方法[J].导航定位学报,2021,9(3): 41-47. [百度学术]
SUN Wei, JIANG Wei, HUANG Heng, et al. Predestrian activity recognition method with EEMD denoising[J]. Journal of Navigation and Positioning, 2021,9(3): 41-47. [百度学术]
ZHOU Y, ZHANG Y, YANG D. Pipeline signal feature extraction with improved VMD and multi-feature fusion[J]. Systems Science & Control Engineering: An Open Access Journal, 2020, 8(1): 318-327. [百度学术]
JOSHUVA A, KUMAR R S, SIVAKUMAR S. An insight on VMD for diagnosing wind turbine blade faults using C4.5 as feature selection and discriminating through multilayer perceptron[J]. AEJ—Alexandria Engineering Journal, 2020, 59(5): 3863-3879. [百度学术]
WEBBER M, ROJAS R F. Human activity recognition with accelerometer and gyroscope: A data fusion approach[J]. IEEE Sensors Journal, 2021, 21(15): 16979-16989. [百度学术]
SWAMI A, JAIN R. Scikit-learn: Machine learning in python[J]. Journal of Machine Learning Research, 2013, 12(10): 2825-2830. [百度学术]
戴健威,李瑞祥,陈金瑶,等.基于启发式集成特征选择的人体活动识别[J].数据采集与处理,2022,37(4): 860-871. [百度学术]
DAI Jianwei, LI Ruixiang, CHEN Jinyao, et al. Human activity recognition based on heuristic ensemble feature selection[J]. Journal of Data Acquisition and Processing, 2022,37(4): 860-871. [百度学术]
LAVANYA B, GAYATHRI G S. Exploration and deduction of sensor-based human activity recognition system of smart-phone data[C]//Proceedings of IEEE International Conference on Computational Intelligence and Computing Research (ICCIC). [S.l.]: IEEE, 2017. [百度学术]
NEMATALLAH H, RAJAN S, CRET A M. Logistic model tree for human activity recognition using smartphone-based inertial sensors[C]//Proceedings of IEEE Sensors. [S.l.]: IEEE, 2019. [百度学术]
SHAO Z, GUO J, ZHANG Y, et al. LightBGM for human activity recognition using wearable sensors[C]//Proceedings of 2021 International Conference on Intelligent Transportation, Big Data & Smart City (ICITBS). [S.l.]: IEEE, 2021: 668-671. [百度学术]
LUO F, KHAN S, HUANG Y. Activity-based person identification using multimodal wearable sensor data[J]. IEEE Internet of Things Journal, 2023,10(2): 1713-1723. [百度学术]
ZHENG G. A novel attention-based convolution neural network for human activity recognition[J]. IEEE Sensors Journal, 2021, 21(23): 27015-27025. [百度学术]
TAO D, JIN L, WANG Y. Rank preserving discriminant analysis for human behavior recognition on wireless sensor networks[J]. IEEE Transactions on Industrial Informatics, 2014,10(1): 813-823. [百度学术]
LI R, LI H, SHI W. Human activity recognition based on LPA[J]. Multimedia Tools and Applications, 2020, 79(41): 31069-31086. [百度学术]