摘要
学生的学习情况与其课堂注意力状态密切相关。为了探寻注意力训练能否提高课堂注意力,对10名在校学生进行了α音乐训练,并收集了训练前后的非注意和注意状态的脑电(Electroence⁃phalogram,EEG)信号进行对比研究。由于EEG信号本质上是动态的,且具有低信噪比和高冗余度的特性,为避免直接通过神经网络识别EEG信号效果差的问题,提取了信号的样本熵(Sample entropy,SampEn)、各个波段的能量和能量比共11个特征,并将这些特征进行融合转化为多特征图像,作为神经网络模型的输入。此外,将AlexNet和VGG11两个网络模型进行加权融合构成双卷积神经网络,进一步提高了图像分类性能。结果表明,与单个模型相比,双卷积神经网络融合模型的性能更佳,其识别准确率最高可达到97.53%。研究发现,经过α音乐训练,受试者的脑电特征与此前相比有显著性差异,且网络模型的分类准确率比训练前提高了4%,说明本文所提的α音乐训练能够提高健康学生的注意力水平。
关键词
注意力是指人的心理活动集中指向于某种事物的能力,良好的注意力是人脑发生一系列认知活动的基础。课堂注意力是指在课堂教学期间学生的注意力水平,是学生学习的基础。注意力分散会对学生造成多方面的影响,不仅影响学生的学习效率和学习成绩,还会导致学生出现不遵守学校纪律、厌学自卑以及人际关系差等问题。通过注意力训练的方法,可以提升注意力水平,改善课堂学习的质量。同时,鉴于青少年中精神疾病的发病率不断上升,帮助学生训练注意力不仅有利于提高学业成绩,而且有利于促进心理和情感健康。目前注意力训练常被应用于帮助存在注意力缺陷多动障碍(Attention deficit hyperactivity disorder,ADHD)的儿童增强和维持注意力。2019年,Shereena
为了量化注意力训练的效果,可以通过分析脑电(Electroencephalogram, EEG)信号实现。EEG主要测量和人脑皮层突触活动相关的神经生理变化,是一种非侵入式采集方法。目前,许多特征提取和分类方法已经用于识别注意力脑电任务。Klimesch等的研

图1 本文所提方案
Fig.1 Illustration of the proposed scheme
本实验主要分为注意力训练和脑电信号采集两个部分。注意力训练方式为α音乐训练。脑电采集前首先进行注意网络测试(Attention network test,ANT)实验,之后采集静息态(非注意)和线上课程学习(注意)状态下的脑电数据。
(1)实验对象
实验前,向志愿者简单介绍实验性质和流程,并获得其同意。实验共招募了10名志愿者,均为18~24岁的在校大学生,右利手,听力正常,视力正常或矫正正常,身体健康,无精神病和头部外伤史,且之前从未接受过注意力训练。
(2)实验材料
①注意力训练过程中的α音乐,准备多个音乐歌单,志愿者可以根据喜好选择。
②注意力调查问卷,每周训练结束后志愿者填写注意力调查问卷,粗略评估训练效果。
③ANT实验设计,作为训练有效性的辅助支撑。实验程序由心理实验编程软件Eprime2.0完成编写,一次完整测验时长约为7 min。整个实验分为2个阶段,首先是练习阶段的1 min,帮助被试熟悉实验流程,接下来是6 min的正式实验试次,被试在测验过程中任务完成的反应时间及正确率均由软件自动记录。
④课程内容选取。为了更好地模拟课堂学习状态,注意脑电的采集在志愿者学习网课的状态下进行。本实验中选择了两节“中国大学MOOC”上的关于如何进行英文演讲的全英文课程,分别用于α音乐训练前和训练后。两节课程的课时均为10 min左右,课程难度一致且难度不会太高或者太低而导致志愿者长期处于注意力不集中的状态。
实验的总体流程如

图2 实验流程图
Fig.2 Experimental flowchart
脑电信号的采集使用南京伟思医疗科技有限责任公司的脑电采集仪器实现,可设置脑电信号采集的速度和幅度,采样率为512 Hz。电极分布按照国际标准10~20系统放置,参考电极为A1、A2,选取额叶区电极F3、F4、F7、F8、Fz,颞叶区电极T3、T4、T5、T6,前额电极Fp1、Fp2,中央区电极C3、C4、Cz,顶叶区电极P3、P4、Pz,枕区电极O1、O2,共19个电极。
实验在安静环境内进行,实验室的温度控制在(23±2)℃。数据采集之前,志愿者调整好坐姿和状态,进行ANT实验。首先呈现在屏幕中央的是“+”注视点,注视点消失后出现指示线索,被试准备好后按下“Enter” 键,实验开始。在400 ms的时间间隔(“+”注视点)后,目标刺激(水平位置排列的5个方向随机的箭头)出现,受试者需要在700 ms内判断中间箭头的指向(箭头指向左点击鼠标左键;指向右点击鼠标右键),待被试做出反应后目标刺激消失,屏幕上会呈现反应正误、反应时间和平均准确率;700 ms以上无反应则目标刺激自动消失,此试次作为无效试次。每个试次结束后,再次呈现中心“+”注视点。整个实验被试全程注视屏幕,避免眼球的大幅度运动。
脑电信号采集阶段分为两个部分:3 min静息态脑电(非注意状态)和10 min线上课程学习脑电(注意力状态)。非注意状态下,被试闭目,保持头脑清醒,尽可能减少肢体动作,采集3 min的脑电。之后志愿者有1 min的时间稍作休息调整,在确保其状态良好的情况下,开始网课视频的学习,期间采集注意状态脑电信号。课程播放结束后,进行与课程内容相关的测试,询问被试对于学习过程中注意力变化的主观感受并记录。ANT实验和脑电信号采集在α音乐训练前后都要进行一次,用作前后对比。所有志愿者均完成了实验,没有中途离开者。
脑电信号微弱,且极易受外界干
小波滤波可以在最大限度保持真实信号的基础上,减少甚至完全滤除噪声。因此,对每个样本都进行小波阈值去噪,去除叠加在信号上的噪声。小波阈值去噪主要包含3方面:小波基选取、阈值选取和阈值函数选取。db小波分解能调整频域分辨率使之与脑电节律相一致,更适合用于处理脑电数据,本文采用db4小波去除脑电信号中的噪声干扰。阈值的选取会直接影响去噪效果,本文采用固定阈值,其计算公式为,其中为信号的长度。最常用的阈值函数有硬阈值函数和软阈值函数两种,软阈值去噪后会丢失一些特征,误差相对较大,本文对信号进行硬阈值处理。其中一个样本经过小波阈值去噪的前后对比如

图3 小波阈值去噪
Fig.3 Wavelet threshold denoising
SMOTE(Synthetic minority oversampling technique)算法是对随机过采样算法的改进。由于随机过采样使用复制样本的方法来增加少数类,很可能造成模型过拟合的情况。而SMOTE算法通过分析少数类样本合成新样本,它以每个少数类样本点的k个最近邻样本点为依据,根据样本不平衡比例确定采样率,从其k个最近邻样本点中随机选择N个邻近点。对于每个随机选出的邻近点构建新样本,公式为
(1) |
在原样本的基础上,将邻近点与原样本进行差值并乘上一个[0,1]范围的阈值,从而达到合成数据的目的。该算法的核心是:特征空间上的邻近点其特征都是相似的。它并不是在数据空间上进行采样,而是在特征空间中进行采样,所以准确率会高于传统的采样方式。
由于非注意状态和注意状态2种类别的EEG样本数量严重不平衡,故本文使用SMOTE算法来解决类别不均衡的问题。首先,将数据集根据9∶1的比例分为训练集和测试集,即71个非注意样本和188个注意样本划分为测试集,其余为训练集。然后将训练集中的非注意状态样本经过SMOTE处理,合成新的样本,生成的新训练集包含1 695个非注意状态样本和1 695个注意状态样本。
由于EEG信号的随机性、不稳定性以及信号采集过程中产生的各种噪声干扰无法全部去除,使得EEG具有非常高的空间特性且冗余度高,直接将预处理后的脑电信号样本送入神经网络的效果比较差,导致网络模型理解其含义比较困难。脑电特征提取的目的是为了选取出具有代表性的特征数据,以更全面有效地表征脑电信号。本文在相关工作中手工提取信号特征作为深度神经网络模型的输入,进行注意力脑电识别。
小波变换只分解信号的低频部分,忽略了高频部分。对于EEG信号来说,小波包变
将小波包树节点记为,表示小波包树的层数,表示对应层数的节点个数,hl-2k和gl-2k为一对正交镜像滤波器,可以将信号划分到任意频段。第点的小波包分解系数为
(2) |
(3) |
经过小波包分解,信号采样率为,则第层各个节点对应的频段分别为:。选取合适的节点进行脑电信号的重构,第层、第点的重构公式为
(4) |
根据提取信号的频域特性,选择相应的频带对应的小波分解系数,利用
本文使用db4小波对预处理之后的信号样本进行5层分解,分别提取了每个样本的α、θ、β和δ节律并重构α波、θ 波、β波和δ波。分解后,各个节点及其对应的频带范围如

图4 小波包分解对应的频率空间
Fig.4 Frequency space decomposed by wavelet packets
由于小波包将能量不重叠地正交分解到相邻频带上,因此遵循能量守恒定律,有
(5) |
式中:表示相应频带;表示原数据点数;表示小波包分解后的系数。根据
研究表明,脑电信号有很强的非线性结
假定由个数据组成的时间序列,其SampEn的计算方式如下:
(1)按序号组成1组维数为的向量序列,,其中
(6) |
(2)定义与之间的距离为,则
(7) |
(3)给定1个阈值,统计与之间距离小于等于的数量,记作。对于,定义,求其对所有的平均值为
(8) |
(4)增加维数到,统计与之间距离小于等于的数量,记作。对于,定义,求其对所有的平均值为
(9) |
(5)和是两个序列在相似容限下分别匹配个点和个点的概率,将SampEn定义为
(10) |
(6)当为有限值时,可将长度为的序列的SampEn估计为
(11) |
本文选取参数,,计算各个样本中各个通道的SampEn,其中为相应样本的标准差。本研究中有用电极共19个,将每个样本中的各个电极按顺序进行排列。将每个电极的数据经过小波包分解重构得到的10个频带能量与能量比特征(4个频带能量特征:α频带能量、θ频带能量、β频带能量和δ频带能量,6个能量比:、、、、、),和计算所得的SampEn共11个特征结合在一起,组成19×11的融合特征矩阵,并对矩阵进行归一化处理,然后将归一化后的矩阵转化为对应的多特征彩色图像。样本图像分辨率为543像素×429像素,作为双卷积神经网络融合模型的输入,进行二次特征提取。
与传统的分类方法相比,CNN作为深度学习的主要算法之一,能够有效地保留图片的特征。典型的CNN模型主要由3个部分组成:卷积层、池化层和全连接层。卷积层一般设置多个不同的卷积核对输入进行操作从而获得不一样的特性,达到提取局部特征的效果;池化层用来大幅降低参数量级;全连接层负责预测分类,输出结果。由于本文中数据集相对较小,且多模型融合训练相对于单一网络模型训练耗时比较长,因此选用CNN模型中结构较为简单的AlexNet网络和VGG网络进行融合,以进一步提高识别效果。
AlexNet的整个网络结构由5个卷积层和3个全连接层组成,深度总共8 层,层与层之间使用最大池化(Max‑pooling)分开。该模型主要有以下特点:(1)使用ReLU函数进行激活操作,确保输出特征的值在合理范围之内,防止梯度消失,也能解决一定的梯度爆炸问题,从而加快训练速度;(2)AlexNet中采用的是最大池化,从而保留最显著的特征,同时AlexNet中步长小于池化核窗口,使池化有重叠部分;(3)全连接层采用Dropout方法,避免过拟合。
本文在AlexNet网络的基础上,介于卷积层(Conv)和激活层(ReLU)之间加入了BN(BatchNorm)层,批正则化,让数据分布均匀,且卷积层不使用偏置bias。全连接层之间的Dropout 层,失活比例设置为0.5,随机失活一些神经元,减少神经网络过拟合。为了加快训练速度,在保证识别率不受较大影响的情况下,将每一层的卷积核个数减半。AlexNet网络结构简图如

图5 AlexNet网络结构
Fig.5 AlexNet network structure
AlexNet模型结构通过构造多层网络,取得了不错的效果。但其卷积核数目较少,首个卷积核尺寸过大,不能提取到更加精细的特征。针对这个问题,VGG中采用3×3的卷积核堆叠达到大卷积核的效果,保持相同感受野的同时参数更少。
VGG结构由5层卷积层、3层全连接层、Softmax输出层构成,层与层之间使用Max‑pooling分开,所有隐层的激活单元都采用ReLU函数,通过使用一系列大小为3×3的小尺寸卷积核和pooling层构造深度卷积神经网络,并取得了较好的效果。
本文在VGG11网络的基础上,根据输入数据集的实际情况,将全连接层网络节点个数减少一半,在对分类准确率没有太大影响的基础下,减少了参数量,加快了模型训练的速度。VGG11结构简图如

图6 VGG网络结构
Fig.6 VGG network structure
由于单个Alexnet网络和单个VGG11网络针对注意力脑电的识别率不高,为了更有效地提取图像的特征、提高网络的泛化感知能力、增强二次特征提取能力,本文构建了一个双卷积神经网络模型,将AlexNet网络和VGG11网络进行线性加权融合,权重用来决定每个网络对融合网络的影响。将每个模型对每个样本预测的结果进行加权平均,得出最终结果,使识别结果更为精确。网络架构如

图7 双卷积神经网络融合模型
Fig.7 Fusion model of double convolutional neural network
将E‑prime软件后台记录的ANT实验过程中的反应正误和反应时间进行汇总,计算每个受试者训练前后的平均反应时间和反应正确率,将结果用柱状图表示,由

图8 ANT结果分析
Fig.8 ANT result analysis
本研究中每位志愿者结束网课学习后,都要进行与课程内容相关的小测试,根据测试的得分判断其学习效果和注意力水平。测试共设置了5个问题,其中包括2个判断题(2×10分),1个单选题(10分),1个多选题(答案为4选3,答对1个10分,共30分)和2个简答题(每个简答题包括4个小点,每个点记5分,共2×20分),题目难度逐渐增加。训练前后的两次测试中问题的难易程度相当,因此可以根据2次测试的得分情况检测训练效果。结果如
研究采用非参数检验——相关样本威尔科克森符号秩检验来判断注意力训练前后各特征的差异性,从而判断α音乐训练对学生注意力的影响。将训练前注意态‑训练后注意态各特征的渐进显著性(双侧检验)记为a‑diff,结果如
此外,研究选取样本熵和能量比这两个常用于注意力识别的特征,分别进行各个通道的平均数值比较。由

图9 样本熵和数值的对比
Fig.9 Comparison of sample entropy and values
将此前划分好的经过扩充的训练集图像(以注意力训练前的数据集为例) 按224分辨率进行随机裁剪和翻转等处理后,输入到设定好的网络中用于模型训练,学习率为0.000 02。不同的模型融合权重对模型训练效果有很大的影响,设AlexNet网络的权重为x,VGG11网络的权重为y,模型训练收敛后,不同x和y取值下的训练平均准确率见

图10 模型训练结果
Fig.10 Model training results
在测试集上评估训练好的模型效果,得出:α音乐训练前,单一的AlexNet网络模型测试集上的识别准确率为83.36%,VGG11的识别准确率为91.06%,本文提出的双卷积神经网络融合模型识别率为93.49%。α音乐训练后,AlexNet网络模型的识别准确率为86.18%,VGG11的识别准确率为92.62%,本文提出的多模型融合网络识别率为97.53%。经过α音乐训练,双卷积神经网络融合模型的分类准确率提高了4%,结合4.2中各特征差异性对比结果,说明经过训练后,注意态和非注意态的脑电差别变大,含有更丰富的识别信息,证明这种注意力训练方法的有效性。
二分类中,可以将样本根据真实类别和模型预测类别分为4种:真正类(True positive,TP),真实样本类别和模型预测类别均为正;假正类(False positive,FP),真实样本类别为负,模型预测类别为正;真负类(True negative,TN),真实样本类别和模型预测类别均为负;假负类(False negative,FN),真实样本类别为正,模型预测类别为负。为了能够清晰地表述模型性能,本文采用模型的精确率(Precision),召回率(Recall),F1分数(F1‑score)和准确率(Accuracy)作为模型性能评价指标。
在模型预测是正类数的所有结果中,模型预测对的比重为精确率,即
(12) |
真实值是正类数的所有结果中,模型预测对的比重为召回率,即
(13) |
F1‑score是精确率和召回率的调和平均数,与模型输出性能优劣成正比,即
(14) |
分类模型所有预测正确的结果占总数的比重为准确率,即
(15) |
将注意力状态记为正类,非注意状态记为负类。为了证明模型性能的提升,本文的分类模型与常见的传统分类方法进行对比,各项指标如
本研究针对正常学生上课过程中出现的注意力分散的现象,提出了α音乐的注意力训练方法,并采集了注意力训练前后的EEG信号。针对EEG信号直接作为神经网络的输入进行端到端的识别效果不理想,本研究提取了δ、θ、α和β波4个波段的能量、能量比和样本熵等特征,将其融合为多特征图像,作为神经网络模型的输入。同时,本文将AlexNet和VGG11两个卷积神经网络进行融合,从而达到对分类效果优化的目的。结果表明,双卷积神经网络融合模型能够提高识别准确率,优于单个模型的性能,也优于传统分类器的性能,可以用于注意力脑电分类。同时,本文通过对比注意力训练前后提取的各特征差异性、注意力脑电的分类效果,以及每位志愿者ANT实验的反应平均时间和反应正确率,发现α音乐训练方法确实能够提高健康学生的课堂注意力水平。同时,听音乐的形式具有较高的安全性和可行性,为注意力提升方案的制定提供了依据和思路。
参考文献
SHEREENA E A, GUPTA R K, BENNETT C N, et al. EEG neurofeedback training in children with attention deficit/hyperactivity disorder: A cognitive and behavioral outcome study[J]. Clinical EEG and Neuroscience, 2019, 50(4): 242-255. [百度学术]
LIM C G, POH X W W, FUNG S S D, et al. A randomized controlled trial of a brain-computer interface based attention training program for ADHD[J]. PLoS One, 2019, 14(5): e0216225. [百度学术]
吴佳武, 刘金明, 许泽举, 等. 针对ADHD患者脑电生物反馈治疗的游戏系统设计[J]. 新型工业化, 2021, 11(4): 56-60, 63. [百度学术]
WU Jiawu, LIU Jinming, XU Zeju, et al. Design of game system for EEG biofeedback therapy of ADHD patients[J]. The Journal of New Industrialization, 2021, 11(4): 56-60, 63. [百度学术]
KLIMESCH W, DOPPELMAYR M, RUSSEGGER H, et al. Induced alpha band power changes in the human EEG and attention[J]. Neuroscience Letters, 1998, 244(2): 73-76. [百度学术]
LUTSYUK N V, ISMONT E V, PAVLENKO V B. Modulation of attention in healthy children using a course of EEG-feedback sessions[J]. Neurophysiology, 2006, 38(5/6): 389-395. [百度学术]
REBSAMEN B, BURDET E, GUAN C, et al. A brain-controlled wheelchair based on P300 and path guidance[C]//Proceedings of the First IEEE/RAS-EMBS International Conference on Biomedical Robotics and Biomechatronics. Washington, DC: IEEE Computer Society, 2006: 1101-1106. [百度学术]
KO L W, KOMAROV O, HAIRSTON W D, et al. Sustained attention in real classroom settings: An EEG study[J]. Front Hum Neurosci, 2017, 11: 388. [百度学术]
BOSL W, TIERNEY A, TAGER-FLUSBERG H A. EEG complexity as a biomarker for autism spectrum disorder risk[J]. BMC Med, 2011, 9(1): 18. [百度学术]
HONG Bo, TANG Qingyu, YANG Fusheng, et al. ApEn and Cross-ApEn: Property, fast algorithm and prelininary application to the study of EEG and congnition[J]. Signal Processing, 1999, 15(2): 100-108. [百度学术]
路荣, 黄力宇, 晋琅. 小波包分解脑电复杂性特征提取的注意状态实时识别[J]. 医疗卫生装备, 2013, 34(2): 1-5. [百度学术]
LU Rong, HUANG Liyu, JIN Lang. Real-time attention state recognition based on EEG complexity feature extraction using wavelet packet decomposition[J]. Chinese Medical Equipment Journal, 2013, 34(2): 1-5. [百度学术]
燕楠, 王珏, 魏娜, 等. 基于样本熵的注意力相关脑电特征信息提取与分类[J]. 西安交通大学学报, 2007, 10(41): 1237-1241. [百度学术]
YAN Nan, WANG Jue, WEI Na, et al. Feature exaction and classification of attention related electroencephalographic signals based on sample entropy[J]. Journal of Xi'an Jiaotong University, 2007, 10(41): 1237-1241. [百度学术]
MING D, ZHANG M, XI Youyuan, et al. Multiscale entropy analysis of attention ralated EEG based on motor imaginary potential[C]//Proceedings of International Conference on Computational Intelligence for Measurement Systems and Applica⁃tions. Hong Kong, China: [s.n.], 2009: 24-27. [百度学术]
徐鲁强, 刘静霞, 肖光灿, 等. 脑电注意水平的特征识别[J]. 计算机应用, 2012, 32(11): 3268-3270. [百度学术]
XU Luqiang, LIU Jingxia, XIAO Guangcan, et al. Characterization and classification of EEG attention level[J]. Journal of Computer Applications, 2012, 32(11): 3268-3270. [百度学术]
吴全玉, 张文强, 潘玲佼, 等. 一种结合自适应噪声完备经验模态分解和盲反卷积去除脑电中眼电伪迹的新方法[J]. 数据采集与处理, 2020, 35(4): 720-729. [百度学术]
WU Quanyu, ZHANG Wenqiang, PAN Lingjiao, et al. A new method for electroencephalogram artifact automatic removal based on CEEMDAN and BD in EEG signals[J]. Journal of Data Acquisition and Processing, 2020, 35(4): 720-729. [百度学术]
谷学静, 位占锋, 刘海望, 等. 基于小波包和串并行CNN的脑电信号分类[J]. 微电子学与计算机, 2021, 38(6): 60-65. [百度学术]
GU Xuejing, WEI Zhanfeng, LIU Haiwang, et al. EEG signal recognition based on wavelet packet and serial parallel CNN[J]. Microelectronics & Computer, 2021, 38(6): 60-65. [百度学术]
WANG Fei, WU Shichao, ZHANG Weiwei, et al. Multiple nonlinear features fusion based driving fatigue detection[J]. Biomedical Signal Processing and Control, 2020, 62: 102075. [百度学术]
JIE Xiang, CAO Rui, LI Li. Emotion recognition based on the sample entropy of EEG[J]. Bio-medical Materials and Engineering, 2014, 24(1): 1185-1192. [百度学术]