首页 理论教育 基于能量熵的脑机接口系统研究实例

基于能量熵的脑机接口系统研究实例

时间:2023-05-09 理论教育 版权反馈
【摘要】:第一列表示电极C3的能量分布,第二列则代表电极C4的能量分布。由Vapnik提出的支持向量机在分类、衰退和密度估算领域得到广泛的研究。支持向量机是一种由一组标号训练数据建立函数的方法。我们用支持向量机来进行分类,因此采用分类函数。

第三节 基于能量熵的脑机接口系统研究实例

一、方法

1.对原始脑电信号进行时频信号转换

原始脑电信号是时域上的信号,能量分布分散,特征信号湮没在噪音之中,为了能更好地抽提出显著特征,我们把原始的时域信号转换到时频域上。时频分析的目的就是用一个时间和频率的函数来描述信号能量。好的时频表示法能够使特征抽取变得简单准确。将时域信号转换成时频信号,最常用的方法是使用短时傅立叶变换(STFT),我们采用的是Matlab工具箱中的Spectrogram方法,信号转换从第3秒开始。

在对64导数据进行分析后,我们发现,左右想象运动的特征主要集中在C3、Cz、C4电极上,而C3和C4表现得尤为突出。图5-11是数据集K3b中电极C3和C4的四种想象运动脑电信号在时频域上的能量分布示意图。第一列表示电极C3的能量分布,第二列则代表电极C4的能量分布。第一至第四行分别表示想象左手运动、想象右手运动、想象腿动和想象舌动。

从图5-11可以看出,不同想象运动在时频域上的能量分布是不同的,比如C3和C4电极上,想象左手动和想象右手动的能量变化是不同的:想象左手动时,C3电极上的能量集中于10~15Hz的频带范围内,且一直保持到想象结束,C4电极上相同的频带范围内,只在想象的前期(约0~0.6秒)能量较为集中,此后能量相对均匀的分布在整个频带范围内;想象右手动时的情况则与想象左手时相反,C3电极上10~15Hz的频带范围内,想象的前期(约0~0.6秒)能量较为集中,而C4电极上能量集中于10~15Hz的频带范围内,一直保持到想象结束;对于想象腿动和舌动,C3、C4电极能量变换趋势相差不大。

img154

图5-11 时频域上C3、C4电极的脑电信号

2.计算能量熵

1)Shannon信息熵理论

Shannon熵通常定义为:在给定的时间窗中,信号能量随着时间的分布。信息熵理论指出,对于一个不确定系统,若用一个取有限个值的随机变量X表示其特征,取值为xj的概率为Pj=P{X=xj},j=1,2,∧,∑Pj=1,于是X的信息熵为:

img155

信息熵H是在一定的状态下系统的一种信息测度,它是对序列未知程度的一种度量,可以用来估计随机信号的复杂性。

2)能量熵定义

短时傅立叶变换是一种时频信号分析方法,它可以在频域和时域同时分析非平稳时变信号,因此可以得到信号在时域的动态变化信息,在此基础上定义的能量熵可以表征信号复杂度在时域的变化情况,也可以表征信号的诸多频域特征,具有良好的时频局部化能力。

设E1,E2,∧Em为信号x(t)在m个频率段上的能量分布,则在频域上的能谱可以形成对信号能量的一种划分。在某一时间窗内m信号总能量E等于各分量能量Ej之和,即img156,式中img157,其中Dj为频率j上能谱值,设

img158

则∑Pj=1,于是定义相应的能量熵为:

img159

对于通过脑机接口系统采集的脑电信号,公式5-23定义的能量熵能反映脑电信号频率空间的能量分布信息,同时也能反映脑电信号在时域与频域上的能量分布特征。

在本书中,能量熵的计算被定义在某一固定长度窗口范围内,按步长为2在短时傅立叶变换信号内进行滑动。

3.计算Fisher距离

如前所述,我们所采用的数据共包括四种想象运动。我们对四种想象运动中的任意两种进行分类,即想象左手动与想象右手动、想象左手动与想象舌动、想象左手动与想象腿动、想象右手动与想象舌动、想象右手动与想象腿动、想象舌动与想象腿动。

为了抽提运动想象脑电信号特征,我们使用Fisher距离来进行初步特征提取,两类间的Fisher距离计算公式如下:

img160

其中F表示Fisher距离,μ和σ分别为均值和方差。

在分类研究中,Fisher距离常常被用来表示类型间的差异,若是类型差异明显,则Fisher距离大,否则,Fisher距离较小。由于脑电信号的不稳定性,加上背景噪音的影响,不同类型的运动想象脑电信号之间的差异并不明显,Fisher距离大的特征,并不能说明该特征是脑电信号中运动想象脑电信号特征;反之,若Fisher距离太小,则说明该特征在类型区分中,不能区分不同的运动想象脑电信号。为了使挑选出来的特征尽可能地包含反映脑电信号本质特征,我们引入贡献度概念,贡献度计算方法如下:

img161

其中tn表示贡献度,Sn表示从大到小排序后Fisher距离前n个距离之和。

Fisher距离之和随Fisher距离个数的变化曲线如图5-12所示。所有样本被分为训练样本集R和测试样本集T。对训练样本,选择贡献度t≥10-4,选取初步特征集合P。

img162

图5-12 不同特征数Fisher距离图

4.分类方法

1)基于统计理论分类方法

为了得到有效特征集和Pex(x=1,2),首先计算每一个训练样本在特征集P中的每一个特征到其他训练样本的相同特征的Fisher距离。计算样本k的第j个特征到两类训练样本的第j个特征的距离的计算公式如下:

img163

其中p(k,j)为样本k的第j个特征,q1(k,j)是样本k的第j个特征到第一类训练样本的同一个特征的距离,m是第一类训练样本的个数,q2(k,j)是样本k的第j个特征到第二类训练样本的同一个特征的距离,n是第一类训练样本的个数。

比较q1(k,j)和q2(k,j),如果样本k是第一类训练样本,且q1(k,j)较小,或者样本k为第二类训练样本,且q2(k,j)较小,则该特征j为样本k的有效特征,否则为无效特征。

对测试样本,根据前述步骤计算出能量熵,对于特征集合P中的每个特征,按下式计算其到训练样本中相应有效特征的距离:

img164

其中p(j)为学习样本的第j个特征,pe1(i)为第一类训练样本有效特征集中的第i个特征j,m为第一类训练样本中特征j的个数,pe2(i)为第二类训练样本有效特征集中的第i个特征j,n为第二类训练样本中特征j的个数。

则测试样本特征偏向矩阵Pc:

img165

根据特征偏向矩阵Pc中“1”和“2”的个数,就可以识别测试样本所属类型。

2)神经网络

本书采用多层BP神经网络来对四种想象运动脑电信号进行两两分类。两种类型采用一个输出单元进行编码;隐层包括20个单元;输入层包括200个单元,每一个单元输入一个特征,每根电极各100个特征。

本书使用traingdx学习算法来训练神经网络。该算法将动量批梯度下降算法和自适应修改学习率的算法有机地结合起来,动量批梯度下降算法可以有效避免出现局部最小问题,而自适应修改学习率可以在保证网络稳定性的情况下尽可能加快网络的训练速度。

对于每一个受试者的数据,首先由训练样本将神经网络训练到99.99%的分类准确率,然后利用训练好的神经网络对测试样本进行分类,其分类准确率作为性能评价指标。

3)支持向量机(SVM)

由Vapnik提出的支持向量机在分类、衰退和密度估算领域得到广泛的研究。支持向量机是一种由一组标号训练数据建立函数的方法。建立的函数可以是具有二元输出的分类函数,也可以是一般的回归函数。我们用支持向量机来进行分类,因此采用分类函数。对于分类而言,支持向量机会在输入样本空间中找到一个超曲面,这个超曲面要尽可能地将不同类的样本分开,并且超曲面与最近的样本的距离最大。但是,采用同样的超曲面对测试样本进行分类时,只能达到与训练样本相近的结果,不可能完全一致。

在本书中,支持向量机采用RBF核函数,该核函数能够实现非线性映射,且参数较少,不至于使模型太复杂。采用支持向量机进行分类时使用和BP神经网络相同的输入特征以及性能评价指标。

二、结果

1.能量熵随电极和想象运动变化

不同运动想象脑电信号在不同电极上能量熵不同,不同运动想象脑电信号能量熵在C3、C4电极上变换如图5-13所示:

img166

图5-13 四种类型能量熵图

根据刺激模式,运动想象从第3秒开始,到第7秒结束,总共持续4秒,这4秒的想象过程是一个持续过程。不同运动想象脑电信号能量变换趋势会有明显不同,这在能量熵上就可以体现出来。图5-13为C3、C4电极的四种运动想象脑电信号经过时频转换后,计算能量熵得出的结果。图5-13表明,对想象左手运动和想象右手运动而言,C3、C4电极的能量熵有明显区别。

2.分类识别率

对四种类型想象运动脑电信号每次取出两种划分成一组,则共有六组不同的组合——LR、LF、LT、RF、RT和FT。对每种组合进行分类,分类结果如表5-3所示,表中包括三个不同受试者(K3b、K6b、L1b)在不同类型组合下面的分类准确率,识别率为任意两根电极组合在该类型组合中所能达到最高的识别率,电极标号是最高识别率时的电极组合。

表5-3       不同类型间的分类识别率

img167

表5-3显示,对于每组数据,六种不同的想象运动类型组合的最高分类识别率都能达到90%以上。但是即使在使用相同的数据处理和分类方法的情况下,不同受试者的脑电信号的分类识别率也不尽相同。对不同电极组合进行计算的结果表明,不同受试者的相同运动想象脑电信号最高识别率所在脑区有所不同,例如对想象左右手运动,K3b的最高识别率出现在(28,33),K6b的最高识别率出现在(51,21),而L1b则出现在(26,36)。

表5-4所示为三组数据在相同的电极组合下,所能达到的最高平均识别率。

表5-4       三组数据的平均分类识别率

img168

3.不同分类方法比较

应用神经网络和支持向量机方法对K3b、L1b和K6b的四种不同的想象类型进行分类计算,对三组数据随机选取每种一半的样本作为训练样本,剩余样本作为测试样本,从中选取最高识别率,三种分类其结果如表5-5所示:

表5-5       不同分类器分类识别率

img169

表5-5表明,对于所有的三组被试数据,无论在哪两种想象运动的脑电信号的分类中,基于统计理论的分类方法的分类识别率都要明显高于BP神经网络和支持向量机这两种方法。

三、结论

想象运动脑电信号的分类无论对基础研究还是应用研究都具有重要的理论与现实意义,在临床应用中,较高的分类准确率可以提高脑机接口的输入和反馈信号的质量。

相关脑电信号分类研究的结果显示,所有的特征抽取方法都具有不同的表现,并且始终无法找到唯一的特征。因此,脑电信号分类被认为是一个典型的多变特征分类问题。

结果表明,能量熵可以体现想象运动脑电信号的特征,并且通过能量熵抽取的特征在分类时具有明显优势。采用能量熵和特定分类方法,三组不同受试者的脑电信号数据,共六种不同的想象运动类型组合,达到了85%的平均分类准确率。并且,我们相信分类准确率还有可能进一步提高,因为这里仅仅采用了最原始的Fisher距离来抽取特征,可能有一些有效特征被忽略了。

在以后的工作中,我们计划采用其他特征抽取方法来进一步提高分类准确率,并且将尝试少次甚至单次分类。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈