早鸽—汇聚行业精英
  • 联系客服
  • 帮助中心
  • 投诉举报
  • 关注微信
400-006-1351
您的问题早鸽都有答案
3000+专业顾问
搜索
咨询

一种基于决策树的脑电信号特征选择方法

  • 专利名称
    一种基于决策树的脑电信号特征选择方法
  • 发明者
    段立娟, 葛卉, 周海燕, 乔元华, 马伟, 苗军
  • 公开日
    2014年6月25日
  • 申请日期
    2014年3月24日
  • 优先权日
    2014年3月24日
  • 申请人
    北京工业大学
  • 文档编号
    A61B5/0476GK103876734SQ201410112806
  • 关键字
  • 权利要求
    1.一种基于决策树的脑电信号特征选择方法,其特征在于,包括以下步骤 步骤I,采集数据; 受试者佩戴电极帽,想象上下移动屏幕上的光标;采集受试者脑电信号,得到训练样本集和测试样本集; 步骤2,进行数据预处理; 步骤2.1,数据重组; 将采集到的一个电极的训练样本集表示为一个m*p的矩阵,其中m表示训练样本集的样本量,P=r*t为样本集的维度,其中r表示采样率,t表示采样时间;将采集到的所有电极的训练样本集,按样本量不变、维度增加的方法重组成一个训练数据集,即重组成一个m*k的矩阵,k=a*p,其中a为记录电极的个数; 将采集到的一个电极的测试样本集表示为一个n*p的矩阵,其中η表示测试样本集的样本量;按照与训练样本集相同的处理方式,将所有电极的测试样本集重组成一个n*k的矩阵; 步骤2.2,数据分组; 将步骤2.1得到的测试数据集和训练数据集按照维度不变、增加样本量的方法组合成一个数据集,即一个h*k的矩阵,h=m+n ;然后再将此数据集按样本量平均地分成10份,其中训练数据是一个w*k的矩阵,w=0.9h,测试数据是一个g*k的矩阵,g=0.1h ; 步骤3,特征提取; 利用主成分分析法分别对训练数据和测试数据进行特征提取,得到特征向量,即将两个数据集均从k维数据降为d维数据,也就是将每个电极的数据从P维降到q维,其中d=a氺q ; 步骤4,特征选择; 将特征提取后的特征向量输入到决策树中,进行优势特征选择; 步骤5,进行脑电信号分类; 取出训练数据中c个特征对应的数据,形成新的训练样本,即一个w*c的矩阵;对测试样本做同样的工作,形成新的测试样本,即一个g*c的矩阵;将重组后的优势特征向量,包括训练样本、训练样本标签、测试样本、测试样本标签,输入到支持向量机分类器中,进行脑电信号分类,得到分类正确率; 步骤6,求分类正确率; 轮流选择步骤2.2所述的10份数据中的1份作为测试数据,其它9份作为训练数据,重复步骤3~5,共进行10次实验,求10次实验所得到分类正确率的平均值,得到最终的分类正确率2.根据权利要求1所述的一种基于决策树的脑电信号特征选择方法,其特征在于,步骤4所述优势特征选择的方法包括以下步骤 (I)构造决策树; 以代表训练样本的单个结点开始建树;结点存放的是一个属性;如果样本都在同一个类,则该结点成为树叶,并用该类标记;否则,使用成为信息增益的基于熵的度量为启发信息,选择能够最好地将样本分类的属性,即具有最高信息增益的属性;该属性成为该结点的“测试”或“判定”属性;对测试属性的每个已知的值,创建一个分支,并据此划分样本;重复上述过程,递归地形成每个划分上的样本决策树,当下列条件之一成立时停止 条件一给定结点的所有样本属于同一类; 条件二没有剩余属性可以用来进一步划分样本;在此情况下,采用多数表决,即将给定的结点转换成树叶,用样本中多数所在的类别标记它; 条件三对于根据测试属性的其中一个已知的值创建的分支中没有样本;在这种情况下,以样本中多数类创建一个树叶; 按照上述方法构造一棵具有非叶结点、分支和树叶的完全决策树;对于d维的训练数据来说,对应有d个属性;树的结点存放着属性Ai,其中i=l,2,...,(!;根据分支Ai=aj划分样本,其中aj是属性Ai的一个已知的值,j=l, 2,…,w,;树叶存放着结点样本的类别标签; (2)修剪决策树; 对于完全决策树中的每一个非叶结点的子树,尝试将其替换成一个叶结点,该叶结点的类别用子树所覆盖训练样本中存在最多的那个类来代替,这样就产生了一个简化决策树;然后,比较完全决策树和简化决策树在测试数据集中的表现,如果简化决策树在测试数据集中的错误比较少,并且该子树里面没有包含另外一个具有类似特性的子树,那么该子树就可以替换成叶结点;所述类似特性是指把子树替换成叶结点后其测试数据集误判率降低的特性;以这种自下而上的方式遍历所有的子树,直至没有任何子树可以替换使得测试数据集的表现得以改进时,修剪便终止,得到最终的简化树; 此时简化树有c个非叶结点,对应数据集中的c个属性,即c个特征,称这c个特征为优势特征,而数据集中剩余的 特征 为非优势特征
  • 技术领域
    [0001]本发明涉及脑电研究中的脑电信号分析方法,特别是涉及脑电信号特征选择方法
  • 专利摘要
    本发明涉及一种基于决策树的脑电信号特征选择方法。首先将采集的多通道脑电信号进行预处理;然后利用主成分分析法对预处理后的脑电信号进行特征提取,得到特征向量;将特征提取后的特征向量输入到决策树中,进行优势特征选择;对决策树选出的优势特征进行重组;最后将重组后的优势特征向量输入到支持向量机中,进行脑电信号分类,得到分类正确率。本发明应用决策树进行优势特征选择,操作简单,无需人工参与,节省时间和人力。应用决策树进行优势特征选择,选择过程中避免了人的主观因素的影响,使选择更客观,分类正确率更高。实验表明,运用本发明方法进行脑电信号分类的平均正确率为89.1%,比运用传统的优势电极重组法提高了0.9%。
  • 发明内容
  • 专利说明
    一种基于决策树的脑电信号特征选择方法
  • 专利详情
  • 全文pdf
  • 权力要求
  • 说明书
  • 法律状态
一种基于决策树的脑电信号特征选择方法[0002]人的大脑是一个非常复杂的系统,脑电信号(Electroencephalograph, EEG)是通过头皮覆盖电极和导电介质采集到的大脑神经元细胞的放电活动,包含了大量的表征人体生理心理状态的信息。脑电信号的研究是当今科学研究中非常前沿的领域之一,涉及脑电信号的采集、预处理、处理以及脑电信号的应用等多个方面,对认知科学、神经科学、心理学、病理生理学、信息与信号处理、计算机科学、生物技术、生物医学工程乃至应用数学等多个领域的研究都有极其重要的作用。随着脑科学的日益热门,越来越多的研究人员都投入到了脑电信号的研究热潮中。[0003]由于大脑结构的复杂性,大脑活动会引发大脑某个区域或多个区域的放电。为了更加精细而全面地采集到大脑活动区域的EEG信号,研究人员在需要在被试大脑的不同位置采集EEG信号。目前的采集装置基本采用多通道方式,如较常见的有40导、64导、128导和256导电极帽等等。由于脑电信号的采集精度为毫秒级,导致单电极脑电数据具有很高的属性维度,并行处理多导联数据时,脑电数据的维度会更高。另外,根据心理学研究发现,不同的刺激或实验任务会激活不同的大脑功能区,更深入地从大脑生理结构来讲,不同的刺激或实验任务会导致大脑的不同结构的神经元细胞产生放电行为。又根据脑电信号的特征可知,我们采集到的EEG信号有很多冗余信息。因此,在脑电信号的研究过程中,无论是出于减少数据维度的考虑,还是去除无效冗余电极或冗余信息的考虑,对电极的筛选是不可缺少的环节。[0004]传统的电极选择(空间特征选择)方法一般是优势电极重组法,即依据人工统计单个电极的分类效果来选择优势电极(对整体的分类正确率有提升或者没有下降的电极)。该方法有两点不足:(I)依靠主观经验选择电极,容易造成信息偏失;(2)人工操作复杂,费时耗力。
[0005]针对上述传统的电极选择方法的不足,本发明提出一种基于决策树的脑电信号特征选择方法。该方法充分利用决策树自动选择优势属性(优势特征)的这一特点,使特征选择更客观,从而使脑电信号的分类正确率更高。[0006]实现本发明方法的主要思路是:将采集的多通道脑电信号进行预处理;利用主成分分析法(PCA)对预处理后的脑电信号进行特征提取,得到特征向量;将特征提取后的特征向量输入到决策树中,进行优势特征选择;对决策树选择出的优势特征进行重组;将重组后的优势特征向量输入到支持向量机(SVM)中,进行EEG信号分类,得到分类正确率。[0007]—种基于决策树的脑电信号特征选择方法,包括如下步骤:[0008](1)采集数据[0009]受试者佩戴电极帽,想象上下移动屏幕上的光标。采集受试者脑电信号,得到训练样本集和测试样本集。[0010](2)数据预处理
[0011]将采集到的所有电极的训练样本集,按样本量不变、维度增加的方法重组成一个训练数据集,即重组成一个矩阵;用同样的方式处理所有电极的测试样本集,得到测试数据集。
[0012]将预处理后的测试数据集和训练数据集以维度不变、增加样本量的方法组合成一个数据集,然后再将此数据集平均地分成10份,将其中1份作为测试数据,其它9份作为训练数据。
[0013](3)特征提取
[0014]利用PCA对训练数据集和测试数据集进行降维,得到降维后的特征向量。
[0015](4)特征选择
[0016]利用决策树对降维后的特征向量进行优势特征选择,得到优势特征在数据集中的位置;再将优势特征对应位置的数据,按样本量不变、维度增加的方法进行重组,得到优势特征向量。
[0017](5)分类
[0018]将重组后的优势特征向量输入到SVM分类器中,进行EEG信号分类,求分类正确率。
[0019](6)求分类正确率
[0020]轮流选择步骤(2)所述的10份数据中的1份作为测试数据,其它9份作为训练数据,重复步骤(3)、(4)、(5),共进行10次实验,求10次实验所得到分类正确率的平均值,得到最终的分类正确率。
[0021]与现有技术相比,本发明具有以下明显的优势和有益效果:
[0022](1)本发明应用决策树进行优势特征选择,操作简单,无需人工参与,节省时间和人力。
[0023](2)本发明应用决策树进行优势特征选择,选择过程中避免了人的主观因素的影响,使选择更客观,分类正确率更高。实验表明,运用本发明方法进行EEG信号分类的平均正确率为89.1%,比运用传统的优势电极重组法提高了 0.9%。



[0024]图1为本发明所涉及方法的流程图;
[0025]图2为记录电极在头皮表面的位置分布;
[0026]图3为决策树的子树的结构示意图。

[0027]下面结合附图和对本发明做进一步的描述。
[0028]本发明所涉及方法的流程图如图1所示,包括以下步骤:
[0029]步骤1,采集数据。[0030]将本发明所述方法应用到BCI2003竞赛标准数据集Data Set Ia上。数据采自于I个健康的受试者。被试者的实验任务是通过想象使屏幕上的光标上下移动,而想象所诱发的成分是低频的皮层慢电位(Slow Cortical Potential, SCP),他的皮层电位被Cz电极记录。每次实验持续时间为6秒。在0.5s~6s内,计算机屏幕上方或下方有一个高亮度的指示条,暗示被试者需要将屏幕中间的光标向上或向下移动,移动规则是:当SCP为正时光标下移,SCP为负时光标上移。其中在2s~5.5内,被试者接受来自Cz电极的SCP幅度反馈信息,该信息在屏幕下方以一个长度正比于SCP幅度的亮条显示,此时被试者的EEG信号被以256Hz的采样率记录下来,记录电极分别位于六1、八2、?3、?4、?3、?4这六个位置,而最终用于信号处理的数据就是这3.5s内所记录到的信息反馈阶段的两种类型的脑电信号。各个电极在头皮表面的位置如图2所示。
[0031]实验共采集到两组实验数据集:训练数据集和测试数据集,其中训练数据集用于训练分类器,而测试数据集用于判断分类器的性能。由于本实验只采集了两种类型的脑电信号,所以数据的类别预测问题是一个两个类的分类问题,类别标签分别是O和1,其中O表不向下移动光标对应的信号类别,I表不向上移动光标对应的信号类别。
[0032]步骤2,进行数据预处理。
[0033]步骤2.1,数据重组。
[0034]将米集到的一个电极的训练样本集表不为一个m*p的矩阵,其中m表不训练样本集的样本量,p=r*t为样本集的维度,其中r表示采样率,t表示采样时间;将采集到的所有电极的训练样本集,按样本量不变、维度增加的方法重组成一个训练数据集,即重组成一个m*k的矩阵,k=a*p,其中 a为记录电极的个数。
[0035]将采集到的一个电极的测试样本集表示为一个n*p的矩阵,其中η表示测试样本集的样本量。按照与训练样本集相同的处理方式,将所有电极的测试样本集重组成一个n*k的矩阵。
[0036]步骤2.2,数据分组。
[0037]将步骤2.1得到的测试数据集和训练数据集以维度不变、增加样本量的方法组合成一个数据集,即一个h*k的矩阵,h=m+n。然后再将此数据集按样本量平均地分成10份,其中训练数据是一个w*k的矩阵,w=0.9h,测试数据是一个g*k的矩阵,g=0.lh。
[0038]步骤3,特征提取。
[0039]利用PCA分别对训练数据和测试数据进行特征提取,得到特征向量,即将两个数据集均从k维数据降为d维数据,也就是将每个电极的数据从P维降到q维,其中d=a*q。
[0040]步骤4,特征选择。
[0041]将特征提取后的特征向量输入到决策树中,进行优势特征选择。这一过程具体包括以下两个步骤:
[0042]步骤4.1,构造决策树。
[0043]以代表训练样本的单个结点开始建树。结点存放的是一个属性。如果样本都在同一个类,则该结点成为树叶,并用该类标记;否则,使用成为信息增益的基于熵的度量为启发信息,选择能够最好地将样本分类的属性,即具有最高信息增益的属性。该属性成为该结点的“测试”或“判定”属性。对测试属性的每个已知的值,创建一个分支,并据此划分样本。重复上述过程,递归地形成每个划分上的样本决策树,当下列条件之一成立时停止:[0044]条件一:给定结点的所有样本属于同一类;
[0045]条件二:没有剩余属性可以用来进一步划分样本。在此情况下,采用多数表决,即将给定的结点转换成树叶,用样本中多数所在的类别标记它;
[0046]条件三:对于根据测试属性的其中一个已知的值创建的分支中没有样本。在这种情况下,以样本中多数类创建一个树叶。
[0047]按照上述方法构造一棵具有非叶结点、分支和树叶(叶结点)的完全决策树。对于d维的训练数据来说,对应有d个属性。树的结点存放着属性Ai,其中i=l,2,一,d。根据分支A1-=aj划分样本,其中aj是属性Ai的一个已知的值,j=l, 2,..., w,。树叶存放着结点样本的类别标签。决策树的一棵子树的结构如图3所示。
[0048]步骤4.2,修剪决策树。
[0049]对于完全决策树中的每一个非叶结点的子树,尝试将其替换成一个叶结点,该叶结点的类别用子树所覆盖训练样本中存在最多的那个类来代替,这样就产生了一个简化决策树。然后,比较完全决策树和简化决策树在测试数据集中的表现,如果简化决策树在测试数据集中的错误比较少,并且该子树里面没有包含另外一个具有类似特性的子树,所谓类似的特性是指把子树替换成叶结点后其测试数据集误判率降低的特性,那么该子树就可以替换成叶结点。以这种自下而上的方式遍历所有的子树,直至没有任何子树可以替换使得测试数据集的表现得以改进时,修剪便终止,得到最终的简化树。
[0050]此时简化树有c个非叶结点,对应数据集中的c个属性(即特征),称这c个特征为优势特征(对分类效果相对帮助较大的特征),而数据集中剩余的特征为非优势特征。
[0051]步骤5,进行EEG信号分类。
[0052]取出训练数据中c个特征对应的数据,形成新的训练样本,即一个w*c的矩阵。对测试样本做同样的工作,形成新的测试样本,即一个g*c的矩阵。将重组后的优势特征向量,包括训练样本、训练样本标签、测试样本、测试样本标签,输入到SVM分类器中,进行EEG信号分类,得到分类正确率。
[0053]步骤6,求分类正确率。
[0054]轮流选择步骤2.2所述的10份数据中的1份作为测试数据,其它9份作为训练数据,重复步骤3~5,共进行10次实验,求10次实验所得到分类正确率的平均值,得到最终的分类正确率。
[0055]为了验证本发明的有效性,以及与传统的运用优势电极重组分类法相比性能的优劣,进行了一组对比实验,两种分类方法的正确率如表1所示。
[0056]表1本发明与传统方法分类正确率的比较
[0057]

查看更多专利详情