因此,我了解到,在训练HMM进行分类时,标准方法是:
- 将您的数据集分为每个类别的数据集
- 每班训练一名HMM
- 在测试集中比较每个模型对每个窗口进行分类的可能性
但是,我该如何在每堂课上训练HMM?我是否只是将有关一类的数据串联在一起?但是时间序列数据不是按顺序排列的吗?如果我这样做,那是说某些数据点是连续的,而不是连续的吗?
更具体地说,我有一些EEG数据,它是一个96xT矩阵,其中有96个特征向量,这些特征向量是来自不同通道的不同频率的功率谱密度,T是信号的时间长度(在某些采样率下)
可以将其划分为多个窗口,这些窗口可以从实验协议中得知(数据带有标签),因此我可以为每个类收集96 * t矩阵的集合。其中t小于T并表示每个窗口的大小。
然后如何在此数据上训练HMM?如果有帮助,我尝试使用pmtk3工具包,但我愿意使用任何东西-它必须能够处理实值观测值,因为功率谱密度是连续的而不是离散的(默认的MATLAB工具箱只能处理离散观察)。
目的是能够根据训练过的标记数据将脑电数据窗口分类为给定的心理状态。它是使用Berlin BCI Competition数据的人机界面问题。