我有大约20列(20个功能)的原始数据。其中有10个是连续数据,有10个是分类数据。某些分类数据可能具有50个不同的值(美国各州)。在我对数据进行预处理之后,连续的10列变成了10列准备好的列,而10个分类值变得像200个一键编码变量。我担心如果将所有这些200 + 10 = 210个特征都放入神经网络,那么200个热门特征(10个分类列)将完全占据10个连续特征。
也许一种方法是将列“分组”或类似的东西。这是一个有效的问题吗?有没有标准的方法可以解决这个问题?
(尽管我认为这没什么大不了,但我正在使用Keras。)
您是否考虑过使用两个(或多个)顺序模型,然后将它们合并?每个模型都有输入,可以更好地匹配输入的数据(而不是像香肠那样将其捣碎。)目标是相同的,但是您要制作两组训练数据,每组训练数据在拟合过程中都是独立供给的。合并之后立即出现最终输出层,因此最终层将决定哪种模型最适合特定样本。来自keras.io:keras.io/入门/ 顺序模型指南
—
photox
正是我想要的。感谢您的贡献。
—
user1367204
我尝试过此操作,并且合奏(模型_1,模型_2)的val_loss高于模型_1的val_loss且高于模型_2的val_loss。
—
user1367204
您是否实际尝试过此操作,并确定确实发生了此问题?您做了什么测试来检查这一点?结果如何?
—
休·珀金斯