Questions tagged «feature-construction»


3
如何结合分类和连续输入特征进行神经网络训练
假设我们有两种输入功能,即分类输入和连续输入。分类数据可以表示为单热码A,而连续数据只是N维空间中的向量B。似乎仅使用concat(A,B)并不是一个好选择,因为A,B是完全不同的数据。例如,与B不同,A中没有数字顺序。因此,我的问题是如何组合这两种数据,或者是否有任何常规方法来处理它们。 实际上,我提出了一个朴素的结构,如图所示 如您所见,前几层用于将数据A更改(或映射)到连续空间中的某个中间输出,然后将其与数据B合并,形成连续空间中新的输入要素,供以后的层使用。我不知道这是合理的还是仅仅是“试错”的游戏。谢谢。

4
这是要素工程的良好做法吗?
我有一个有关功能工程的实际问题...说我想通过逻辑回归来预测房价,并使用了包括邮政编码在内的许多功能。然后,通过检查功能的重要性,我意识到zip是一个很好的功能,因此我决定基于zip添加更多功能-例如,我去了人口普查局,并获得了平均收入,人口,学校数量和数量每个邮局的医院。有了这四个新功能,我现在发现模型性能更好。因此,我添加了更多与zip相关的功能...这个循环一直在进行。最终,模型将由这些与zip相关的功能所主导,对吗? 我的问题: 首先做这些有意义吗? 如果是,我怎么知道什么时候该停止这个周期? 如果没有,为什么不呢?

2
测试数据的功能少于训练数据时该怎么办?
假设我们正在预测商店的销售量,而我的培训数据具有两组功能: 关于带有日期的商店销售的一项(“商店”字段不是唯一的) 一种关于商店类型(此处的“商店”字段是唯一的) 所以矩阵看起来像这样: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | Date | Sales | Customers | Open | Promo | StateHoliday | +-------+-----------+------------+---------+-----------+------+-------+--------------+ | 1 | 5 | 2015-07-31 | 5263.0 | 555.0 | 1 | 1 | 0 | | 2 | 5 | 2015-07-31 | 6064.0 | 625.0 …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.