我非常喜欢插入符号的参数调整能力和统一的界面,但是我观察到,即使应用的“裸”模型允许使用NA,它始终需要完整的数据集(即没有NA)。这很麻烦,因为应该使用费力的插补方法,而这些方法一开始并不需要。一个人如何逃避归因并仍然使用插入符号优势?
3
您总是必须做一些缺少值的事情。我必须说我不太明白您的问题-您正在寻找一种“一刀切”的方法。如果您不想输入资产净值,那么您想对它们做什么?删除?
—
蒂姆
我想将NA留在那儿,然后留给模型处理NA。例如,如果我使用C50中的C5.0函数进行处理,它可以应付NA本身,但是在这种情况下,我不能使用插入符号,因为即使我想使用C5,插入符号的训练函数也不允许数据集中的NA。上述C50的功能为0。
—
Fredrik
但是“模型”的作用是要么忽略(删除)此数据,要么给您留下较小的样本;它估计(输入)这些值;或预测“ NA”类别(例如,在某些基于树的模型中)。您还希望您的“模型”做什么?某些软件会自动为您完成这些操作,但想象您的咖啡机为您提供了“默认”咖啡……有些软件是根据NA来制作“默认咖啡”的,但这并不是您能得到的最好的软件。
—
蒂姆
您确定插入符号不允许使用NA吗?我尝试在火车帮助页面中使用默认示例介绍NA,并且使用C5.0方法,火车可以正常工作。它因随机森林而失败。
—
mpiktas 2015年