Questions tagged «self-study»

3
如何自学数据科学?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 4年前关闭。 我是一名自学成才的Web开发人员,并且对自学数据科学感兴趣,但是我不确定如何开始。特别是,我想知道: 数据科学有哪些领域?(例如,人工智能,机器学习,数据分析等) 人们可以推荐在线课程吗? 是否有可供我练习的项目(例如,开放数据集)。 我可以申请或完成认证吗?

1
梯度提升树:“变量越大越好”?
从XGBoost 的教程中,我认为当每棵树长大时,将扫描所有变量以选择拆分节点,然后选择具有最大增益拆分的变量。所以我的问题是,如果我将一些噪声变量添加到数据集中,这些噪声变量会影响变量选择(对于每棵树生长)吗?我的逻辑是,由于这些噪声变量根本不会给出最大的增益分配,因此将永远不会选择它们,因此它们不会影响树的生长。 如果答案是肯定的,那么“ XGBoost变量越多越好”是真的吗?我们不考虑培训时间。 同样,如果答案是肯定的,那么“我们不需要从模型中滤除非重要变量”是否成立。 谢谢!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.