5 什么时候模型不足? 逻辑经常指出,通过对模型进行拟合,可以增强其概括能力。就是说,显然,在某个时候,模型的拟合不足会导致模型变得更糟,无论数据的复杂性如何。 您怎么知道您的模型何时达到了适当的平衡,并且不符合其要建模的数据? 注意:这是我的问题“ 为什么过度拟合不好? ” 的后续措施。 56 efficiency algorithms parameter
6 模型超参数和模型参数有什么区别? 我注意到,诸如模型超参数和模型参数之类的术语已在网上互换使用,而无需事先说明。我认为这是不正确的,需要解释。考虑一下一个机器学习模型,一个基于SVM / NN / NB的分类器或图像识别器,然后才想到任何东西。 模型的超参数和参数是什么? 请给你例子。 28 machine-learning parameter hyperparameter language-model
2 alpha和beta超参数在潜在Dirichlet分配中起什么作用? LDA有两个超参数,对其进行调整会更改所引发的主题。 α和β超参数对LDA有什么影响? 如果一个或另一个超参数增加或减少,主题将如何改变? 为什么它们是超参数,而不仅仅是参数? 19 topic-model lda parameter
3 最佳科学计算语言[关闭] 已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 5年前关闭。 似乎大多数语言都具有一定数量的科学计算库。 Python有 Scipy Rust 有 SciRust C++有几个包括ViennaCL和Armadillo Java具有Java Numerics和Colt其他几个 且不说像语言R和Julia明确的科学计算而设计。 有这么多种选择,您如何选择适合任务的最佳语言?另外,哪种语言的性能最高?Python并且R似乎在该领域具有最大的吸引力,但从逻辑上讲,编译语言似乎是一个更好的选择。会有什么表现胜过Fortran?此外编译语言往往有GPU加速,而解释性语言如R并Python没有。选择一种语言时应该考虑什么?哪些语言可以在效用和性能之间取得最佳平衡?还有我错过的具有重要科学计算资源的语言吗? 10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system