程序设计 data-mining

14

线性回归和逻辑回归之间有什么区别？

当我们必须预测分类（或离散）结果的值时，我们使用逻辑回归。我相信我们可以使用线性回归来根据输入值来预测结果的值。那么，两种方法有什么区别？

242 machine-learning data-mining linear-regression

10

有人可以用非常简单的图形方式给出余弦相似度的例子吗？

维基百科上的余弦相似度文章您可以在此处（列表或其他形式）显示矢量，然后进行数学运算，然后让我们看看它是如何工作的吗？我是初学者。

201 text data-mining cosine-similarity

21

数据挖掘中分类和聚类之间的区别？[关闭]

已关闭。这个问题需要更加集中。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过编辑此帖子来关注一个问题。去年关闭。改善这个问题有人可以解释一下数据挖掘中分类和聚类之间的区别吗？如果可以，请提供两个示例以了解主要思想。

195 machine-learning classification cluster-analysis data-mining terminology

8

Amazon Recommendation功能如何工作？

亚马逊推荐技术的屏幕背后是什么技术？我认为，亚马逊的推荐目前是市场上最好的，但是它们如何为我们提供这样的相关推荐呢？最近，我们参与了类似的推荐类项目，但是肯定希望从技术角度了解Amazon推荐技术的来龙去脉。任何输入将不胜感激。更新：该专利说明了如何进行个性化推荐，但这不是技术性的问题，因此，如果可以提供一些见解，那将是非常好的。根据Dave的评论，亲和力分析构成了此类推荐引擎的基础。另外，这里还有一些有关该主题的好读物揭秘市场篮子分析市场篮分析亲和力分析建议阅读：数据挖掘：概念和技术

144 algorithm language-agnostic data-mining

3

为什么一种热编码可以提高机器学习性能？

我注意到，将One Hot编码用于特定数据集（矩阵）并用作学习算法的训练数据时，与使用原始矩阵本身作为训练数据相比，它在预测准确性方面具有明显更好的结果。如何提高性能？

127 machine-learning data-mining scikit-learn data-analysis

8

期望最大化技术的直观解释是什么？[关闭]

已关闭。这个问题需要更加集中。它当前不接受答案。想改善这个问题吗？更新问题，使其仅通过编辑此帖子来关注一个问题。 2年前关闭。改善这个问题期望最大化（EM）是一种对数据进行分类的概率方法。如果不是分类器，如果我错了，请纠正我。这种EM技术的直观解释是什么？expectation这里是什么，现在是maximized什么？

109 machine-learning cluster-analysis data-mining mathematical-optimization expectation-maximization

5

为什么F量度是Precision和Recall量度的谐波平均值而不是算术平均值？

当我们同时考虑“精度”和“查全率”来计算F测度时，我们将两个测度的谐波均值而不是简单的算术平均值。采用谐波均值而不是简单平均值的直观原因是什么？

85 machine-learning classification data-mining

2

一维数字数组聚类

所以说我有一个像这样的数组： [1,1,2,3,10,11,13,67,71] 有没有一种方便的方法可以将数组划分为类似的内容？ [[1,1,2,3],[10,11,13],[67,71]] 我浏览了类似的问题，但大多数人建议使用k均值对点进行聚类，例如scipy，对于像我这样的初学者来说，这非常令人困惑。我也认为k均值更适合于二维或二维聚类，对吗？有什么方法可以将N个数字的数组划分为多个分区/集群，具体取决于数字吗？有人还建议进行严格范围划分，但并不总是能按预期呈现结果

75 arrays cluster-analysis data-mining dimension partition-problem

Questions tagged «data-mining»