14 线性回归和逻辑回归之间有什么区别? 当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归。我相信我们可以使用线性回归来根据输入值来预测结果的值。 那么,两种方法有什么区别? 242 machine-learning data-mining linear-regression
10 有人可以用非常简单的图形方式给出余弦相似度的例子吗? 维基百科上的余弦相似度文章 您可以在此处(列表或其他形式)显示矢量,然后进行数学运算,然后让我们看看它是如何工作的吗? 我是初学者。 201 text data-mining cosine-similarity
21 数据挖掘中分类和聚类之间的区别?[关闭] 已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 去年关闭。 改善这个问题 有人可以解释一下数据挖掘中分类和聚类之间的区别吗? 如果可以,请提供两个示例以了解主要思想。 195 machine-learning classification cluster-analysis data-mining terminology
8 Amazon Recommendation功能如何工作? 亚马逊推荐技术的屏幕背后是什么技术?我认为,亚马逊的推荐目前是市场上最好的,但是它们如何为我们提供这样的相关推荐呢? 最近,我们参与了类似的推荐类项目,但是肯定希望从技术角度了解Amazon推荐技术的来龙去脉。 任何输入将不胜感激。 更新: 该专利说明了如何进行个性化推荐,但这不是技术性的问题,因此,如果可以提供一些见解,那将是非常好的。 根据Dave的评论,亲和力分析构成了此类推荐引擎的基础。另外,这里还有一些有关该主题的好读物 揭秘市场篮子分析 市场篮分析 亲和力分析 建议阅读: 数据挖掘:概念和技术 144 algorithm language-agnostic data-mining
3 为什么一种热编码可以提高机器学习性能? 我注意到,将One Hot编码用于特定数据集(矩阵)并用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面具有明显更好的结果。如何提高性能? 127 machine-learning data-mining scikit-learn data-analysis
8 期望最大化技术的直观解释是什么?[关闭] 已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 2年前关闭。 改善这个问题 期望最大化(EM)是一种对数据进行分类的概率方法。如果不是分类器,如果我错了,请纠正我。 这种EM技术的直观解释是什么?expectation这里是什么,现在是maximized什么? 109 machine-learning cluster-analysis data-mining mathematical-optimization expectation-maximization
5 为什么F量度是Precision和Recall量度的谐波平均值而不是算术平均值? 当我们同时考虑“精度”和“查全率”来计算F测度时,我们将两个测度的谐波均值而不是简单的算术平均值。 采用谐波均值而不是简单平均值的直观原因是什么? 85 machine-learning classification data-mining
2 一维数字数组聚类 所以说我有一个像这样的数组: [1,1,2,3,10,11,13,67,71] 有没有一种方便的方法可以将数组划分为类似的内容? [[1,1,2,3],[10,11,13],[67,71]] 我浏览了类似的问题,但大多数人建议使用k均值对点进行聚类,例如scipy,对于像我这样的初学者来说,这非常令人困惑。我也认为k均值更适合于二维或二维聚类,对吗?有什么方法可以将N个数字的数组划分为多个分区/集群,具体取决于数字吗? 有人还建议进行严格范围划分,但并不总是能按预期呈现结果 75 arrays cluster-analysis data-mining dimension partition-problem