Questions tagged «machine-learning»

有关机器学习算法的实现问题。有关机器学习的一般问题应发布到其特定社区。




5
朴素贝叶斯分类的简单解释
我发现很难理解朴素贝叶斯的过程,而且我想知道是否有人可以用简单的英语逐步过程来解释它。我知道它会将发生的时间进行比较作为概率,但是我不知道训练数据与实际数据集之间的关系。 请给我解释一下培训集扮演的角色。我在这里举一个非常简单的水果示例,例如香蕉 training set--- round-red round-orange oblong-yellow round-red dataset---- round-red round-orange round-red round-orange oblong-yellow round-red round-orange oblong-yellow oblong-yellow round-red

18
Google如何表达“您的意思?” 算法工作?
我一直在为投资组合管理工具开发内部网站。有很多文本数据,公司名称等。我对某些搜索引擎能够以“您的意思是:xxxx”快速响应查询的能力印象深刻。 我需要能够智能地进行用户查询,并不仅要响应原始搜索结果,还要响应“您是不是要这么做?” 当有非常可能的替代答案时的响应等 [我正在ASP.NET中开发(VB-不要反对我!)] 更新:好的,如果没有成千上万的“未付费用户”,我该如何模仿呢? 为每个“已知”或“正确”术语生成拼写错误并执行查找? 还有其他更优雅的方法吗?


6
人工神经网络比支持向量机有什么优势?[关闭]
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心以获取指导。 7年前关闭。 ANN(人工神经网络)和SVM(支持向量机)是有监督的机器学习和分类的两种流行策略。哪种方法更适合特定项目通常不是很清楚,我敢肯定答案总是“取决于情况”。通常,将两者与贝叶斯分类一起使用。 关于ANN与SVM的关于Stackoverflow的这些问题已经被提出: ANN和SVM分类 我的分类问题中ANN,SVM和KNN之间有什么区别 支持矢量机还是人工神经网络进行文本处理? 在这个问题中,我想具体了解ANN(特别是多层感知器)的哪些方面可能会使其更适合在SVM上使用?我问的原因是因为很容易回答相反的问题问题:支持向量机通常优于ANN,因为它们避免了ANN的两个主要缺点: (1)ANN通常会收敛于局部最小值而不是全局最小值,这意味着它们有时本质上是“缺少全局”(或缺少树木的森林) (2)人工神经网络经常过拟合如果训练时间太长,,这意味着对于任何给定的模式,神经网络可能会开始将噪声视为模式的一部分。 SVM不会遇到这两个问题。然而,将SVM完全替代ANN并不是很容易。那么,与支持向量机相比,人工神经网络具有哪些特定的优势,可能使其适用于某些情况?我已经列出了SVM相对于ANN的特定优势,现在,我希望看到ANN优势的列表(如果有)。

7
什么是logits,softmax和softmax_cross_entropy_with_logits?
我正在这里浏览tensorflow API文档。在tensorflow文档中,他们使用了名为的关键字logits。它是什么?API文档中的许多方法都将其编写为 tf.nn.softmax(logits, name=None) 如果写的是什么是那些logits只Tensors,为什么保持一个不同的名称,如logits? 另一件事是,我无法区分两种方法。他们是 tf.nn.softmax(logits, name=None) tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 它们之间有什么区别?这些文档对我来说还不清楚。我知道是什么tf.nn.softmax呢。但是没有其他。一个例子将非常有帮助。

29
监督学习和无监督学习有什么区别?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 28天前关闭。 改善这个问题 在人工智能和机器学习方面,有监督学习和无监督学习有什么区别?您能否通过示例提供基本,简单的说明?


22
如何在Python中实现Softmax函数
从Udacity的深度学习类中,y_i的softmax只是指数除以整个Y向量的指数和: 其中S(y_i),y_i和的softmax函数e是指数,并且j是否。输入向量Y中的列数。 我尝试了以下方法: import numpy as np def softmax(x): """Compute softmax values for each sets of scores in x.""" e_x = np.exp(x - np.max(x)) return e_x / e_x.sum() scores = [3.0, 1.0, 0.2] print(softmax(scores)) 返回: [ 0.8360188 0.11314284 0.05083836] 但是建议的解决方案是: def softmax(x): """Compute softmax values for each sets of scores …



10
通常选择哪种机器学习分类器?[关闭]
已关闭。这个问题是基于观点的。它当前不接受答案。 想改善这个问题吗?更新问题,以便通过编辑此帖子以事实和引文回答。 去年关闭。 改善这个问题 假设我正在处理一些分类问题。(欺诈检测和垃圾评论是我目前正在研究的两个问题,但我对总体上的任何分类任务感到好奇。) 我怎么知道应该使用哪个分类器? 决策树 支持向量机 贝叶斯 神经网络 K近邻 Q学习 遗传算法 马尔可夫决策过程 卷积神经网络 线性回归或逻辑回归 提振,装袋,诱人 随机爬山或模拟退火 ... 在哪些情况下是“自然”的首选,选择该原则的原则是什么? 我正在寻找的答案类型的示例(摘自Manning等人的“信息检索简介”书): 一个。如果您的数据带有标签,但数量有限,则应使用偏差较大的分类器(例如,朴素贝叶斯)。 我猜这是因为偏高的分类器具有较低的方差,这很好,因为数据量少。 b。如果您有大量数据,则分类器实际上并不重要,因此您应该只选择具有良好可伸缩性的分类器。 还有哪些其他准则?即使是诸如“如果您必须向某个高级管理人员解释模型,那么您也应该使用决策树,因为决策规则是相当透明的”之类的答案是好的。不过,我不太关心实现/库问题。 此外,除了标准的贝叶斯分类器外,还有一个单独的问题,是否有“标准的最新技术”用于检测垃圾邮件(与电子邮件垃圾邮件相对)?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.