Questions tagged «svm»

支持向量机是指“一组相关的监督学习方法,用于分析数据和识别模式,用于分类和回归分析。”


5
使用SVM或神经网络时如何将分类变量重新编码为数值变量
要使用SVM或神经网络,需要将分类变量转换(编码)为数字变量,在这种情况下,通常的方法是使用0-1二进制值,将第k个分类值转换为(0,0,.. 。,1,0,... 0)(1在第k个位置)。还有其他方法可以做到这一点,尤其是当存在大量分类值(例如10000),使得0-1表示将在神经网络中引入大量额外的维度(输入单位)时,这似乎不是很理想或期望的? 我在问一般策略。

3
半监督学习,主动学习和深度学习进行分类
最终编辑,所有资源已更新: 对于一个项目,我正在应用机器学习算法进行分类。 挑战: 有限的标记数据和更多的未标记数据。 目标: 应用半监督分类 应用某种程度上的半监督式标签过程(称为主动学习) 我从研究论文中发现了很多信息,例如应用EM,Transductive SVM或S3VM(半监督SVM),或者以某种方式使用LDA等。关于该主题的书籍也很少。 问题: 实现方式和实际来源在哪里? 最终更新(基于mpiktas,bayer和Dikran Marsupial提供的帮助) 半监督学习: TSVM:位于SVMligth和SVMlin中。 EM朴素贝叶斯(Python) EM在LinePipe项目中 主动学习: 二元论:一种主动学习的实现,带有文本分类源代码 该网页很好地概述了主动学习。 实验设计研讨会:此处。 深度学习: 此处的介绍性视频。 一般网站。 斯坦福无监督特征学习和深度学习教程。

1
什么是“功能空间”?
“特征空间”的解释是什么? 例如,当阅读有关SVM的内容时,我阅读了有关“映射到要素空间”的信息。在阅读有关CART的文章时,我阅读了有关“分区到要素空间”的信息。 我了解正在发生的事情,尤其是对于CART,但是我认为我错过了一些定义。 有“特征空间”的一般定义吗? 是否有定义可以使我更深入地了解SVM内核和/或CART?

1
如何处理具有分类属性的SVM
我有35个维度的空间(属性)。我的分析问题是一个简单的分类问题。 在35个维度中,超过25个是分类类别,每个属性采用50多种类型的值。 在这种情况下,引入虚拟变量对我也不起作用。 如何在具有很多分类属性的空间上运行SVM?



2
执行多类SVM的最佳方法
我知道SVM是二进制分类器。我想将其扩展到多类SVM。哪种方法是最好的,也许是最简单的? 代码:在MATLAB中 u=unique(TrainLabel); N=length(u); if(N>2) itr=1; classes=0; while((classes~=1)&&(itr<=length(u))) c1=(TrainLabel==u(itr)); newClass=double(c1); tst = double((TestLabel == itr)); model = svmtrain(newClass, TrainVec, '-c 1 -g 0.00154'); [predict_label, accuracy, dec_values] = svmpredict(tst, TestVec, model); itr=itr+1; end itr=itr-1; end 如何改善呢?

1
随机厨房水槽如何工作?
去年在NIPS 2017上,阿里·拉希米(Ali Rahimi)和本·雷赫特(Ben Recht)的论文“大型内核机器的随机特征” 获得了时间测试奖,他们引入了随机特征,后来被编纂为随机厨房水槽算法。作为公开发表论文的一部分,他们表明可以在5行Matlab中实现他们的模型。 % Approximates Gaussian Process regression % with Gaussian kernel of variance gamma^2 % lambda: regularization parameter % dataset: X is dxN, y is 1xN % test: xtest is dx1 % D: dimensionality of random feature % training w = randn(D,d); b = 2 * pi …

1
测验:通过分类边界告诉分类器
给出以下6个决策边界。决策边界是紫罗兰色线。点和十字是两个不同的数据集。我们必须确定哪个是: 线性支持向量机 内核化SVM(2阶多项式内核) 感知器 逻辑回归 神经网络(1个隐藏层和10个整流线性单元) 神经网络(1个隐藏层,具有10 tanh单位) 我想要解决方案。但更重要的是,了解差异。例如,我会说c)是线性SVM。决策边界是线性的。但是我们也可以使线性SVM决策边界的坐标均匀化。d)核化的SVM,因为它是多项式阶数2。f)由于“粗糙”的边缘,因此校正了神经网络。也许a)逻辑回归:它也是线性分类器,但基于概率。

1
朴素贝叶斯何时比SVM表现更好?
在我正在研究的一个小型文本分类问题中,朴素贝叶斯(Naive Bayes)表现出与SVM相似或更高的性能,我感到非常困惑。 我想知道是什么因素决定一种算法胜过另一种算法。是否存在没有必要在SVM上使用朴素贝叶斯的情况?有人可以阐明这一点吗?

1
如何了解RBF SVM的效果
我如何了解SVM中的RBF内核?我的意思是我理解数学,但是有什么办法可以感觉到何时该内核会有用吗? 由于RBF包含矢量距离,因此kNN的结果是否与SVM / RBF有关? 有没有一种方法可以了解多项式内核?我知道尺寸越高,它越摆动。但是我想了解一下内核的工作原理,而不是尝试所有可能的内核并选择最成功的内核。
17 svm  kernel-trick 

5
查找SVM最佳元参数的快速方法(比网格搜索更快)
我正在使用SVM模型对空气污染物进行短期预测。要训​​练新模型,我需要为SVM模型找到合适的元参数(我的意思是C,γ等)。 Libsvm文档(以及我已阅读的许多其他书籍)建议使用网格搜索来找到这些参数-因此,我基本上从特定集中为这些参数的每种组合训练模型,然后选择最佳模型。 有没有找到最佳(或接近最佳)元参数的更好方法?对我来说,这主要是计算时间的问题-对这个问题进行一次网格搜索大约需要两个小时(在我做了一些优化之后)。 网格搜索的优点: 它可以很容易地并行化-如果您有20个CPU,它将运行快20倍,并行化其他方法则更加困难 您检查了元参数空间的大部分,因此,如果有一个好的解决方案,您将找到它。


2
一类SVM与示例SVM
我知道,一类支持向量机(OSVM)是在考虑否定数据的情况下提出的,它们试图找到将正集与某个负锚点(例如起源)分开的决策边界。 2011年的工作提出了示例性SVM(ESVM),该模型训练了一个声称与OSVM有所不同的“单个每个类别分类器”,因为ESVM不需要“将示例映射到可以使用相似性内核的公共特征空间中”计算”。我不太了解这意味着什么以及ESVM与OSVM有何不同。因此,它们有何不同?在ESVM中如何避免这种相似性内核计算?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.