机器学习分类器big-O或complex


14

为了评估一种新的分类器算法的性能,我正在尝试比较准确性和复杂性(训练和分类中的big-O)。来自Machine Learning:a review,我得到了完整的监督分类器列表,还有算法之间的准确性表,以及来自UCI数据存储库的 44个测试问题。但是,对于常见的分类器,我找不到带有big-O的评论,论文或网站:

  • C4.5
  • RIPPER(我认为这不可能,但谁知道)
  • 人工神经网络与反向传播
  • 朴素贝叶斯
  • 神经网络
  • 支持向量机

如果有人对这些分类器有任何表达,它将非常有用,谢谢。


2
您可能对以下文章感兴趣:thekerneltrip.com/machine/learning/…完全免责声明,这是我的博客:)
RUser4512 '18

关心追溯问题的现在死链接所指向的位置吗?
马特

@ RUser4512真是很棒的博客讨论!您是否考虑过增加空间复杂性?
马特

1
@matt谢谢:)是的,但是可能在另一篇文章中,还有很多要说的!
RUser4512 '18

Answers:


11

=训练样例数,d =特征的维数,c =类数。ñdC

然后培训很复杂:

  1. 朴素贝叶斯是,它要做的就是为每个类计算每个特征值d i的频率。Øñdd一世
  2. -NN在 O1 )中(有些人甚至说它不存在,但是训练的空间复杂度是 ON d ),因为您需要存储同样需要时间的数据)。ķØ1个Øñd
  3. 非线性非近似SVM为O N 3),具体取决于内核。您可以通过一些技巧将O N 3降至O N 2.3Øñ2Øñ3Øñ3Øñ2.3
  4. 近似SVM为,其中R为迭代次数。Øñ[R

测试复杂度:

  1. 朴素贝叶斯位于因为您必须为每个c类检索d个要素值。ØCddC
  2. ķØñd

来源:“核心向量机:对超大型数据集的快速SVM培训” -http://machinelearning.wustl.edu/mlpapers/paper_files/TsangKC05.pdf

对不起,我对其他人一无所知。


6
Øñ2Øñ3

@MarcClaesen链接不再起作用,并且不在回送机器上。这是同一篇论文吗:leon.bottou.org/publications/pdf/lin-2006.pdf
wordforthewise
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.