Questions tagged «classification»

统计分类是基于包含已知子种群的观测数据的训练数据集来确定新观测值所属的子种群的问题,其中子种群的身份未知。因此,这些分类将显示可变的行为,可以通过统计研究。

8
训练神经网络以区分偶数和奇数
问题:是否有可能仅使用数字本身作为输入来训练NN来区分奇数和偶数? 我有以下数据集: Number Target 1 0 2 1 3 0 4 1 5 0 6 1 ... ... 99 0 100 1 我使用一种非常简单的遗传算法训练了一个带有两个输入神经元(一个是变量Number,另一个是偏向神经元),隐藏层中的9个神经元和一个输出神经元的NN:在每个时期,两组权重“互相对抗;错误率最高的人将输掉,并由获胜者的修改版本代替。 该脚本可以轻松解决诸如AND,OR和XOR运算符之类的简单问题,但是在尝试对奇数和偶数进行分类时会遇到困难。目前,最好的方法是从100个数字中识别出53个数字,这花费了几个小时。我是否将输入归一化似乎没有什么区别。 如果我想作弊,我可以对数据进行预处理,并将%2作为输入提供给NN,但我不想这样做。NN应该能够近似所有函数,包括模运算符(我相信)。我究竟做错了什么?

2
准确度= 1-测试错误率
抱歉,这是一个非常明显的问题,但我一直在阅读各种文章,似乎找不到很好的确认。在分类的情况下,分类器的精度是否为1-测试错误率?我得到的准确度是,但是我的问题是准确度和测试错误率到底有何关系。 TP+TNP+NTP+TNP+N\frac{TP+TN}{P+N}


2
分类和回归树背后的数学
有人可以帮助解释CART中分类背后的一些数学吗?我想了解两个主要阶段是如何发生的。例如,我在数据集上训练了CART分类器,并使用测试数据集来标记其预测性能,但是: 如何选择树的初始根? 每个分支为何以及如何形成? 我的数据集包含15列23类的40万条记录,从混淆矩阵中获得了100%的准确性,我对数据集使用了10倍交叉验证。如果有人能帮助解释CART分类的阶段,我将非常感激。

4
检查准确性是否显着提高
假设我有一种算法可以将事物分为两类。我可以在1000个测试对象上测量算法的准确性-假设80%的对象被正确分类。 假设我以某种方式修改了算法,以便对81%的事物进行正确分类。 统计资料能否告诉我有关我对该算法的改进是否具有统计意义的信息?在这种情况下,是否具有统计意义意义的概念?请向我指出一些可能有用的资源。 非常感谢。





1
ROC曲线相互交叉时两个模型的比较
用于比较两个或多个分类模型的一种常用方法是使用ROC曲线(AUC)下的面积作为间接评估其性能的一种方法。在这种情况下,通常将具有较大AUC的模型解释为比具有较小AUC的模型具有更好的性能。但是,根据Vihinen,2012年(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3303716/)所述,当两条曲线相互交叉时,这种比较不再有效。为什么会这样呢? 例如,根据ROC曲线和下面的AUC,可以确定模型A,模型B和模型C的方法是什么?


3
机器学习模型(GBM,NN等)如何用于生存分析?
我知道传统的统计模型,例如Cox比例风险回归和一些Kaplan-Meier模型,可以用来预测直到下次事件发生的天数,例如失败等,例如生存分析 问题 机器学习模型(例如GBM,神经网络等)的回归版本如何用于预测事件发生之前的天数? 我相信仅将发生之前的天数用作目标变量并仅运行回归模型是行不通的?为什么不起作用?如何解决? 我们可以将生存分析问题转换为分类,然后获得生存概率吗?如果那么该如何创建二进制目标变量? 机器学习方法与Cox比例风险回归和Kaplan-Meier模型等的优缺点是什么? 想象一下样本输入数据的格式如下 注意: 传感器每隔10分钟对数据进行ping操作,但有时由于网络问题等原因可能会丢失数据,如带有NA的行所示。 var1,var2,var3是预测变量,解释变量。 failure_flag告知计算机是否发生故障。 每个机器ID每10分钟间隔有最近6个月的数据 编辑: 预期的输出预测应采用以下格式 注意:我想预测未来30天每天每台计算机发生故障的可能性。

1
如何训练深度网络的LSTM层
我正在使用lstm和前馈网络对文本进行分类。 我将文本转换为一键向量,然后将其输入到lstm中,这样我就可以将其总结为单个表示形式。然后,我将其馈送到另一个网络。 但是我如何训练LSTM?我只想按顺序对文本进行分类-是否应在未经培训的情况下进行输入?我只想将段落表示为单个项目,然后将其输入分类器的输入层。 我将不胜感激与此有关的任何建议! 更新: 所以我有一个lstm和一个分类器。我将lstm的所有输出并平均池化,然后将平均值输入分类器。 我的问题是我不知道如何训练lstm或分类器。我知道对于lstm的输入应该是什么,对于该输入的分类器的输出应该是什么。由于它们是两个单独的网络,它们只是按顺序激活的,因此我需要知道和不知道lstm的理想输出应该是什么,它也是分类器的输入。有没有办法做到这一点?


2
多类感知器如何工作?
我没有数学背景,但是我了解简单的Perceptron的工作原理,并且我认为我掌握了超平面的概念(我想像它是3D空间中的一个平面,它将两个点云分开,就像一条线分开一样2D空间中的两个点云)。 但是我不明白一架飞机或一条直线如何分别在3D空间或2D空间中分隔三个不同的点云–从几何上讲这是不可能的,是吗? 我试图理解Wikipedia文章中的相应部分,但是在句子“这里,输入x和输出y是从任意集合中提取”时,已经惨遭失败。有人可以向我解释多类感知器,以及它与超平面的想法如何结合,还是可以向我指出一个不太数学的解释?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.