有超过1000个要素(或样本点(如果包含曲线))可免费用于分类的数据集是什么?
已经有一个关于免费数据集的社区Wiki: 查找免费可用的数据样本
但是在这里,最好有一个更集中的列表,可以更方便地使用它,我还建议以下规则:
- 每个数据集一个帖子
- 没有链接到数据集
每个数据集必须与
一个名称(弄清楚它的含义)和一个指向数据集的链接(可以使用包名称来命名R数据集)
特征数(假设为p),数据集的大小(假设为n)和标签/类的数量(假设为k)
根据您的经验(将使用的算法写成文字)或文献(在最后一种情况下,链接本文)得出典型的错误率
+1,但NIPS2003中的仅具有train.labels - NIPS2003论文清楚地指出“保留验证和测试集标签”。
—
denis
谢谢。关于NIPS的评论是@mbq的答案。
—
罗宾吉拉德2011年
这里有人有一个带有两个以上类标签的高维数据集吗?
—
hlin117