在评估要在计算工作中使用的软件质量(无论是编写的东西还是固定包装的软件)时,通常最好先查看它在标准数据集或问题上的工作情况。在哪里可以获得这些测试以验证计算例程?
(请给每个答案一本网站/书。)
在评估要在计算工作中使用的软件质量(无论是编写的东西还是固定包装的软件)时,通常最好先查看它在标准数据集或问题上的工作情况。在哪里可以获得这些测试以验证计算例程?
(请给每个答案一本网站/书。)
Answers:
如果您有兴趣对稀疏矩阵进行分析,我还将考虑戴维斯大学的佛罗里达大学稀疏矩阵集合和矩阵市场。
为了测试图分区算法,有Walshaw的图分区存档。
在计算电磁学中,有一组著名的(或因某些困难而臭名昭著)的测试问题:测试电磁分析方法(TEAM)。
他们中的某些人确实确实需要认真使用最新的数值技术,以使正确的仿真结果与实验数据保持一致。例如,导体线圈问题。
道格(Dauge)汇编了麦克斯韦方程组的另一组测试问题:麦克斯韦方程组的基准计算,用于逼近高奇异解。著名的(或臭名昭著的)Fichera立方体中的一个:
如果您对与分子结构相关的基准测试算法感兴趣,则pubchem数据库包含大量的有机分子集合。这可能有助于比较使用不同模型/程序获得的分子特性的预测。该站点具有几个选项,可用于下载满足某些预定义条件(例如化学成分)的大批量分子。
雅典娜的测试是否要解决双曲守恒定律。
为了测试多元统计分析和机器学习算法,可以在http://www.ics.uci.edu/~mlearn/找到 UCI数据集存储库
汉斯·米特尔曼(Hans Mittelman)的网站是浏览数值优化中当前软件选项的绝佳资源。他包括自己的基准,以及与其他基准有关优化测试问题的链接。
好的软件必须已经过测试,并且应该说出作者是如何进行测试的,或者自己提供测试数据集(例如,以回归测试的形式),或者至少提供指向使用其进行测试的数据的链接。
如果您正在寻找大型图形或网络数据进行测试。在斯坦福大学的网络分析项目(SNAP)拥有许多大型数据集图形通常以匿名邻接表的形式。他们的一些选择包括:
数据很简单;要获得它的API可能很难。我推荐Quandl。该站点拥有超过1000万个可通过一个简单的REST-ful API访问的公开可用数据集。所有数据均以CSV或JSON返回。或者,如果编程不是您的强项,则可以采用简单的方法将数据导入Excel。R,Python和Ruby程序员将完全可以使用本机库。