Questions tagged «statistics»

5
硬盘旋转周期有多有害?
传统观念¹是,每次您旋转硬盘上下备份时,都会缩短其预期寿命。 之前已经讨论了该主题: 关闭硬盘有害吗? 待机(快速启动)模式对现代硬盘有什么影响? 降低转速和加速转速之所以有害的常见解释是,与普通运转相比,它们在机械零件上产生的应力更大,并且它们引起的热量变化对设备的机械结构有害。 是否有任何数据定量显示旋转周期有多糟糕?也就是说,旋转周期会花费多少预期寿命?或者,实际上,如果我知道X秒钟不需要磁盘,那么X应该保证旋转多大? ¹ 但是以前的传统观点是错误的;例如,通常认为硬盘应保持尽可能凉爽,但一项有关该主题的已发表研究表明,凉爽的驱动器实际上故障更多。由于所有被调查的磁盘都是24/7开机的,因此该研究无济于事。

4
为什么不同的制造商具有不同的SMART价值?
首先,我想每个人都知道硬盘驱动器的故障要比制造商想要承认的多得多。Google进行了一项研究,该研究表明硬盘驱动器的SMART状态报告的某些原始数据属性可能与驱动器的未来故障密切相关。 例如,我们发现在发生首次扫描错误后,驱动器在60天内发生故障的可能性是没有错误的驱动器的39倍。重新分配,离线重新分配和概率计数中的第一个错误也与更高的故障概率密切相关。尽管存在这些强相关性,但我们发现仅基于SMART参数的故障预测模型的预测准确性可能会受到严重限制,因为我们的故障驱动器中有很大一部分都没有显示SMART错误信号。 希捷(Seagate)似乎在试图掩盖有关其驱动器的信息,声称只有其软件才能准确确定其驱动器的准确状态,并且它们的软件不会告诉您SMART属性的原始数据值。据我所知,Western Digital并未做出任何此类声明,但其状态报告工具似乎也未报告原始数据值。 我一直在使用smartmontools的HDtune和smartctl来收集每个属性的原始数据值。我发现确实如此……当涉及某些属性时,我正在将苹果与橙子进行比较。例如,我发现大多数Seagate硬盘都会报告它们有数百万个读取错误,而西方数字99%的时间显示0表示读取错误。我还发现,希捷将报告数百万个搜索错误,而Western Digital似乎始终报告0。 问:如何标准化这些数据?希捷是否会产生数百万个错误,而西方数字公司却不产生任何错误?Wikipedia关于SMART状态的文章说,制造商有不同的方法来报告此数据。 这是我的假设: 我想我找到了一种规范化数据的方法(对吗?)。 希捷驱动器具有西部数据驱动器没有的其他属性(已恢复硬件ECC)。当您从ECC恢复的计数中减去读取错误计数时,您可能最终会得到0。这似乎等同于Western Digitals报告的“读取错误”计数。这意味着Western Digital仅报告无法纠正的读取错误,而Seagate会计算所有读取错误,并告诉您能够修复的错误数量。 我有一个Seagate驱动器,其中“读取”错误计数小于“已恢复ECC”计数,并且我注意到许多文件已损坏。这就是我提出假设的方式。希捷产生的数百万个搜索错误对我来说仍然是一个谜。 如果您有其他信息,请确认或纠正我的假设。 这是我的西方数字驱动器的智能状态,以便您可以了解我在说什么: james@ubuntu:~$ sudo smartctl -a /dev/sda smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF INFORMATION SECTION === Device Model: WDC WD1001FALS-00E3A0 Serial Number: WD-WCATR0258512 Firmware Version: 05.01D05 User …

2
各种媒体的长期存储可靠性
我正在寻找有关各种媒体的长期存储/归档可靠性的统计信息的参考。也就是说,我正在寻找信息,比较,图表,图形,测试结果等,以将数据可以可靠地存储在尽可能多的各种类型的介质(例如软盘,磁带,CD,DVD,闪存,驱动器/内存卡,HD,SSD,设备固件/ EEPROM,heck,甚至打孔卡和石碑(如果有)。 显然,不会有关于DVD的50年可靠性之类的数据,但是推测该数据会随着时间的流逝而更新,类似于防病毒比较数据库。


5
是否可以分析SubVersion存储库的大小?
是否有可能知道SubVersion存储库中的每个项目使用了多少磁盘空间? 我可以签出每个项目的工作副本,并查看每个项目占用的大小,但我认为这并不包括项目的总大小(所有修订版)。 我可以在存储库的“ db”目录下查找,但是其中没有一个文件有意义-我认为无法使用它们来计算每个项目占用多少空间。 我尝试了该svn ls --verbose命令,但是它提供给我的大小只是头部修订中实际文件的大小,我不认为它包括所有修订。 也许这是不可能的,但我想我会问。 提前致谢!

3
收集鼠标使用统计信息的应用程序
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新的问题,所以这是对话题的超级用户。 3年前关闭。 任何可用于收集和分析有关鼠标使用情况的统计信息的应用程序。 例如:鼠标移动速度,有效和无效点击次数等。可用的分析越多越好。 不幸的是,我正在查看它与我的使用情况最接近的反鼠标,不幸的是,每次关闭程序时,统计信息都会重置。我需要一个程序来收集统计数据以进行长期分析。 PS:也可以使用任何类似的键盘程序。

6
是否有在博客上执行文本分析的软件?[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,以使它成为超级用户的话题。 3年前关闭。 我的公司正在寻求为过去11年的客户的Wordpress 2博客帖子创建PivotViewer可视化。但是,为此,我们需要编辑一些杂乱无章,不完整且通常较差的标签,以用作可排序的类别。我正在寻找一种工具,该工具将分析其博客条目并执行字数统计,以使我们对正在处理的内容有所了解。 理想情况下,它将具有所有这些功能: 单词黑名单(忽略) 词干 自定义同义词合并 计算所有用途 计算单词出现的帖子数。 我本以为这种文本分析是非常普遍的,但是我还没有找到在整个博客上都能做到这一点的软件。有可用的软件来做到这一点吗?

1
Dropbox文件类型统计信息
有没有办法看到Dropbox上共享的filtetypes的百分比?我的意思是,有多少音乐文件,多少个zip文件,多少个rar文件等。 数字本身和百分比都很棒。 我希望不要求太多, 谢谢

0
无法在Excel中绘制散点图
我的总人口设定为1到100之间的整数。现在我生成了5个随机数(使用 = RANDBETWEEN() 命令)并称之为我的样本1.同样,我创建了200个这样的样本。现在,我更改了样本中的数据点数,并在每个样本中将其增加到10,并再次创建了200个样本大小为10的新样本。这件事我再次为样本大小= 20做了。现在我的问题是这个 - 我有以这样的方式绘制它们:在我的X轴上,我有样本大小= 5,样本大小= 10,样本大小= 20作为我的3点,所有样本点对应于Y轴上的每个样本大小(从而制作出直线形状的3种不同的聚类散点图。但我无法这样做。有人可以帮我吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.