Answers:
在日志文件分析器域中,这些是使用最广泛的:
Analog和Webalizer用C编写,速度更快(每秒10000-20000行)。
正如@MadHatter先前提到的,Analog是由前剑桥统计学家开发的,这使Analog成为一种真正精确的技术工具,但是自2005年以来,它就不再开发了。
Webalizer不再开发,但是比使用Analog更容易。
AWStat和W3Perl是用Perl编写的,它们是最活跃的项目,但远比Analog和Webalizer(每秒3000/4500行)慢。它们在生成的数据和呈现数据的方式上互不相同。
AWStat以一种非常吸引人的方式显示统计信息,但是生成的统计信息少于W3Perl。
我建议您这些链接以获取更多信息:
http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/
我的建议是:
关于页面标记赢家肯定是Google Analytics(分析),其收集和产生的数据要比其他解决方案要好,但是有一天Google可能会要求它提供资金...
W3Counter和Xiti是提供程序,要求您使用免费版本在要监视的每个网页上安装映像。两者都是针对小型站点的。
Open Web Analytics和Pikwik是出色的开源解决方案。两者都相当成熟且稳定,但是它们需要MySQL数据库和PHP支持。
如果您不需要“自制”解决方案,我肯定会选择Google Analytics(分析),在开放源代码项目之间,我会选择Open Web Analytics,因为它比Piwik更成熟。
这是实验性的软件,但仍然令人印象深刻:
Hummingbird使您可以查看访问者如何实时与您的网站进行交互。“实时”并不是说每5分钟刷新一次-WebSockets使Hummingbird每秒更新20次。Hummingbird建立在Node.js之上,Node.js是一个新的javascript网络工具包,可以处理大量流量和许多并发用户。
我会说(尽管我偏爱联合创始人;-),SnowPlow是目前最强大的基于开源标记的Web分析工具。
SnowPlow具有使用Hadoop和Hive的松散耦合的分布式体系结构,因此可扩展到数百万甚至数十亿个事件-这是MySQL或其他基于RDBMS的解决方案无法做到的。
SnowPlow的另一个重大创新是事件数据存储在干净,不变,非规范化的原子“平面文件”结构中,换句话说,就是分析数据仓库。这样就可以使用Hive进行许多非常复杂的分析,以及与第三方数据(例如CRM或销售数据)的直接联接。再次,这比其他解决方案功能更强大,其他解决方案倾向于将原子数据折叠成聚合,截断旧数据或使用难以直接查询或连接到其他源的标准化结构。
您可以在此处阅读有关SnowPlow的技术架构的更多信息。
在对开放源Web分析软件包进行了一些研究之后,我认为明显的赢家是http://www.openwebanalytics.com和 http://piwik.org/
原因是易于使用,安装实时功能。
我想提及的一项令人印象深刻的功能是openwebanalytics生成的热图。