如何抵制Google Analytics(分析)引荐来源垃圾邮件?


43

上个月,我的Google Analytics(分析)统计数据中有很多引荐来源垃圾邮件发送者。他们的访问量比合法访问者的访问量高10倍(我的网站还不太受欢迎)。我已经启用了在GA设置中隐藏已知垃圾邮件发送者的选项,但这根本没有帮助。看来这些垃圾邮件发送者正在使用脚本直接向GA发送垃圾邮件(即它们未登录到我的IIS中)。

我有什么办法可以阻止这些垃圾邮件发送者?

10个月后的UPD,他们开始使用虚假的目标页面名称进行垃圾邮件...而Google对此仍然无所作为。


1
请检查您的日志文件中是否存在引荐来源垃圾邮件的点击量,如果您发现有垃圾邮件,请告诉我们。如果可以,请编辑问题并包括有问题的引荐来源垃圾邮件。我怀疑我已经知道答案了。我正在做一些研究,最近有大量的推荐人活动,而有些我自己也经历过。另外,如果您已安装WordPress,请确保它是最新的。其中一个站点似乎也正在追捕WP漏洞。另外,除非您使用文本浏览器(如Curl),否则请勿访问任何这些网站。
closetnoc

@closetnoc,这些垃圾邮件发送者未登录我的服务器。如我所写,它们直接向GA发送垃圾邮件。我不使用WP。“包括相关的引荐来源垃圾邮件”-您是什么意思?
user626528 2015年

我知道他们是谁,我发布了答案。
closetnoc

绝对最好的和最简单的方法来避免这种情况是使用:referrerspamblocker.com这是Google Analytics(分析)中的过滤器的自动设置。已经使用了几个月了。
Rody van Sambeek 2015年

在Google Analytics(分析)设置中将“机器人过滤”设置为true是否有助于解决该问题?-lunametrics.com/blog/2014/08/07/…–
萨姆

Answers:


7

垃圾邮件已失去控制。该列表正在增长,并且为每个垃圾邮件发送者添加过滤器非常耗时,甚至效率不高,因为其中大多数垃圾邮件出现了几天,然后消失,然后又出现了一个新垃圾邮件。

错误信息很多,最常见的错误是建议使用.htaccess,此文件会阻止对网站的访问,尽管可以阻止的爬虫数(5或6),但绝大多数垃圾邮件永远不会访问您的网站是Ghost Spam。

阻止此类垃圾邮件的最佳方法是创建一个有效的主机名过滤器,幽灵垃圾邮件使用伪造或未设置的主机名,因此使用此过滤器无需添加无尽的过滤器,只需使用一个过滤器照顾新旧垃圾邮件。。已成功使用此解决方案3个月

有关此方法的更多信息,请参见:

https://stackoverflow.com/a/28354319/3197362


我很高兴这是被接受的答案,确实应该得到更多的赞赏。Google Analytics(分析)中的绝大多数垃圾邮件引用者都是虚假引用者。您需要阻止一些操作.htaccess,但是要阻止他们歪曲数字(这是罪魁祸首的始作俑者-合法机器人我的范妮姨妈),这是一场持续不断的战斗。
GeoffAtkins '16

哦,卡洛斯,我将向您推荐在您的网站上打击垃圾邮件的指南。我知道此评论将被视为实现SEO /出售的一种方式,但事实并非如此。我真的很佩服您对该指南的意见。
奥克

35

好的。在不知道有问题的站点的情况下,我将尝试解释发生的事情,仅提供一些链接。

来自:http : //www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

我得到了以下与人们最近发现的引荐来源垃圾邮件新方法相关的域名。

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • 经济公司
  • Darodar.com
  • 爱之家
  • Priceg.com
  • Hulfingtonpost.com(新增-2015年1月16日)
  • Bestwebsitesawards.com(新增-2015年2月3日)
  • Ranksonic.info(新增-2015年2月3日)
  • Cenoval.ru(新增-2015年2月6日)
  • oo-6-oo.com(新增-2015年2月25日)
  • Humanorightswatch.org(2015年3月4日新增)
  • S.click.aliexpress.com(2015年3月17日新增-疑似)
  • www1.social-buttons.com(2015年3月23日新增-疑似)
  • 4webmasters.org(2015年3月26日新增-疑似)
  • Googlsucks.com(新增-2015年4月7日新增)
  • Addons.mozilla.org(新增-2015年4月7日新增-疑似)
  • Smallseotools.com(新-2015年4月13日新增-怀疑)
  • Theguardlan.com(新-2015年4月14日新增)
  • Buy-cheap-online.info(新增-2015年4月16日新增-疑似)
  • Site1.free-share-buttons.com(2015年4月29日新增-怀疑)
  • Sanjosestartups.com(新增-2015年5月25日)
  • Trafficmonetize.org(2015年6月3日新增-怀疑)
  • Howtostopreferralspam.eu(新增-2015年6月9日-疑似)
  • Www10.free-social-buttons.com(2015年6月16日新增-疑似)
  • Getitfree.us(新增功能-2015年6月18日新增,无法确定所有权。谢谢-Trey Copeland)
  • Www6.free-social-buttons.com(2015年6月18日新增-疑似)
  • Erot.co(新-2015年6月26日新增-怀疑)
  • 3g2upl4pq6kufc4m.onion(新增功能-2015年7月4日新增-疑似)
  • Traffic2money.com(新-2015年7月28日新增-怀疑)

注意:可疑物品-确实遵循相同的所有权模式,并且可能不会与同一罪犯捆绑在一起。

可以在此处找到由Piwik维护的相当详尽的垃圾邮件引荐来源清单:https//github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt(谢谢您-user2428118)

报价:

BlackHatWorth.com是一个相对较新的域名,仅在2015年1月7日创建,现已用于引荐来源垃圾邮件。实际上,此引荐垃圾邮件网站被隐藏在购物搜索引擎和优美风景图片的名称后面。

... BlackHatWorth.com的IP地址为78.110.60.230,是与其他引荐垃圾邮件网站关联的IP地址...

实际上,BlackHatWorth.com域由拥有其他推荐垃圾邮件域(例如ILoveVitaly.com,Econom.co和Darodar.com)的同一俄罗斯人拥有。域名所有者的名称据称是俄罗斯萨马拉州(Samaraskaya Oblast)萨马拉(市)的Vitaly A Popov。

您不能阻止它!

来自:http : //www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

报价:

这是有关Google Analytics(分析)工作原理的快速入门。

因此,您可以在GA上进行设置并从中获取代码。该代码看起来像UA-number-1或类似的东西。该号码是您在Google Analytics(分析)上的“帐号”。现在,此代码和一些javascript进入了您的网页。现在,有人访问您的页面,他们的浏览器运行该javascript代码。

该javascript代码可以“记录”他们的访问。它使他们的浏览器与Google Analytics(分析)对话。具体来说,它发出Google记录有关其信息的某些类型的HTTP请求,然后GA向您显示该信息的摘要。

很基本吧?还在我这儿?好吧,现在,如果仅此Javascript发送“访问”给他们,那么任何人都可以伪造。任何人都没有。为了使您的GA显示虚假信息,我要做的就是直接将我的虚假信息发送给GA。

我完全不需要访问您的网站。我根本不需要运行javascript。我只需要复制那些公共的HTTP请求,这样任何人都可以看到它们以及它们如何工作。Google甚至公开地记录了它们。

所以,现在,让我说我是垃圾邮件发送者。我想让人们看到我的垃圾网站。那么,我该怎么办?我编写了一小段代码,以将成千上万个虚假请求发送给GA,然后我简单地循环浏览所有UA编号,以随机顺序进行。我发送了带有虚假引荐来源的虚假访问和我的垃圾邮件域名。你猜怎么着?它显示在您的Google Analytics(分析)屏幕中。

您会像其他正常访问一样看到此垃圾邮件。因为就GA而言,这是一次正常的访问。他们记录的只是那些HTTP请求,这些请求通常来自GA javascript代码。但是一个请求就是一个请求,制作一个伪造的请求非常非常容易。

那是怎么回事。我所需要的只是您的UA号码,并且只需很少的努力,我就可以伪造对您网站的访问,而无需实际连接到您的网站。该虚假访问可以包含我选择的任何域名和任何引荐来源。

这是对Google Analytics(分析)的攻击,目的是宣传正在显示的任何网站。您不能在服务器上将其阻止,因为根本不涉及服务器。

您可以做两件事:第一,按照John Conde的建议设置一个过滤器;其次,看看是否有一种方法可以通知Google。为此,我没有答案,但是我有一个主意。

[更新]

从每天数百次垃圾邮件点击到像这样的完整广告,这已经开始达到令人发指的程度:

在此处输入图片说明


2
@JohnMueller这不在您的范围内,但是您可以发送一些电子邮件以查看G是否对此有所了解吗?提前致谢!!
closetnoc

2
@JohnConde谢谢!约翰·穆勒(John Mueller)可能不知道这一点,但G的人应该知道。即使没有答案,但至少G应该已经抬起头,如果他们还没有的话。为我们所有人做是正确的事。干杯!
closetnoc

1
@JohnConde顺便说一句,我在其他SE(可能还有相关)网站上看到了有关此问题。我没有做笔记,但是有一种向其他Mod广播笔记的好方法吗?还是我应该只使用Google这些域名并寻找答案并发布?
closetnoc

1
@joelmdev您错过了不能被阻止的地步。这是对Google的直接攻击。除Google之外,没有人可以控制。他们已收到通知,并且大部分已停止。
closetnoc

2
@Steve我看不到有很大的收获,但是,一定有一个地方。答案中提到的一个人讨厌Google,并可能至少想让Google尴尬。但他们显然也正在使用此垃圾邮件来吸引访问不断注册的各个网站的流量。我什至看到过类似使用这种方法的广告。真是令人讨厌!它给无辜者带来的伤害要比Google造成的伤害更大。我认为这行得通...非常可悲。
closetnoc

5

您可以通过创建过滤器来排除它们。您需要找到足够具体的内容,以免意外阻止好的访问者,而且这很繁琐,因为您必须手动添加每个垃圾邮件发送者,但这可以解决问题。


您有任何可以帮助您的IIS建议吗?我可以为Apache提供帮助,但OP似乎具有IIS。
closetnoc

2
如果他们没有访问他们的网站(我相信他们所说的话),那么这将不是阻止他们的有效方法。还是我看错了这个问题?
约翰·孔德

我读了它,因为OP受到引荐来源垃圾邮件的欢迎。
closetnoc

2
确实,但显然他们是直接点击Google Analytics(分析)而不是点击其网站。It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
约翰·孔德

好的。你是对的。我的错!!我不确定为什么我没有接听,因为我只是在问这个问题之前就读了其中的一些内容。我也受到引荐来源垃圾邮件的打击,有一篇文章(简短地)提到他们的日志文件中没有条目。有趣的新方法。
closetnoc

4

要直接回答标题问题“如何抵制引荐来源垃圾邮件者”,最简单的答案是删除Google Analytics(分析)并切换到 PiwikPiwik默认会自动阻止所有引荐来源垃圾邮件

我知道您可能已经习惯了Google Analytics(分析),并希望继续使用它,但是如果您从更大的角度看,则确实有另一种效果很好的选择。如果愿意,还可以将Piwik配置为记录访问者IP地址,并且不会将访问者数据泄漏给可能吸引某些用户的第三方广告公司。


2
顺便说一下,Piwik使用的引荐来源垃圾邮件黑名单是开源的:github.com/piwik/referrer-spam-blacklist
Matthieu Napoli

他们的垃圾邮件数据库很小。我的分析报告中甚至都没有提到域。
Don Dilanga

1

这是在IIS上有效的规则:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>

2
此答案与OP的问题无关,因为垃圾邮件发送者绕过OP的网络服务器直接向Google Analytics(分析)发送垃圾邮件。
阿尔弗雷德·迈尔斯

@AlfredMyers您的评论部分正确,因为某些垃圾邮件发送者确实使用webserver方法,而其他垃圾邮件使用了您所说的直接方法。在后一种情况下,唯一的解决方案是在Google Analytics(分析)中添加过滤器以获取清晰的报告。为避免这种情况,我希望Google为GA帐户使用更长的哈希唯一标识符,以使垃圾邮件发送者无法简单地遍历可用数字并进行查询。
Flo 2015年

OP特别指出:“ ...这些垃圾邮件发送者正在使用脚本直接向GA发送垃圾邮件(即它们未登录到我的IIS中)。”。因此,对于这个特定的问题,他们没有访问他的Web服务器。
阿尔弗雷德·迈尔斯

1

如果您仍在寻找解决方案,并且无法理解所引用的内容,请参阅以下权威指南,以删除引荐垃圾邮件,该指南自2014年12月28日起已成为第133版:http//www.analyticsedge.com/2014 / 12 / removing-referral-spam-google-analytics /

TL; DR:

  • 有效的主机名过滤器将删除所有的虚引用(包括主机名mydomain.com)

  • 特定的排除过滤器(或网站阻止)将删除更短的垃圾邮件爬虫列表(semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for -website.com |用于您的website.com的按钮|-音乐*-免费提供的| anticrawler.org | savetubevideo.com | ranksonic)

  • 高级细分可用于将其从您的历史报告中删除。

可以从Google Analytics(分析)解决方案库中导入“高级细分”:https : //www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT %26_.viewId%3DGjpPQhFgS9aVzniXH4MTIg /


0

去年初,我的任务是找到针对Google Analytics(分析)垃圾邮件的最佳解决方案。像其他所有人一样,我尝试了推荐的方法,但是似乎没有一种方法能很好地工作。因此,接下来我转向Google跟踪代码管理器,但这似乎也没有太大帮助。沮丧和烦恼的是,我决定重建Google Analytics(分析)跟踪脚本,并结合针对最常见和最讨厌形式的垃圾邮件的对策。

尽管并不完美,但经过约1.5年的稳定构建,测试,调试和重构,我现在有了一个相当可靠的Google Analytics(分析)跟踪脚本,该脚本开箱即用,可轻松自定义。对于那些想要实现指标的人来说,这就像一个魅力。

https://github.com/nickolasburr/intelligent-ga-tracking

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.