URL参数“?chocaid = 397”从何而来?


9

在Google网站站长工具中,我注意到我的首页被索引了两次:

  • example.com/
  • example.com/?chocaid=397

我知道可以使用link type来解决此问题canonical,但我想知道:此参数来自何处?

有很多站点的页面都使用此参数/值进行索引:https : //duckduckgo.com/?q=chocaid%3D397

我在这些站点之间寻找相似之处。但找不到最终结论:通常是首页,但并非在每种情况下都如此。有些是NSFW,但不是全部。当一个域的URL具有此参数时,同一域的其他子域通常也具有此参数。

例子

维基百科条目

在此处输入图片说明

微软Codeplex

在此处输入图片说明


在Google网站站长工具(或您的引荐来源记录)中,是否有任何迹象表明哪个页面可能链接到该URL?
MrWhite 2012年

@ w3d:我无权访问任何日志。在GWT中,它在“ HTML改进 ”→“重复的页面标题”中列出。因此,我担心我无法获得任何引荐来源信息。
2012年

我只是想知道在“流量”>“您的网站链接”>“您最链接的内容”>“更多”(以获取所有链接的页面)下是否存在任何内容。为了?chocaid=397获得索引,大概是某个链接到它,以便Google首先找到链接?
MrWhite 2012年

@ w3d:啊,我明白了。不幸的是,该报告仍缺少数据(可能是因为我仅使用GWT几天了)。
2012年

不确定这是否有帮助,但是数字397与哈希值有关(请参阅此处此处)。我不确定这是否与此问题有关,但?chocaid=397可能是某种尝试弄乱了哈希值(对此我不太了解,因此我不确定)。另外,这是一个很大的问题。

Answers:


1

您的域名有多新?很有可能这是旧域名上的一个流行查询,因此您仍然会吸引“访问者”。这会映射到有效页面还是404?如果您在这里获得了很多成功,并且它是404,那么我会将其重新映射(使用.htaccess)到您的首页或其他内容。


1
我还没有注意到任何访客。我看到了Google索引的页面。它映射到相同的首页(就像省略了该参数一样)。我知道我可以重定向它或使用它canonical,但是这个问题更多的是关于此参数的来源。
2012年

2
但这不能解释为什么相同的URL参数出现在许多其他域的搜索结果中。
MrWhite 2012年

1

可能是Googlebot尝试访问jQuery / Javascript并抓取其所有内容。最近在这里发布了一篇帖子,有人寻求帮助,因为Googlebot正在其网站上抓取无效的URL。John M回答了有关Googlebot可能如何寻找更多URL以便从其网站上的脚本进行爬网的问题。他为Google网站管理员工具工作。您几乎可以通过设置规范标签来回答自己的问题。


1

尽管我没有明确的答案,但在调查时发现了一些可能有助于缩小范围的内容:

  • 这些链接也出现在Bing和Yahoo中,因此与Google无关。
  • 它们出现在Wiki,Tumblr博客,Wordpress博客和其他站点上,因此不会通过任何特定软件中的漏洞进行添加。
  • 它们出现在一些质量很低的Tumblr网站上,因此这些网站不太可能会投放任何广告。同样,维基百科的文章不太可能通过广告来宣传。

我最好的猜测是,有/曾经有一些刮板站点,该站点将该URL添加到找到的所有链接中。当然,外部链接似乎最可能解释它们的来源,而目录也不太可能,因为它被添加到相当随机的页面中。


0

这可能来自您可能拥有的广告提供商,但我遇到了同样的问题,它唯一可能的来源是广告商通过javascript代码注入了一些恶意软件。


您是否有来源/证明?这意味着Wikipedia被此感染,因为有些 Wikipedia页面已为此参数编入索引。
2014年

是的,因为我有一个博客因此遭到Google的封锁,并且在删除了罪魁祸首广告之后,他们开始删除了该封锁
Raymund 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.