谷歌正在提交我的搜索框表格吗?


11

在我的电子商务应用程序中,我们存储了客户在搜索框中进行的所有搜索。我注意到上个月左右,尽管统计数据中的主要搜索字词是我们在字段中预先填充的字词,例如“此处搜索”。如果您启用了JavaScript,则无法以用户的身份提交此术语,但事实是它的发生如此频繁,这使我相信像Google这样的机器人会自动提交此搜索框。这可能/可能吗?

Answers:


11

Google说,有时Googlebot可能会提交GET表单。

http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html

具体来说,当我们在高质量网站上遇到某个元素时,我们可能会选择使用该表单进行少量查询。对于文本框,我们的计算机会自动从具有表单的站点中选择单词;对于表单上的选择菜单,复选框和单选按钮,我们从HTML的值中进行选择。为每个输入选择值之后,我们生成并尝试爬网与用户可能进行的查询相对应的URL。


如果浏览Web服务器日志,则应该能够找到搜索表单的请求。检查这些请求的用户代理(请参阅support.google.com/webmasters/bin/…),并且/或者您也可以进行反向IP查找,以为您提供更多信息。
joesk

1

我认为,这可能是某种流氓垃圾邮件机器人,而不是像Google这样的知名公司的机器人。

当用户输入这样的查询时,简单地记录IP和用户代理怎么样?


目前无法进行改装。从根本上讲,我想知道这是否是任何蜘蛛/机器人的已知行为?
robjmills

我想这与垃圾邮件机器人填写联系表格没什么不同
。– robjmills

0

这是在我的网站上发生的,事实证明,当用户在备用文本框中按下键盘上的enter键时,就触发了搜索(例如数量)。尽管它可能是机器人,但我认为这种情况更有可能。

要进行测试,请尝试在搜索框旁边的其他字段中按Enter键。


0

这是完全无法量化的,但我发现有些情况下,我的几个站点的搜索结果页面相当晦涩,却出现在Google的索引中。

尽管这可能是由于它们插入了随机字符串所致,但我怀疑这些URL来自其他地方,无论是Google工具栏还是我配置为了解我的网站搜索网址格式的Google Analytics(分析)。


0

用户可以直接在chrome中使用大多数网站的搜索功能。

在Chrome中,键入网站的域,然后按Tab键,系统将提示您输入搜索文本。此搜索使用的是Google假定的您网站的搜索形式。我相信这可能是您遇到的问题。

具有讽刺意味的是,我本人也遇到类似的问题,我们的网站具有Chrome正在使用的“经销商查询”表格,而不是我们的“网站搜索”表格。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.