Google是否提交HTML表单?


10

我有一个网页,例如http://domain/purchase,在此页面中,我有一个网络表单。用户在提交此表单(具有验证功能的客户端和服务器端,并且只有在适当填写字段之前不会被验证)时,用户将被重定向到另一页,在该页上,他可以选择其他内容并指定其他设置,然后购买我们的产品。说第二页是http://domain/options

因此,用户来到我们的网站并访问http://domain/purchase,填写表单,提交表单,然后将其重定向到第二页http://doamin/options?parameter1=value1&parameter2=value2,该页面包含第一页中的参数。这在网页之间(或从技术上来说,在URL之间)传递参数时非常常见。

现在,我正在查看我的网站,发现Google已为我的某些重定向的网页和URL编制了索引,例如:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

这意味着Google Bot已经访问了我们的http://domain/purchase页面,并填写了我们的表单,并提交了表单,并被重定向到具有相应参数的其他URL。这是对我有意义的唯一方法。Google是否真的填写表格?

PS:所有参数都是有意义的,这意味着它们不是任意填充的。例如,索引页面中的电话参数具有正确的电话号码。这怎么可能?

Answers:


8

自2008年以来, Google 一直能够抓取HTML表单

为每个输入选择值之后,我们生成并尝试爬网与用户可能进行的查询相对应的URL。如果我们确定查询产生的网页是有效的,有趣的并且包含不在索引中的内容,则我们可以将其包含在索引中的方式与包含任何其他网页一样。

另一方面,由于GoogleBot不太可能知道要在这些字段中输入正确的参数,因此可能会有另一种解释。您的用户是否可能链接到重定向的页面?


该Google网站站长视频还涵盖了这两点:youtube.com/watch?
v=xS0oHYZafTQ

它说他们只抓取GET表单。我的表单方法是POST。因此,不适用。是的,为什么不这样,URL始终是可链接的。
2011年

5
如果您?parameter1=value9&parameter2=value10在URL中看到,它们就是在获取它们。POST不会在URL中嵌入表单变量。
Wooble

@Woobie:在这种情况下,URL参数似乎是在POST表单之后服务器端重定向的结果。
MrWhite 2014年

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.