我们在客户的站点上有一个商店定位器页面。最终用户输入他们的邮政编码和搜索半径,然后我们将结果显示在Google地图上。
最近,我们开始注意到该网站已达到免费地图搜索的上限(每24小时大约25,000个),而总体流量却没有明显增加。我打开了一些其他日志记录以尝试查找问题所在。
事实证明,Googlebot正在此地图上进行数千次搜索。这是一个小样本:
2017-07-09 23:56:22,719 [7] INFO ShopLanding-[Thread 41] Google Maps:搜索到的G23收到来自66.249.66.221的确定 2017-07-09 23:56:35,469 [7]信息ShopLanding-[线程10] Google地图:搜索到的CA6从66.249.66.221接收到确定 2017-07-09 23:57:24,563 [7]信息ShopLanding-[线程48]谷歌地图:搜索到的BN14收到来自66.249.66.223的确定 2017-07-09 23:58:00,970 [7]信息ShopLanding-[Thread 42] Google Maps:搜索到的CB4收到来自66.249.66.221的确定 2017-07-09 23:58:13,064 [7]信息ShopLanding-[Thread 54] Google Maps:搜索的DY9从66.249.66.221接收到确定 2017-07-09 23:59:18,722 [7]信息ShopLanding-[线程59]谷歌地图:搜索到的TS3从66.249.66.223收到确定 2017-07-09 23:59:53,223 [7]信息ShopLanding-[Thread 49] Google Maps:搜索到的S45从66.249.66.221接收到确定
有什么办法可以阻止Google推送这么多请求?这吞噬了免费津贴的很大一部分。每天的合法搜索量似乎不足200。
编辑
该站点基于C#ASP.NET构建。商店搜索使用的是POST,提交后该URL不会更改。我可以在明天早上发布IIS日志样本,以确认此行为。
Googlebot正在搜索的商品有任何意义吗?“ G23”和“ CA6”对我没有任何意义。Googlebot通常不会向表单提交随机数据。它通常仅爬网下拉选项,预填充的数据或查询链接。网站上的这些值是否在列表中?另外,这些请求的网址是什么样的?
—
斯蒂芬·奥斯特米勒
@StephenOstermiller,它们是英国的部分邮政编码,尤其是地区标识符。这些应该是
—
Burgi
POST
对AJAX的请求,不过我将检查IIS日志。
旁:这是什么“免费地图搜索”?
—
怀特先生'17
@SamWeaver IP解析为Google bot,并且相应的IIS日志条目具有Googlebot UserAgent。不可否认,这两者都是可以欺骗的。
—
Burgi
您的商店定位器是否使用查询字符串(GET请求)?商店定位器页面的大致URL结构是什么,它随用户搜索而改变(查询字符串)吗?如果您可以更详细地解释功能/技术方面,则可以以更有效的方式进行回答。
—
TopQnA