Answers:
他们看到了吗?是。他们能找到吗?不是没有帮助。
Web爬网程序通常通过跟踪其他页面上指向它们的链接来查找要爬网的页面。某些爬网程序(例如搜索引擎爬网程序)还将爬网特殊XML文件中列出的页面。因此,如果您的网站或任何其他网站上没有指向该页面的链接,则将不会对该页面进行爬网(包含该页面URL的纯文本页面将由Google找到)。
但是,一旦页面被发现并被爬网,即使该页面的所有链接已从其各自的网站中删除,也可能会再次被爬网。这是因为然后对已爬网的页面进行索引(例如,将其添加到要再次爬网的爬网程序列表中),因此爬网程序知道稍后会再次对其进行爬网以查找更改。如果要防止这种情况发生,可以执行以下任一操作:
最有效率
效果较差