Robots.txt-CSS允许或不允许


12

robots.txt中允许使用CSS和模板吗?

应该引起什么问题吗?

在Joomla中,robots.txt中不允许使用CSS和模板。请帮助我找到一个解决方案,以决定是否禁止即将发布的网站的CSS,模板等机器人使用。


我不认为Joomla默认会阻止这些文件-如果这就是您的意思?
怀特先生2014年

Answers:


23

Google最近更新了其准则,正式声明您不应阻止访问robots.txt中的 CSS或JS文件。这样可以确保Google在抓取该网站时可以完全像浏览器一样呈现它。

如果阻止CSS或JS文件,则可能会损害您的网站在排名中的表现。

此处提供更多信息:更新我们的技术网站管理员指南,以及此处:网站管理员指南

由于这是最近的建议,因此许多网站和CMS(例如Joomla)通常会在robots.txt中阻止此类文件。其背后的原因通常是搜索引擎不需要对这些文件进行爬网或编制索引,因此要阻止不必要的文件和目录被编制索引并节省“爬网预算”,通常会在robots.txt中将其阻止。


2
Google实际上已经说了很长时间了,您不应该阻止JS和CSS(2012年3月的Matt Cutts视频),因为这可能会损害G抓取您的网站的能力,只是他们最近使它变得“更加正式”。
怀特先生2014年

2
建议十年内不要阻塞CSS和JS。我知道搜索引擎的渲染似乎是新事物,但事实并非如此,包括简单JS在内的某些形式的渲染已经存在了很长时间。
closetnoc

1
附加说明(有些相关,因为它经常与JS一起使用)-关于使控制器可以通过theme / view / JSON / URi访问路线的任何控制器-您应该屏蔽这些内容,否则您可能会遇到非主题区域被索引而不是使用数据方面。这是有效阻止的“视图”区域,尤其是JS使用的诸如JSON之类的东西。G通常会运行JS,查看JSON链接,然后访问它。导致错误,或者如果出现主题,则建立一半索引。多数民众赞成在一个全新的can-o-worms,但要注意。
dhaupin 2014年

1
对于Google所说的无论如何我们都必须采取的货运崇拜态度,我感到不得不表达强烈的异议。Google还说,如果允许他们抓取图像,使用HTTPS等,您的网站将排名更高。通过遵守Google所说的一切,您只是在赋予他们更大的权力来提出更大的要求。归根结底,您是在为人类还是机器人建立网站?
2014年

1
猜猜这取决于您在多大程度上依赖Google的良好排名?尽管像大多数事物一样,它只是其中许多因素的一个很小的指标。就像您提到的那样,他们最近说HTTPs是一个很小的排名因素,但是我并没有将我从事的100个网站中的任何一个都更改为HTTPs,它们的排名还不错。
2014年

3

你的战略的robots.txt其中我的网页的部分:应始终对这个问题回答不能由机器人抓取和哪些部分可以由机器人抓取。

机器人实现自己的逻辑并具有多种用途(不仅Google拥有抓取工具...),因此,如果您假设某个机器人被CSS和JS文件“分散了注意力”,则打开机器人的黑匣子并假设机器人的当前实现和当前意图是。这不是有用的长期策略。

与其去思考机器人的领域,不如去思考您网站的内容领域。

我想指出,robots.txt文件不是安全机制。


1

模板由博客或内容管理软件(CMS)应用程序使用,并且不应在外部被浏览器和搜索引擎读取CSS的位置访问,并且应该被读取。话虽如此,我不会阻止任何一个,但是我也不会更改CMS所做的任何更改。搜索引擎和漫游器不关心您的模板。只是通过您不想索引或读取但不想将robots.txt视为安全工具的URL / URI来阻止对网站的访问。它不是为此设计的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.