最新版本的Joomla不再阻止/media/
和/templates/
文件夹:
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
并非所有扩展名都遵循放置CSS和JS文件等的准则,因此一个好的解决方法是允许Google访问这些文件,而不管它们在哪里。
您可以通过在robots.txt
文件的开头插入几行来实现此目的,如下所示:
#Googlebot
User-agent: Googlebot
Allow: *.css
Allow: *.js
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
编辑:
感谢@ w3dk和@Stephen Ostermiller的反馈!你太对了。最好执行以下操作:
User-agent: *
Allow: *.css
Allow: *.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
不幸的是,这似乎并没有达到预期的效果,因为更长(更具体)的规则会覆盖较短的规则,并且忽略允许行。允许线是否跟随禁止线,反之亦然似乎没有任何区别。
我似乎可以解决此问题的唯一方法是,通过在网站站长工具中对其进行测试时似乎可以进行以下操作:
User-agent: *
Allow: /************************************************************.css
Allow: /************************************************************.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
编辑2-最佳解决方案:
好的,所以我做了一些研究,并在https://stackoverflow.com/a/30362942/1983389找到了答案。
这显示在所有网络爬虫最正确,最支持的解决方案是像以下(允许访问*.css
和*.js
文件在/bin
,/cache
,/installation
,/language
,/logs
,和/tmp
文件夹可能还有一些其他文件夹的意义不大):
User-agent: *
Allow: /administrator/*.css
Allow: /administrator/*.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Allow: /cli/*.css
Allow: /cli/*.js
Disallow: /cli/
Allow: /components/*.css
Allow: /components/*.js
Disallow: /components/
Allow: /includes/*.css
Allow: /includes/*.js
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Allow: /layouts/*.css
Allow: /layouts/*.js
Disallow: /layouts/
Allow: /libraries/*.css
Allow: /libraries/*.js
Disallow: /libraries/
Disallow: /logs/
Allow: /modules/*.css
Allow: /modules/*.js
Disallow: /modules/
Allow: /plugins/*.css
Allow: /plugins/*.js
Disallow: /plugins/
Disallow: /tmp/
robots.txt
因为没有人(现在Google一直在要求您不应该禁止的东西甚至没有搜索引擎)也将遵循它?