我有一个要从搜索引擎网络搜寻器隐藏的子目录。
一种方法是robots.txt
在服务器的根目录中使用a (标准方法)。但是,任何知道网站URL并具有一些基本Web知识的人都可以访问robots.txt内容并可以发现不允许的目录。
我曾想过一种避免这种情况的方法,但我不确定是否可行。
我们X
是子目录,我要排除的名称。停止Web爬网程序索引X
目录并同时使某人更难X
从根目录识别目录的robots.txt
一种方法是robots.txt
在X
目录中添加,而不是在根目录中添加。
如果我遵循此解决方案,则会遇到以下问题:
- Web爬网程序会
robots.txt
在子目录中找到吗?(假设robots.txt
存在,并且已经存在于根目录中) 如果
robots.txt
在X
子目录中,那么我应该使用相对还是绝对路径?:User-agent: * Disallow: /X/
要么
User-agent: * Disallow: /