我有一个要从搜索引擎网络搜寻器隐藏的子目录。
一种方法是robots.txt在服务器的根目录中使用a (标准方法)。但是,任何知道网站URL并具有一些基本Web知识的人都可以访问robots.txt内容并可以发现不允许的目录。
我曾想过一种避免这种情况的方法,但我不确定是否可行。
我们X是子目录,我要排除的名称。停止Web爬网程序索引X目录并同时使某人更难X从根目录识别目录的robots.txt一种方法是robots.txt在X目录中添加,而不是在根目录中添加。
如果我遵循此解决方案,则会遇到以下问题:
- Web爬网程序会
robots.txt在子目录中找到吗?(假设robots.txt存在,并且已经存在于根目录中) 如果
robots.txt在X子目录中,那么我应该使用相对还是绝对路径?:User-agent: * Disallow: /X/要么
User-agent: * Disallow: /