Answers:
您根本不希望页面出现在SERP中...
请勿禁止robots.txt。而是在页面上添加noindex元标记(或X-Robots-Tag HTTP标头)。
正如j0k所暗示的,可以以某种方式找到您的页面。统计报告,目录列表等...
禁止robots.txt阻止网页被抓取,但仍可以建立索引,并可能在SERP中显示为仅URL链接。就像是:
noindex元标记可阻止页面完全显示在SERP中-但是Google必须能够抓取页面才能看到noindex元标记-因此,它不能在robots.txt中被禁止!
如果页面上有任何内容不能公开使用,则页面必须在某种身份验证之后。
好吧,我认为您有一个不错的搜寻器,可以读取robots.txt并遵循指令。和其他不遵循指令的。
您打算如何提供该网址?通过电子邮件,使用Facebook或Twitter?所有这些服务都对您发送的信息进行爬网。Gmail会解析您收到的电子邮件以提供广告。因此,您的网址将以某种方式进行爬网。
有些人使用Google工具栏(或搜索引擎中的其他任何工具栏)。有一个选项(如果我还记得的话,默认情况下已选中),该选项允许工具栏将您访问的所有网址发送给Google。这是Google查看隐藏网络的另一种方法。因此,即使您告诉某人不要共享该URL,也隐含地他(她)会(由于工具栏)。
我认为我们可以找到许多其他可能性。
因此,您可以将其添加到robots.txt中,还可以提供额外的元数据,例如noindex,nofollow等。
编辑:
w3d关于robots.txt的建议对我来说似乎很好。因此,请勿将其添加到robots.txt中并提供适当的元标记。