我的WordPress博客已完全克隆。该克隆站点通过我的博客实时更新。我很惊讶有人能做到这一点。
我该怎么做才能停止对搜索引擎排名的有害影响?有什么办法告诉Google不要将该网站编入索引?
我的WordPress博客已完全克隆。该克隆站点通过我的博客实时更新。我很惊讶有人能做到这一点。
我该怎么做才能停止对搜索引擎排名的有害影响?有什么办法告诉Google不要将该网站编入索引?
Answers:
他们只是通过服务器端脚本加载您的网站。您需要做的就是通过.htaccess阻止其服务器的IP地址。只需打开服务器的访问日志,在其站点上打开克隆的页面,然后查看日志中的新条目,即可获得其IP地址。
同样也可以向Google提交DMCA请求,但这确实没有必要,因为一旦您阻止了他们的IP地址,该内容就会立即消失。
(除了@John的答案。)
有什么办法告诉Google不要将该网站编入索引?
奇怪的是,尽管他们似乎已经克隆了所有内容(包括您的XML网站地图* 1),但他们还没有克隆您的robots.txt文件。实际上,该站点上的robots.txt 会主动阻止所有内容的抓取!因此,在这方面似乎没有任何事情要做。在该域上进行站点搜索只会返回裸域和一条声明,指出该域已被robots.txt阻止。
(而不是好奇他们这样做的意图是什么?您可能只是假设他们在robots.txt中犯了一个错误-也许是这样-但这对我来说似乎更是故意的例外?)
另外,虽然克隆了XML网站地图,但它们并没有更新其中的URL(就像在主网站页面上一样),因此它们仍指向您的网站。
* 1关于XML网站地图。在您的站点上,“ sitemap.xml”实际上是到“ sitemap_index.xml”的重定向,而克隆的站点实际上已经克隆了该重定向...,它会重定向回到您的站点!(肯定是他们的错误。)“ sitemap_index.xml”只是一个索引,它链接到其他4个站点地图。如果直接在克隆的站点上直接请求这些实际站点地图中的任何一个,则将正确克隆它们并更新URL。但是,我曾说过,由于“ sitemap.xml”的初始重定向,因此不太可能在克隆的站点上找到这些站点地图。(?)尽管如果他们确实直接提交了“ sitemap_index.xml”,那么显然可以绕过重定向。
如果该网站向您提供反向链接,则务必使用Google Disavow工具,否则该算法将对您不利。
https://www.google.com/webmasters/tools/disavow-links-main
创建一个.txt文件并添加:
domain:thedamnsitethatcloned.com
然后通过网站站长工具将其上传到Google。
这正是我要解决此问题的步骤。我知道很多网站管理员都面临这个问题。我以前曾遇到过这个问题,而且讽刺的是,在Google上似乎还没有一个直接的答案(这就是我想提供帮助的原因)。马特·卡茨(Matt Cutts)是您应该听这些问题的家伙,但听他说话就像是在燃烧着的房子里与超级计算机对抗国际象棋比赛一样(找不到帮助)。
简短的Cutts:
我的第一个答案是拒绝该域,但我忘了提到您需要拒绝:
(Google将它们视为两个单独的域)。