有人克隆了我的WordPress博客,如何防止它损害SEO?


8

我的WordPress博客已完全克隆。该克隆站点通过我的博客实时更新。我很惊讶有人能做到这一点。

我该怎么做才能停止对搜索引擎排名的有害影响?有什么办法告诉Google不要将该网站编入索引?


我现在看到这似乎已被“修复”-克隆的站点不再“克隆”。您到底是如何实现的?
MrWhite 2015年

1
@ w3d经过两周的时间与Amazon Hosting的几次交谈之后,他们决定关闭该克隆站点。谢谢大家。
Tanvir Hasan 2015年

请注意,当您要求侵权时,dmca.comgoogle.com/webmasters/tools/dmca-dashboard是不同的。
展示图像

Answers:


10

他们只是通过服务器端脚本加载您的网站。您需要做的就是通过.htaccess阻止其服务器的IP地址。只需打开服务器的访问日志,在其站点上打开克隆的页面,然后查看日志中的新条目,即可获得其IP地址。

同样也可以向Google提交DMCA请求,但这确实没有必要,因为一旦您阻止了他们的IP地址,该内容就会立即消失。


2
我会仔细考虑向Google提出DMCA请求的建议。我们最近看到了各种各样的形式,但我不确定是否会带来收益。但是,我建议不要在Google做某事时一段时间内阻止它们-然后我会阻止它们-但是当Google从列表中将它们删除时,您可能不必这样做。我只是建议,如果您向Google提交DMCA投诉,请给他们一段时间以进行调查,然后再予以阻止。否则,请立即将其阻止。
closetnoc

1
嗨,约翰·康德(John Conde),我尝试使用以下代码通过.htaccess文件阻止其IP地址:“命令拒绝,允许从[该IP地址]拒绝”,但是该克隆站点仍在使用我的实时更新。正确的代码来阻止该IP?
Tanvir Hasan 2015年

2
@TanvirHasan如果您拥有正确的IP地址,那是正确的想法。是该IP地址仍然出现在您的访问日志,当您访问,“克隆网站”?
MrWhite 2015年

我的托管服务提供商将这些命令放在.htaccess文件中,他们是从日志中获取该IP地址的人。但这是行不通的。
Tanvir Hasan 2015年

这个解决了吗?
closetnoc

5

(除了@John的答案。)

有什么办法告诉Google不要将该网站编入索引?

奇怪的是,尽管他们似乎已经克隆了所有内容(包括您的XML网站地图* 1),但他们还没有克隆您的robots.txt文件。实际上,该站点上的robots.txt 主动阻止所有内容的抓取!因此,在这方面似乎没有任何事情要做。在域上进行站点搜索只会返回裸域和一条声明,指出该域已被robots.txt阻止。

(而不是好奇他们这样做的意图是什么?您可能只是假设他们在robots.txt中犯了一个错误-也许是这样-但这对我来说似乎更是故意的例外?)

另外,虽然克隆了XML网站地图,但它们并没有更新其中的URL(就像在主网站页面上一样),因此它们仍指向您的网站。

* 1关于XML网站地图。在您的站点上,“ sitemap.xml”实际上是到“ sitemap_index.xml”的重定向,而克隆的站点实际上已经克隆了该重定向...,它会重定向回到您的站点!(肯定是他们的错误。)“ sitemap_index.xml”只是一个索引,它链接到其他4个站点地图。如果直接在克隆的站点上直接请求这些实际站点地图中的任何一个,则将正确克隆它们并更新URL。但是,我曾说过,由于“ sitemap.xml”的初始重定向,因此不太可能在克隆的站点上找到这些站点地图。(?)尽管如果他们确实直接提交了“ sitemap_index.xml”,那么显然可以绕过重定向。


1
我是在几分钟前向站点地图提出请求的,从垃圾邮件站点到原始站点有301重定向。
closetnoc

@closetnoc啊,是的!我以前很想念 实际上,“ sitemap.xml”也是原始网站上的重定向...它重定向到“ sitemap_index.xml”。垃圾邮件站点似乎正在克隆此重定向,从而将用户重定向回原始站点!如果您直接在垃圾邮件站点上请求“ sitemap_index.xml”中列出的4个站点地图中的任何一个,则垃圾邮件站点会正确地克隆它们,但是由于初始重定向,我猜很难找到它们,除非他们知道提交“ sitemap_index.xml”而不是“ sitemap.xml”。我已经更新了答案。谢谢。
怀特先生

3

如果该网站向您提供反向链接,则务必使用Google Disavow工具,否则该算法将对您不利。

https://www.google.com/webmasters/tools/disavow-links-main

创建一个.txt文件并添加:

domain:thedamnsitethatcloned.com

然后通过网站站长工具将其上传到Google。

这正是我要解决此问题的步骤。我知道很多网站管理员都面临这个问题。我以前曾遇到过这个问题,而且讽刺的是,在Google上似乎还没有一个直接的答案(这就是我想提供帮助的原因)。马特·卡茨(Matt Cutts)是您应该听这些问题的家伙,但听他说话就像是在燃烧着的房子里与超级计算机对抗国际象棋比赛一样(找不到帮助)。

简短的Cutts:

  1. 在DMCA中注册,并将徽章放在您的网站上。
  2. 通过将您网站中的前60个单词粘贴到Google中并通过https://www.google.com/webmasters/tools/dmca-dashboard进行子更改,收集所有复制的内容 DMCA请求仅接受永久链接。
  3. 拒绝每个复制了内容链接回您的站点。在您网站的每个页面上执行此操作。

我的第一个答案是拒绝该域,但我忘了提到您需要拒绝:

  • 万维网。和
  • 非www。

(Google将它们视为两个单独的域)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.