由于DMCA,某个网页已从Google中删除,其入站链接仍然有价值吗?


9

好的,我相信这是一个棘手的问题:

因此,您有一个网站,该网站针对帖子进行了DMCA删除,该帖子收到了大量流量,因此DMCA删除可能是正确的,也可能不是正确的,但我目前没有时间或资源来与之抗争。

我的问题是,删除了DMCA的页面已经从SERPS中隐藏了,但是该帖子仍然保留在我的博客上-因为它收到了大量的流量,因此产生了大量的高质量反向链接。 .. 因此,这些反向链接发生了什么,该页面仍在站点上,但已在Google数据库中删除(隐藏),反向链接是否仍然具有分量...?

编辑1:在Google搜索链接时,将显示以下内容:

针对我们根据《美国数字千年版权法案》收到的投诉,我们从此页面中删除了1个结果。如果您愿意,可以在LumenDatabase.org上阅读引起删除的DMCA投诉。

编辑2帖子起源的旧站点已经有好几个月了,并且仍然rel canonical指向我网站上的博客帖子,该博客帖子现在由DMCA发行...但是rel canonical自DMCA发行以来,该帖子已被忽略,尽管rel canonical其余指向我的站点...那是值得的


您的第二次编辑让我思考(我讨厌)。您是该帖子的原始作者吗?如果是这样,那么另一个网站如何声称您偷走了他们的内容?需要考虑的事情。
closetnoc

@closetnoc我写的文章,这是一个生意在我的(以前)的合作伙伴,我做了一个网站,我们同意拆分,我把我的帖子到我的新网站,他同意把rel canonical我的新网站的简而言之,发生了几件事-简而言之,他注意到我所写的帖子(最初发布在我们的共享域上)开始产生大量流量,他发酸并提交了DMCA反对该帖子,(该帖子已经获得了超过10万的社交分享,并在一些主要的公开场合中提到了该帖子)您认为这是窃...基于上述解释?
蒂莫西·库切

抄袭不是这个词。但是,如果提出了虚假的DMCA投诉,我会毫不犹豫地与之抗衡。根据法律,这是“虚假宣誓”。这是犯罪。向他们解释您向我们解释的内容。我建议聘请版权律师写一封或两封信,一次停止并致函您的前合伙人,另一封信是为了与之抗争。信件价格便宜,通常可以快速解决问题。无论出于何种原因,当律师参与进来时,人们都会认真对待事情。这并不意味着提起诉讼,而只是意味着您可以做最少的事情来确保赢得胜利。
closetnoc

Answers:


7

好的。这将是我将逐步完成该过程以使其变得更加清晰的情况之一。它会有点长,但希望不会很痛苦。

让我们从头开始吧?

从我们对Google如何运作的最初了解基于Brin和Page于1997年发表的研究论文开始,我们了解了一些事情,这些事情很可能在今天仍在发挥作用。

Google在其索引和提取队列中包含一个URL,并提取页面。该页面的代码存储在其数据库中,用于各种形式的处理。流程之一是查找新链接。Google找到的任何链接(如果存在)将首先位于链接索引中。如果不是,则将链接添加到链接表并添加到获取队列。

链接表中的任何链接都至少具有以下元素:链接URL,源URL和链接文本。可能还有其他数据元素,但是这些没有推动讨论。添加到链接表的任何链接均具有已验证的源URL,但不一定是目标URL。以关系数据库为例,源URL和目标URL可以是URL表中的URL ID,而联接表将使用ID将链接表的源URL和目标URL元素联接回URL表。困惑?不用了

对于未提取目标页面的任何情况,链接表中的链接都称为悬挂链接。提取页面后,链接表中的链接就完成了。如果目标页面不存在,则链接表中的链接是断开的链接。简单?

只有完整的链接才能传递价值。PageRank算法需要完整的链接才能计算值。所有悬空和断开的链接都会停止使用该链接的任何计算。以前,PR是一个递归过程,它将反复使用链接表来计算链接值,直到可以调整为任何链接的值落入一个很小的数值以至于不会产生任何效果的数值。我敢肯定,这仍然是房屋整理过程。但是,今天的PR是使用类似于网络中跃点的另一种方法来计算的,该方法比较重要地测量了从一页到另一页的距离。它基于信任网络模型,这是原始PageRank模型被设计为模仿的方式。链接是从一个实体到另一个实体的信任投票。虽然比这更复杂,你明白了。它可以使用更实时的计算来有效地执行与递归过程相同的操作,尽管精度可能较低,但足够可靠。这需要完整的链接,因为如果未建立信任关系,则不能传递信任值(使用信任网络模型)。请记住,链接是信任投票或信任网络模型中的链接。PageRank在信任网络中表示为信任值。

现在您已经了解了链接及其重要性,让我们继续。

对于搜索引擎,删除任何URL没有任何意义。如果URL表中不存在URL,那么您将不知道有关该URL的任何信息,并且将一无所获。通常,除非有意义(例如,URL不再存在),否则可能不会删除URL。但是,当页面设置为NOINDEX时,则明确指示搜索引擎不要对该页面编制索引。由于索引中的网页由URL和HTML源代码两部分组成,因此NOINDEX此时将有效地删除该页面。到NOINDEX页面的链接至少是悬空的。

现在您知道索引页的外观,让我们继续。

搜索引擎可以用多种方式惩罚网页或网站。一种是退市。这是所有处罚中最严厉的,需要很长时间才能恢复。您可以证明这一惩罚类别,因为该页面不会也无法找到。同样,Google Search Console还将以某种方式告知您页面已被除名。在其余的罚款中,这些罚款适用于SERP过滤器。

当执行搜索查询时,实际上一次有几个针对索引的查询,然后根据一部分算法将其混合到结果集中。剩下的算法(我们通常称为单个实体)是一系列相对简单的SERP算法。其主要算法将根据更多实时指标(例如趋势)对结果集进行重新排序。在这些算法中,从结果集中删除条目或严重降低条目在结果集中的位置的算法称为过滤器。应用的是处理DMCA的过滤器,例如...we have removed 1 result(s) from this page...

因此,既然您知道如何应用罚款,是否已连接链接,PR和DMCA过滤器?

有了这个,我们知道已经应用了一个过滤器,但是,这与链接索引无关,后者是PageRank的计算方式。它已尽可能远离链接/ PR流程。链接和PR在索引过程的开始,而删除DMCA罚分页在查询过程的末尾。实际上,这是两个完全独立的引擎。因此,尽管某个页面可能由于DMCA投诉而被删除,但实际上并没有从索引中删除该页面,因此仍会计算出该页面的链接。

像泥一样清澈?我希望我能解释得很好。请让我知道是否可以为您澄清。

[更新]

不适用于OP的情况的例外。

@StephenOstermiller提出了一个不错的观点,但并不破坏上述观点,不过,我想补充一下以确保完整性。

众所周知,在搜索中为网站或页面评分需要很多因素。尽管这不像您想象的那么技术性或神秘性,但仍然需要权衡很多因素。我忘记了信任分数的影响,主要是因为它不适用于OP。所以我在这里添加它。

显然,有些网站是垃圾网站之类的,但没有任何根据。在网站的这种分类中,有一些网站是惯常滥用版权内容的网站。多年前,这是一个巨大的问题,内容刮板将通过您的辛勤工作来建立网站。长期以来,什么都没做。具有原始内容的网站会相当一致地输给抓取网站。我应该知道。我有两个PR 8站点,因为刮板站点根本没有任何资源,几乎失去了所有流量。

但是情况已经改变。自从发生重大变化以来,大约只有四年的时间。

对于这些特殊的网站分类,可以显着降低网站的信任度。这是众所周知的。重建信任分数需要花费数年,对于某些站点,这可能永远不会发生。例如,为什么您认为域获利者如此愿意彻底破坏一个站点,而成千上万的站点正等待同样的滥用呢?这是因为现实是,某个域可能会破坏其价值,而无法救赎。

建立信任有许多因素。我不会在这里讨论。但是,您一定要知道,信任是任何站点构建等级的主要组成部分。

也就是说,对于任何严重违反DMCA且拥有相当丰富记录的网站,其信任度都会受到严重影响。这不是OP所描述的方案。但是,这是我在这里假设的情况。

链接和建立PageRank具有多个组件。一种是页面本身的PageRank(权限)。对于高度权威的页面,有权限上限。PR 8页面在该页面上的链接之间不会共享8的值。这是旨在将更自然的曲线放入PR的原始PageRank算法的一部分。否则,即使经过很长时间,新页面也几乎不可能与具有较高权限的页面竞争。链接本身的值使用多种因素评分,包括链接文本的语义值,链接URL,链接的位置(突出),包含链接的内容块的语义值(如果适用)等。所有链接得分从0到0.9。权限和链接分数的计算是任何链接传递的值。

好,好。那么,这对严重违反DMCA的网站有何影响?

入站链接的值不一定受目标站点的信任度影响,因为链接值来自源站点。但是,任何出站链接都可以。任何严重滥用DMCA的网站的权限都将受到信任评分的影响。毕竟,权威来自信任。因此,以这种方式,入站链接的值将不会通过出站链接,而不会根据信任分数而降低。

这在某种程度上改变了答案。

尽管这不适用于OP的情况,但是在某些情况下,入站链接值没有完全违反DMCA的原则通过站点传递。但是,这是一个困难的情况,因此在此之前的阈值很重要。


非常感谢您提供详细的答案...我将再打开几天以查看可能还会发生什么...我将做更多的研究,并在我接受答案之前向您提出一些问题接下来的两天,如果可以的话-再次感谢您抽出宝贵出这一切的时候
蒂莫西·库切

Google将DMCA请求循环回了一个排名因素:searchengineland.com/… 该算法针对许多DMCA请求,而不是针对该问题的一个。降低到DMCA抑制页面的链接可能是该算法更新的一部分。与大多数事情一样,谷歌也没有说。我也不知道测试它的好方法。
斯蒂芬Ostermiller

但是,我同意closetnoc的观点,因为DMCA适合索引编制过程,因此Google必须编写代码专门对这些链接进行贬值。
斯蒂芬Ostermiller

@StephenOstermiller是的。我忘记了这一点。基本上,索引引擎会建立等级度量,包括与域和信任度量的链接,而其他实体可能会降低等级。SERP过滤器是动态的。本文中提到的内容似乎是一类持续的违规行为,这些行为会降低站点的信任度。如果网站赢得信任,就很难取回它。可能需要数年。站点信任等级可能会影响出站链接的价值。当咖啡因含量更高时,我将在回答中看看是否可以理解这一点。感谢您提出来!干杯!!
closetnoc

@StephenOstermiller我必须考虑的部分是信任分数是否影响出站链接的值。我会这样想,但不确定如何运作。我需要考虑一下。当然,这不会影响我所看到的入站链接的值。蚂蚁是影响OP的部分。
closetnoc

2

哈哈,我想我实际上已经完全理解了这个问题:/

收到通知的是您,指向您网站的链接在GOOGLE搜索中隐藏,该文件仍位于您的网站上,并且还有许多指向您的网站的其他链接,当显示时,这些链接对您的网站有重要作用GOOGLE链接到您的网站,并且该链接的Goggle搜索底部显示“ OMITTED”通知信息。:P我说的对吗?

鉴于此-

对于提交DMCA移除通知的人来说,我的原始答案会很有帮助-击鼓

所以这是我的答案:不,地狱不!

这些特定的链接基本上是不可信的,您应该担心它们仍然链接到您的站点。您不妨采取拒绝行动并保护自己。真的。

此外,应该更多地关注其他站点所有者,并且为什么审核您的反向链接可能非常重要。作者发布这些链接的这种类型的关联历史将对其产生不利影响。

您可以考虑让其他人知道他们有指向您的不良内容链接,并可能伤害他们。

老实说,这种类型的内容不适合您或他们使用,并且您永远不应依靠这些类型的链接来使您的SEO受益。

短期决策可能会产生长期影响。

我想知道为什么您一次又一次泄漏信息。


1
谢谢您的贡献...请参见@closetnoc的答案,我相信它是更详细和准确的描述,我不认为您应该在这种情况下使用dissavow。我当然不会将链接描述为来自TheIrishTimes,nzherald等PR8 +网站的不信任链接?还要记住,帖子的来源域仍然指向rel canonical我的网站,即使由于DMCA通知而不再受到尊敬...
Timothy Coetzee

1

有趣的问题。我认为,由于该网页已从数据库中删除,因此不会被Google抓取或编制索引,因此不会通过反向链接传递任何权益。我相信Google仍会抓取未编入索引的网页,但是我不确定当页面从Googles数据库中删除后,即使该页面仍在站点上,这是否有所不同。


你说的没错。该链接将是一个悬空链接,而不是断开的链接,并且由于该页面将不存在于索引中,因此无法真正传递任何值。这包括未索引页面中的链接。有人说这些页面确实存在,即使它未在SERP中显示,也可以计算链接。这可能是部分正确的。仅仅因为未对页面建立索引并不意味着未获取该页面并且不计算链接。这仍然是可能的。但是,我认为G不会那么努力,并且可以在链断裂的情况下生存。由辩论。
closetnoc

看该页面确实存在,并且Google知道它,因为如果您进行精确搜索就会得到该信息,In response to a complaint that we received under the US Digital Millennium Copyright Act, we have removed 1 result(s) from this page. If you wish, you may read the DMCA complaint that caused the removal(s) at LumenDatabase.org.因此google知道这一点,因此链接并非没有负担....?
蒂莫西·库切

1
@TimothyCoetzee如果您可以在SERP中找到该页面,则可以进行链接计数。...我们已从此页面中删除1个结果...是一个提示。这是一个SERP过滤器,因此,该页面存在并且对链接进行计数。干杯!!
closetnoc16年

1
为什么不抓取页面?我不希望Google停止抓取由于DMCA而从搜索引擎中删除的内容。
斯蒂芬·奥斯特米勒
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.