网络中的连字对SEO有何影响


19

所有设计师都喜欢连字,但香草网版印刷确实很烂。我听说聪明的家伙,解决了很多的问题放入系统,带来性感的报价,华丽的连字号和所有。从视觉上看,它是完美的。

但我担心SEO。假设在网页上,单词finally变为finally。搜索引擎是否可以在搜索时索引该单词并返回页面finally(不带连字)?

Answers:


3

摘要

如果您的服务器发出带有连字的页面(如smartypant一样),则搜索引擎不一致。Bing当前未正确索引连字。我通常会说这是自找麻烦。由于搜索引擎发生了变化,因此下面可以使用一种方法来测试您对索引连字感兴趣的搜索引擎的方式

如果您的服务器提供带有常规文本的页面,那么 Javascript会将它们转换为连字,这很好。搜索引擎不会在将页面编入索引之前应用Javascript内容更改(尽管有人声称有一些例外,例如加载Facebook注释)。由于存在一种为搜索引擎提供动态内容的行业标准方法,并且该方法已获得Google的认可,因此,如果将来对此进行更改,这将是一个很大的惊喜。Google建议您使用纯文本浏览器(例如,建议使用Lynx)浏览您的网站,以查看搜索引擎如何看待您的内容。


有关第一种情况的更多详细信息(页面上的代码中连字)


理论上

...它对设置良好的搜索引擎没有任何影响。

首先,它有助于理解字形和字符之间的区别。连字是代表两个字符的一个字形f i。软件如何处理取决于软件并取决于上下文和手头的任务-您将从该链接问题中的示例中看到,当您复制和粘贴字形时,粘贴的内容会有所不同:有时会粘贴字形,有时该字形被视为与其关联的字符,f并被i粘贴。

任何对文本语义感兴趣的精良的自动文本处理器(搜索引擎,拼写检查,屏幕阅读器...)都应将字形与其所代表的字符视为相同,并应将其视为finally与相同finally,因为这就是文本字形的含义。

在实践中

并非所有东西都是精心制作的...

这是测试搜索引擎的简便方法。这是另一个问题的一行文字:

Copy the ligature fi from Illustrator to this input box

如果我们采用该句子的非连字版本并在双引号中进行搜索:

(正在搜索"Copy the ligature fi from Illustrator to this input box"):

  1. ...如果搜索引擎将连字形视为它们所代表的字符的匹配项,它将找到该页面(并且在对其进行索引时,也就是该页面)
  2. ...如果搜索引擎将连字字形与它们所代表的字符区别对待,则直到对该页面进行索引之前,它都将找不到任何内容,然后,它只会找到此页面,并且使用连字字形的搜索将找到该页面。
  3. ...如果一个搜索引擎怪胎即期诸如连字字形完全,它会发现什么都没有,甚至没有这个页面,并与结扎版本也将一无所获搜索

全球排名前5的搜索引擎的一些快速搜索结果(链接是搜索结果):

  • Google:很好(类型1)(尽管下面有注释,但它可以处理Unicode或HTML实体格式)
  • 必应:失败类型2)。
  • 雅虎:失败类型2)(结果是雅虎是“由必应提供技术支持”)
  • Yandex(俄语):良好(类型1)
  • 百度(中文):erm,百度搜索中根本没有显示graphicdesign.stackexchange.com页面...也许我们被禁止了...?!

不,我刚刚编辑了答案,请查看该链接上的源代码。其所有unicode都类似于ff Google的Algorithm会忽略该算法。
瑞安

其实Google并匹配:看什么突出位置(绷带)这里(明文) -都匹配both.But我与你的意见同意...
user56reinstatemonica8

...(这些URL很大,需要2条注释),似乎确实很麻烦。如果bing不匹配连字,其他重要服务也不会。
user56reinstatemonica8 2013年

查看第一个链接的URL及其匹配的源代码:您会发现Google的Unicode格式没有问题(当前...),并且它对Unicode连字,HTML实体连字和常规的单独字符对进行了索引就像f i没有任何问题一样。谷歌似乎可以应付-但是,不同的搜索引擎之间的不一致(至少在我的书中)是一个破坏者。
user56reinstatemonica8 2013年

3

根据一个实时示例,我看到我将非常关注此功能的广泛使用,因为它将影响SEO。特殊字符被解析为Unicode,因此Google的算法不会读取它。对于保留用途应该没问题,但是我不会为之疯狂或将其用于任何重要的事情,例如标题。

这是我看过的实时示例的链接:http : //pages.cs.wisc.edu/~wolfson/ligatures.html


我认为它们不会成为源代码中的那些字母。看起来smartypant是服务器端的东西,它解析输入并将字形保存到存储在数据库中的文本中,因此也保存为源代码。话虽如此,我认为对于seo还是可以的。
user56reinstatemonica8 2013年

啊,实际上我确实检查了元素,但实际上没有查看源代码。我将编辑答案。
瑞安(Ryan)

1
我绝对同意“极为关注”,众所周知,unicode支持不一致。但是,根据记录,Google可以(当前...)索引unicode,并确实(当前...)将该页面上的那些unicode连字与搜索l i f i等匹配(请参见在预览中如何将它们加粗)。但是我绝对不想依靠它……
user56reinstatemonica13 2013年

如果通过javascript放置连字怎么办?它不会更改html文档,因此对搜索引擎完全不可见吗?那是一个解决方案吗?
TKrugg

是的,应该没问题-搜索引擎通常会在不应用JavaScript的情况下为原始文档建立索引。您可能想检查一下这样做是否没有显着减慢页面加载时间,并且在页面加载过程中用连字替换了香草字符时,查看者不会感到震撼。
user56reinstatemonica8 2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.