我正在一个网站上,该网站将按照language+region
W3.org页面上的描述提供本地化内容(例如,fr-CA
用于加拿大法语内容和fr-FR
“法国法语”内容)。由于我们认为每种内容language+region
都是唯一的,因此对我们来说至关重要的是,搜索引擎应正确识别并相应地提供内容。
通过在Internet上查找(例如,这个问题),似乎大多数人建议在HTML 属性中使用ISO639语言代码lang
来描述内容语言。遵循此建议,我们会使用<html lang="fr">
它,从而无法区分上述language+region
组合。
在审查HTML4规范时,似乎language+region
可以很好地将其用作语言代码,因为该en-US
示例是一个可能的值。但是,我在HTML5规范中找不到对此的任何确认,该规范似乎未提供有关可能的允许值的任何示例。
在那儿,我试图通过观察网络巨头们在做什么来获得事实上的答案。我看了一下Facebook在做什么:他们提供的Candian法文和法文法文网站内容(略有不同),而HTML lang
值保持不变:
fr-CA
URL:http : //fr-ca.facebook.com
HTML lang属性:<html lang="fr">
“电子邮件”一词的翻译:courriel
fr-FR
URL:http : //fr-fr.facebook.com/
HTML lang属性:<html lang="fr">
“电子邮件”一词的翻译:Adresse électronique
推荐/标准的方法来描述使用language+region
HTML5中的方法本地化的内容?