Google Web字体上的字体中的“拉丁”和“拉丁扩展”字形支持的语言?


69

Google Web字体选择字符集

Google Web字体上的某些字体支持多个“字符集”。问题是,如果我使用的Web字体仅提供“拉丁”字形,那么将页面翻译成不支持该字形的语言的用户将清楚地注意到混乱的文本。

我希望我的网络字体能够支持除英语之外的世界上最受欢迎的语言,例如西班牙语,德语,法语等。

为此,我想分别了解“拉丁语”和“拉丁语扩展”适合哪些语言。

我希望答案看起来像:

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

我在Google Web字体文档或Googling中找不到此信息。


7
比较字母后,我现在可以说字体的“拉丁”子集至少完全支持英语,西班牙语,德语和法语。
its_me 2013年

Answers:


92

拉丁

aka Unicode Latin1-Supplement(U + 0080至U + 00FF)旨在主要支持西欧语言(如您提到的法语,德语,西班牙语,葡萄牙语,意大利语,爱尔兰语,冰岛语,斯堪的纳维亚国家的语言,以及无意中的其他语言)在下面的列表中提到)。标准ASCII支持英语。ASCII(前127个字符,其中95个是字素U + 0020至U + 007E)被放置为Unicode中名为“基本拉丁语”的第一个块。此块被认为是“拉丁”的一部分,即使在非拉丁字体中也通常支持该块,以在基于拉丁语的系统上正确显示字体名称。

拉丁文扩展

Google字体上的Latin Extended意味着实际上阻止了Latin-Extended-A(U + 0100至U + 017F),该文本应(与“ Latin”结合使用)支持所有常见的拉丁文字。使用此块的大多数语言也使用“拉丁”字符,因此“拉丁扩展”字体通常包含“拉丁”字符的超集,但不能保证。

在Unicode中,在国家字母表中还需要拉丁字母-B块,用于字符Ə,Ș,Ț(但是这些字符经常被Extended-A中的Ä,Ş,Ţ代替)和越南语Ơ,Ư(但是在Google字体上有自己的类别)。

Unicode Latin-Extended-B和Latin-Extended-Additional块支持非洲拉丁语言,但Google的Latin Extended类别大多不支持这些语言。甚至还有更多奇特的C,D和E扩展名(共252个字符),但是我在现实生活中没有见过,因此我想Google也不会将其归入“拉丁扩展名”类别。

根据我的观察,如果Google字体包含Latin-Extended-A块中的某些字符,但不一定包含所有字符,则将其放入Latin Extended类别。Webfonts必须很小,以免减慢页面加载速度(首选woff / woff2格式)。字体包含的字符越多,字号越大(覆盖整个BMP的字体可以增长到10 MB以上)。作者经常描述他/她的字体的用途,因此只有他/她可以描述字符支持背后的逻辑。例如,Lato Google字体仅支持Latin Extended A块中的波兰语字符(作者是波兰人),但它属于Google的“ Latin Extended”类别。要了解字体是否支持特定语言,请尝试显示以下列表中的字符。

语言支持

从 下面在Omniglot和其他来源上检查过的拉丁字母列表中,我不算:

  • Latin Extended的有向图,通常用单独的字符代替(Æ受Latin1-Supplement支持,ß曾经是有向图)
  • 非拉丁字母,因为问题是关于拉丁语还是拉丁扩展语。有些语言使用两种书写系统:在正式采取拉丁语之前(如阿布哈兹),我不包括拉丁语很少见的书写系统(如哈萨克语)
  • 少数民族和死语(阿迪格语,阿奇语,波罗的海旧语言,比斯拉马语,查莫罗语,楚瓦什语,塞浦路斯语,达勒卡利语,埃斯特雷马杜兰语,法拉语,埃尔法达利语,法罗语,吉尔伯特语,格洛萨语,海达语和爱斯基摩人-阿留特语,伊奇祖语,伊努皮亚克语,拉特加利语语,伊斯特里奥Livonian,Ladin,Kashubian,Marshallese,Mirandese,Montenegrin,Old Norse,Nuxalk,Occitan,Romansh,Rotokas,萨米语,萨摩亚语,上索尔文和下索尔文,Tahitian,Tawlu,Tetum,汤加,乌利希亚语,Yapese,Zuni,印度印第安拉丁语字母)
  • 最新版本的字母表中未使用的历史字符(如双重音符,ſ,ĸ)
  • 几乎是语言学家专有的音译字符,即拼音,IPA,UPA

如果缺少重要的内容或电子通讯中使用了少数语言,请发表评论。

ASCII(基本拉丁语,即使在非拉丁字体中也经常受支持)

古拉丁语,南非语,阿斯图里亚斯语,科尔苏语,荷兰语,格陵兰语,盖尔语,海地语(Creolic),马来语,绍纳语,西西里语,斯瓦希里语。

还支持英语,并在Latin1 Supplement中添加了方便的“¢”(美国)和“£”(英国),尽管后来添加了其他货币符号(如“€”):自1998年Unicode 2.0以来,此代码块开始0x20A0)。

拉丁

  • 阿尔巴尼亚语Ç,Ë(Ç不是阿尔伯雷什方言)
  • 加泰罗尼亚语À,É,È,Í,Ï,Ŀ,Ó,Ò,Ú,Ü,Ç(Ext-A中的can可以标记为带点号·的L)
  • 丹麦文挪威文Æ,Å,Ø
  • 芬兰语Å,Ä,Ö,Š,Ž(来自Ext-A的Š,Ž很少使用,可以使用S,Z)
  • 菲律宾Á,À,Â,É,È,Ê,Ë,Í,Ì,Î,Ñ,Ó,Ò,Ô,Ú,Ù,Û
  • 法语Æ,Œ,Â,À,É,È,Ê,Ë,Ç,Î,Ï,Ô,Ù,Û,Ü,Ÿ,»,«(来自Ext-A的Œ较不常见,在路标上使用,但是人们通常在消息中使用oe,而从Ext-A中稀有的Ÿ仅以法语命名,其余的包括拉丁语ÿ中的,,此[fr]背后的故事Wikipedia上的注释[en]
  • 德语Ä,Ö,Ü,ß
  • 冰岛语Æ,Á,É,Í,Ó,Ö,Ú,Ý,Þ,Ð
  • 爱尔兰Á,É,Í,Ó,Ú
  • 意大利语Ì,Ù,ª,º(最后两个有时会被强调,英语在Numero-Nº中也很流行)
  • 卡西Ñ,Ï
  • 皮埃蒙特Ë,Ò
  • 葡萄牙语Á,Â,Ã,À,Ç,É,Ê,Ó,Ô,Õ,Ú,ª,º
  • 撒丁岛Ç
  • 西班牙语加利西亚语Ñ,¿,¡,ª,º
  • 瑞典语Å,Ä,Ö

拉丁文扩展

  • 阿泽C,G,I(无点小写),I,O,S,U,ə(ə从EXT-B是可更换由A,则相同的字母如土耳其)
  • 克里米亚TaÇ,Ǧ,I(无点小写字母),İ,Ñ,Ö,Ş,Ü(Ext-B中的can可以替换为Ext-A中的))
  • 塞尔维亚文波斯尼亚文克罗地亚文Ć,Č,Đ,Š,Ž
  • 捷克语Á,Č,Ď,Ě,É,Í,Ň,Ó,Ř,Š,Ť,Ú,Ů,Ý,Ž
  • 爱沙尼亚语Ä,Ö,Õ,Ü,Š,Ž
  • 世界语Ĉ,Ĝ,Ĥ,Ĵ,Ŝ,Ŭ
  • FriulianÂ,Ê,Î,Î,Û
  • 加加兹(摩尔多瓦)Ä,Ç,Ê,I(无点小写字母),İ,Ö,Ş,Ţ,Ü
  • 瓜拉尼语(巴拉圭)Á,Í,Ó,Ã,Ẽ,G̃,Ĩ,Ñ,Õ,Ũ,Ỹ(Ĩ,Ũ来自Ext-A,Ẽ,Ext来自Ext-Additional,G̃非Unicode,仅结合使用超出Ext-A范围的变音符号通常会用抑扬音(Ê,Ĝ,Î,Û,Ŷ)转录
  • 夏威夷Ā,Ē,Ī
  • 匈牙利语Á,É,Í,Ó,Ö,Ő,Ú,Ü,Ű
  • 哈萨克(2017-2025年计划从叙利亚改写)Ä,Ç,Ğ,I(无点小写字母),İ,Ŋ,Ö,Ş,Ü(多次修订,2019年版
  • 库尔德Ç,Ê,Î,Ş,Û
  • 拉脱维亚语Ā,Č,Ē,Ģ,Ķ,Ī,Ļ,Ņ,Ō,Ū,Ŗ,Š,Ž
  • 立陶宛语Ą,Č,Ę,Ė,Į,Š,Ų,Ū,Ž
  • 马耳他语Ċ,Ġ,Ħ
  • 毛利人Ā,Ē,Ī,Ō,Ū(少数民族,但自2015年以来更加知名和流行)
  • 波兰语Ą,Ć,Ę,Ł,Ń,Ó,Ś,Ź,Ż
  • 罗姆C,S,Z(口语,但很少书面语言)
  • 罗马尼亚语Ă,Â,Î,Ș,Ț(拉丁文Ext-B中的Ș 、,,可以使用Ext-A中的Ţ,))
  • 萨米语(北部,少数民族语言,但在Ext-A中有唯一的Ŧ)Á,Č,Đ,Ŋ,Š,Ŧ,Ž
  • 斯洛伐克语Ä,Á,Č,Ď,É,Í,Ĺ,Ľ,Ň,Ó,Ô,Ú,Š,Ŕ,Ť,Ý,Ž
  • 斯洛文尼亚Č,Š,Ž
  • 塔塔尔文(自2012年起)Ä,Ç,Ğ,İ,I(无点小写字母),Ñ,Ö,Ş,Ü
  • 土耳其语Ç,Ğ,I(无点小写字母),İ,Ö,Ş,Ü
  • 越南语Ă,Â,Đ,Ê,Ô,Ơ,Ư(Ext-B中的Ơ,Ư,加上组合音调0x300和0x301,请参阅下面的组合变音符号,在Google字体上有一个特殊类别)
  • 威尔士Â,Ê,Î,Ô,Û,Ŵ,Ŷ

拉丁扩展,非洲(大多数不支持拉丁扩展字体)。对非洲字母的全面支持包括Ubuntu,Fira Sans,EB Garamond,Tinos,News Cycle,Didact Gothic,M Plus,Sawarabi,Cousine,Caudex,Judson,Andika(当然还有Noto,请参见下文)

  • 巴里(刚果)Ŋ,Ö
  • Bambara(Mali)Ɛ,Ɲ,Ɔ(全部来自Ext-B)
  • Berber(Tuareg)(撒哈拉)Ă,Ḍ,Ɣ,Ǝ,Š,Ž,Ḥ,Ḷ,Ṣ,Ṭ,Ẓ(Ext-B中的Ɣ,Ǝ,Ext-Additional下方带有点的字符)
  • 奇切瓦(Chewa)(东非)Ŵ
  • Dagbani(刚果)ɛ,ɣ,Ɔ,N,ʒ(ɛ,ɣ,Ɔ从EXT-B)
  • 丁卡语(苏丹)Ä,Ë,Ɛ,Ɛ̈,Ɣ,Ï,Ŋ,Ö,Ɔ,Ɔ̈(Ext-B中的Ɛ,Ɣ,Ɔ,Unicode,Ɔ̈不是Unicode,仅结合了变音符号)
  • Fula(西非)Ɓ,Ɗ,Ƴ,Ŋ(Ŋ来自Ext-A,其余来自Ext-B)
  • 豪萨语(乍得)Ɓ,Ɗ,Ƴ,Ƙ,R̃(R̃不是Unicode,仅结合了变音标记,其余来自Ext-B)
  • 伊博(尼日利亚)Ṅ,Ị(额外)
  • 马达加斯加(马达加斯加)N̈(非Unicode,仅结合变音符号,才能用拉丁文中的Ñ代替)
  • Pan-NigerianƁ,Ɗ,Ǝ,Ẹ,Ị,Ƙ,Ṣ,Ụ(Ext-B中的Ɓ,Ɗ,Ǝ,Ƙ,Ext-Additional中的Ẹ,Ị,Ṣ,Ụ)
  • 沃洛夫(塞内加尔)À,É,Ë,Ñ,Ŋ,Ó
  • 约鲁巴语(西非)Ẹ,Ọ,Ṣ(Ext-Additional +组合音调Á,À,Ā)

结合变音标记

或者,字体可以支持“组合变音标记”块:U + 0300至U + 036F。例如,Ř可以将其键入为U+0158(aka预先组成的字符)或R+ U+030C。支持Unicode的程序应该既显示又将其视为独立字符,但是如果程序或字体不支持全部字符,则组合的变音标记可能会放错位置(例如,我的系统中的low太低),请参见此关于此主题的非常详细的Unicode问题与解答。

具有多国语言支持的有用字体

您可能想通过Font Squirrel服务自定义某些字体(如果它们的许可证允许)或将它们用作备份。有广泛支持的免费字体开始于:

  • 我真的很喜欢带11个以上字符的衬线Quivira开放字体,1.5 MB
  • 许多计算机都安装了Arial Unicode(MS Office的一部分,50k +个字符,22 MB)
  • Google有一个Noto项目,其中包含所有但最新的unicode字符,包括serif,sans-serif和UI字体,按块支持很好地排序(1.1 GB)
  • 作为最后的备份字体,您可能会认为Unifont看上去丑陋(50个以上的字符,但只有11 MB,并且适合嵌入式设备)

14
您是否知道Google Web字体上的“拉丁扩展”字符集同时包含Latin1-Extended-A和Latin1-Extended-B字符,还是仅包含其中之一?
its_me 2014年

5
在Google Web字体上,“拉丁扩展”是指该字体包含来自Latin1-Extended-A和Latin1-Extended-B的某些或所有字形。
MatTheCat 2015年

@MatTheCat(或任何其他阅读此书的人),只要有机会,您就可以提供一个链接,以引用您声明中有关Google拉丁扩展字体定义为“ Latin1-Extended-A和/或Latin1-Extended-的某些或所有字形”的声明。 B”?

根据波兰的问候, 波兰人在这个答案中还缺少一个额外的符号:“Ą”(应该是评论)
皮特·

1
Š,Ž在芬兰语中很少使用,仅使用诸如“šekki”之类的奇怪进口词(意即支票,可以使用normal代替)。我会说它们不是必需的。
ollpu '18
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.