我很多次遇到所谓的“ 打字机撇号 ”(Unicode字符U+0027
和HTML符号'
)来表示撇号:
但另一方面,也可以使用“ 右单引号 ”(Unicode字符U+2019
和HTML符号’
)代替:
我现在想知道,哪一种是正确的,应该在版式中使用?
注意:在两个示例中都使用了sans-serif字体Arial。
我很多次遇到所谓的“ 打字机撇号 ”(Unicode字符U+0027
和HTML符号'
)来表示撇号:
但另一方面,也可以使用“ 右单引号 ”(Unicode字符U+2019
和HTML符号’
)代替:
我现在想知道,哪一种是正确的,应该在版式中使用?
注意:在两个示例中都使用了sans-serif字体Arial。
Answers:
单引号最初出现在16世纪的意大利印刷宇宙中,是弯曲的形状,表示从手写的古典意大利诗歌中复制出来的省略号。从某种意义上说,撇号等效于我们的“ Gotchas”或“ Wannas”,这是一种通过使文本听起来更像人的方式来消除文本僵化的方法。
这是第一次打印撇号的示例。它取材于彼得拉克(Petrarch)撰写的意大利经典名著《勒·科斯·沃尔加里·迪·弗朗西斯科·弗朗切斯科》(Le cose volgari di messer Francesco),由阿尔杜斯 ·马努蒂乌斯(Aldus Manutius)于1501年左右在意大利出版。
据推测,Aldus Manutius是从他的一个朋友拥有的Petrarch原始手抄本抄袭此书的。他根据诗人的笔迹设计了一种特殊的字体,创造了我们如今称为“斜体”的倾斜风格。他必须引入撇号字形,以便能够完全按照诗人的书写方式来复制文本。注意单词“ l'honorata”中的撇号。注意它具有弯曲的形状。
这种创新的“斜体”字样和口语化的时髦方式,将省略号表示为可爱的小标记,立即赢得了名声。即使字体受到教皇本人的保护,它也开始被假冒艺术家非法复制。这本书的副本在里昂使用盗版字体和所有字体的盗版印刷在里昂。
1501年,杰弗罗伊· 托利(Geoffroy Tory)出版了《 Campoflori》,这是一本彻底革新了法国语法和书籍出版的书。除其他事项外,它引入了撇号,以复制意大利认为时髦的新时尚方式。这是本书的专家。注意弯曲的撇号。
在同一世纪,出于相同的原因,英语从法语中引入了撇号。
撇号不再是新奇事物,而成为常规语法的一部分。它在印刷文本中保持其弯曲的形状。另一方面,直撇号形字形具有不同的功能,例如表示“素数”。但是,在手写文档中,有时将其样式化为直勾号(请参见Yorick的注释)。
随着打字机和键盘的发明(1860年代),工程师面临着在狭小的空间内放置许多字符(键)的问题。他们提出了统一外观相似的字符以节省空间的想法。他们决定不包括左,右和笔直的“撇号”,而是只包括笔直的“撇号”。对于排版中常见的其他字符(例如破折号和破折号)也做出了类似的决定。
https://zh.wikipedia.org/wiki/Typewriter#Typewriter_conventions
这种减少的字符集被编码为世界上第一个二进制字符集,即5位Baudot码(1870年)。该集合还包括将单引号作为单个字符。7位ASCII继承了相同的字符集。
从那时起,所有键入(和电报)文本都仅使用直引号引起来。卷曲的仅用于传统的排版文本中。
只是随着文字处理器系统的普及,卷曲撇号才被重新引入数字世界。诸如Word之类的系统提供了根据上下文自动用弯引号替换直撇号的功能。但是,这是用户的选择,并不是所有的文字处理器都具有该功能。更令人困惑的是,标准键盘不包含弯引号,因此普通用户很难刻意地键入它们。
创建Unicode时,设计原则之一就是“统一”字符。来自看起来相似的不同脚本或语言的字符应统一并简化为一个字符。您可能会认为它们会回到原点并摆脱直接的撇号。现在,到此为止,对直线和卷曲的撇号和引号的混淆和随意使用是如此之大,以至于Unicode决定同时将两者都包括在内。
因此,就像今天一样,(大写和单引号)都被接受为单引号和引号,但是有一些注意事项:
如果文本的目的是使它看起来像传统上是排版的,则始终使用原始字体。保持直线表示质数。
使用直撇号和引号可以是一种在文档中暗示数字情绪的方式,同样宽度的字符暗示在打字机或控制台中键入文本的方式也相同。
如果文本是数字的并且要被人眼使用,则将两者(卷曲的和直的撇号)都接受为撇号和引号。这里的学校不同,分裂规则不同。我们继续保持富有表现力的混乱。在同一文档中保持一致。
如果文本的意图在语义上是正确的(例如,您希望计算机能够解析文本的语义),则应密切注意Unicode字符定义。U + 0027(可以用键盘输入的名称)称为“ APOSTROPHE”。尽管这暗示它可能是表示撇号的一个很好的候选者,但是请注意Unicode对于此字符有点歧义,表明至少在英语中,U + 2019是撇号的首选。我个人认为这违反了他们的统一原则。您可能希望撇号将是相同的,而与所使用的语言无关。除此之外,他们将撇号归类为“标点符号”这一事实在法语中可能会被尴尬地接受,但在英语中则毫无意义。那么,您要么困惑,要么对不同的语言使用不同的撇号,或者对英语使用有争议的撇号。讨论区关于哪一个是正确的可能会变得非常热情。另一方面,似乎很清楚应该将U + 2019(而不是直的)用作正确的引号。同样,U + 2032应该用来表示质数,U + 02BC应该用来表示修饰词撇号(例如bu'er的Cockney发音的声门号或“ uh'oh”的转录”)。
请注意,即使您选择或键入正确的字符,使用的字体也可能以卷曲或平直的方式呈现它。
'
与素数不同ʹ
。
进行了一些研究以确保,但是通常,“正确的”排版不使用单引号或双引号。这是有关单/双引号的命令和HTML实体的便捷指南。
打字机还负责引入“直引号”(非特定引号),这些引号设计为节省键盘空间,避免了单独的打开和关闭引号。通常使用直引号代替适当的引号或“弯引号”。许多设计师会告诉您,直引号用于表示英尺和英寸,但实际上,英尺和英寸应使用质数表示。单引号已过时,不应使用。
这是用于撇号的首选字符
至于正确的编码方式,我想不出更高的权威。
同样,大多数语言的印刷约定也不会将U + 2019用于其他目的或仅用作辅助引号。实际上,英式英语是唯一使用此字符作为主要引号的主要语言。因此,在这里为了区别起见,不需要使用U + 0027(或任何其他字符)。
在印刷上,有三种确定“正确”的方法:
人们习惯了什么 –在古典和专业排版中,人们通常会使用卷曲的撇号,而打字机的撇号在数字文本中占主导地位。这里没有好的答案。
在不显着影响可读性的情况下,适合字体的一般特征的方法 –在某种程度上取决于字体。让我们看一些例子:
在所有示例中撇号不为U + 2019,并在撇呆在一起是U + 0027。首先请注意两个字符在字体上的区别。
第一个示例是浅色无衬线字体。它远不是装饰性的,并且卷曲撇号将不合适。因此,U + 2019仅略微倾斜。笔直的U + 0027也非常适合字体的简单字符。
在第二个示例中,圆形显然是字体的主要范例。因此,U + 2019是卷曲的。U + 0027的设计避免了任何方向感(可能也可以用作开头引号)并因此避免弯曲。而且它很小,大概是在避免打乱大字体的字体字符和阻止小字体的可读性之间进行权衡。如果您问我,这个折衷方案太小了,但这只是症状-实际的问题是折衷方案,可以通过使用卷曲撇号来避免,而这种撇号更适合字体。
在第三个示例中所示的古典衬线字体中,笔划的宽度主要取决于角度(其起源于书法)。垂直的直线通常以衬线结尾。这不是单引号的选项,因此U + 0027使用液滴状的形状,从而破坏了字体的字符(我认为)。可以肯定的是,感叹号也是如此,但是至少该字符无论如何都要打扰。我认为卷曲的U + 2019字体更适合字体的字符。
最后一种字体更具书法性,但是其字符提供了另一种设计垂直元素的方式。因此,U + 0027并不那么令人困扰,与U + 2019的区别也不大。
总结一下这一点:这取决于字体,但是即使U + 0027设计得当,正确设计的U + 2019也不应该比U + 0027差。这一点不足为奇,因为字体设计者可以更灵活地将U + 2019形状与字体的其余部分匹配,因为不需要对称性。
从长远来看,最好的方法是可读性 –出于多种目的使用同一字符可能不利于可读性。因此,如果我们假设英国的排版惯例保持不变,则直撇号的优点是可以与大括号括起来的引号区分开。但是,与在数字世界中建立使用弯引号和撇号相比,要建立这种约定(将U + 0027用作撇号,将U + 2019用作单个结束引号)更加困难。
在许多其他语言中,这几乎没有意义,因为无论如何U + 2019都不用作引号。在像德语这样的语言中,使用转过的U + 2018(英文单引号)作为引号,具有两个相反的卷曲或倾斜度(取决于字体)通常会更好地区分-至少在我看来。
U+2019
,没有用德语用引号引起来:“ ...”另一方面,我仍然想知道为什么U+2019
德语/奥地利键盘上没有按键。
首先,一些历史。
弯引号和撇号是原始样式。它们也称为打印机的引号和撇号。
直引号和撇号与打字机一起出现。打字机是一种机械设备,有局限性,因此使用一组直线标记代替两组单独的卷曲标记(用于打开和关闭单引号和双引号)更有意义。
为了进一步增加混乱,素数也看起来像一个倾斜的直撇号字符。质数用于分钟/秒标记(以及其他科学,数学和音乐符号)。同样,打字机的直撇号也可以用于这些。
综上所述,出于样式原因,某些字体仅设计有直撇号和引号。
总结:除非您是(a)使用1954年的打字机,或者b)使用笔直的样式有风格上的原因,否则始终将卷曲的版本用于实际的引号和撇号。
到目前为止,所有答案都没有提到一项。在命令行界面或编程语言中,单引号(UTF-8字符27)是唯一有效的选择。
剪切和粘贴时使用U + 2019会导致语法错误。通过将字符27自动转换为U + 2019,现在意味着从Word文档(或某些Wiki /网页)中复制命令行将引发错误,这将导致许多人感到困惑,直到指出此问题为止。它还可能导致没有意义的编译器/解释器错误。
在编写带有代码和/或命令行示例的技术文档时,请注意确保创建的所有示例均使用字符27而不是较高的字符。
'a'
是单字符文字“ a”。(这与仅包含字母的字符串形成对比a
,后者使用U + 0022:"a"
是仅包含字母“ a”的字符串。)某些语言(例如Javascript)允许单引号和双引号可互换使用(但是您有为特定字符串选择一个)。其他语言(例如Pascal,Ada,SQL)使用U + 0027表示字符串文字:在SQL中,'a'
是仅包含字母“ a”的字符串。
"
和'
一个方式还是其他。
我在研究中心工作,我们通常使用相当大的法国和德国语料库(相当近期)。在法国语料库中,直撇号的出现量约为卷曲撇号的4倍。在德语中,直的“不存在,只有卷曲的”可以找到。法语语料库中的差异实际上可能是由于直行的'通常用于打字文本,而卷曲的'主要来自在线复制/粘贴文本。另一方面,德语来源似乎仅使用大写'。还应该考虑以下事实:撇号在法语中比在德语中更常见。
将发布的文本用作撇号的正确字符是UTF-8字符U + 2019,即正确的单引号。那是唯一可以为您提供所需结果的字符,即书本级印刷撇号。当您使用写有“智能引号”的书写工具并按撇号键时,该工具将插入UTF-8字符2019。
UTF-8字符U + 02BC修饰词撇号是发音的微小撇号。在写“不能”的情况下,它看起来不正确。
UTF-8字符U + 0027撇号是“程序员的撇号”。当计算机只有127个字符并且被设计用于编写计算机程序而不产生书本级的印刷字体时,它就没有出现在计算之初。UTF-8的前127个字符与原来的127个字符相同,并且计算机键盘基本上没有变化,因此这种不正确的字体会不断出现。
该错误持续存在的原因是,来自计算机传统的人不一定会将程序员的撇号视为错误。来自出版界的人也会这么做。但是,由计算机人员来设计计算机。这不是在发布的文本中未使用正确的排版的借口。今天我们有文本替换,我们有很多解决方法。
理想情况下,写作者应该使用不允许他们键入程序员的撇号的工具,因为他们只是在他们的UTF-8手稿中放入了一个错误。当然,编辑者会修复它,但后来修复的态度多次导致发布错误。
因此,如果您有任何形式的手稿(书籍,短篇小说或文章),并且其中包含程序员的撇号,则在发布前应将其替换为UTF-8字符2019。
程序员的报价也是如此。好的书写工具不应该让书写者键入它们,而应该键入正确的引号,尤其是因为与撇号相比,这些引号在编辑中更难修复,如果不加以固定,则可读性甚至更差。
作为编写工具的示例,您可以看一下BBEdit,它是一个文本编辑器,可以在Mac上使用数十年。如果创建编程文档(HTML或其他语言)并按撇号键,则会得到程序员的撇号。如果创建书写文档(纯文本或Markdown)并按撇号键,则会得到UTF-8字符2019。引号也是如此。在编程文档中,您将获得程序员的引号。在编写文档时,您会得到真正的引号,包括键入时的开始和结束引号。这是放入引号的最佳方法,因为该工具可以在编写者编写时执行适当的开引号和闭引号。首先没有歧义,因此以后(或不应该)解决它。