撇号的正确字符是什么?


56

我很多次遇到所谓的“ 打字机撇号 ”(Unicode字符U+0027和HTML符号')来表示撇号:

打字机撇号

但另一方面,也可以使用“ 右单引号 ”(Unicode字符U+2019和HTML符号’)代替:

右单引号

我现在想知道,哪一种是正确的,应该在版式中使用?

注意:在两个示例中都使用了sans-serif字体Arial


如果您打算用法语写法文,那么绝对要在问号前使用第二个空格,且空格要紧。
user2284570 '02

狭长的不间断空间是U + 202F,并且是1 / 3em-甚至在“视觉上正确的”位置也将是1 / 8em“稀疏空间” U + 2009,但是“稀薄空间”并未标记为不间断(我在听(InDesign会自动将其作为不间断的
标记

Answers:


69

开始弯曲

单引号最初出现在16世纪的意大利印刷宇宙中,是弯曲的形状,表示从手写的古典意大利诗歌中复制出来的省略号。从某种意义上说,撇号等效于我们的“ Gotchas”或“ Wannas”,这是一种通过使文本听起来更像人的方式来消除文本僵化的方法。

这是第一次打印撇号的示例。它取材于彼得拉克(Petrarch)撰写的意大利经典名著《勒·科斯·沃尔加里·迪·弗朗西斯科·弗朗切斯科》(Le cose volgari di messer Francesco),由阿尔杜斯 ·马努蒂乌斯(Aldus Manutius)于1501年左右在意大利出版。

在此处输入图片说明

据推测,Aldus Manutius是从他的一个朋友拥有的Petrarch原始手抄本抄袭此书的。他根据诗人的笔迹设计了一种特殊的字体,创造了我们如今称为“斜体”的倾斜风格。他必须引入撇号字形,以便能够完全按照诗人的书写方式来复制文本。注意单词“ l'honorata”中的撇号。注意它具有弯曲的形状。

它变得时尚

这种创新的“斜体”字样和口语化的时髦方式,将省略号表示为可爱的小标记,立即赢得了名声。即使字体受到教皇本人的保护,它也开始被假冒艺术家非法复制。这本书的副本在里昂使用盗版字体和所有字体的盗版印刷在里昂。

1501年,杰弗罗伊· 托利(Geoffroy Tory)出版了《 Campoflori》,这是一本彻底革新了法国语法和书籍出版的书。除其他事项外,它引入了撇号,以复制意大利认为时髦的新时尚方式。这是本书的专家。注意弯曲的撇号。

在此处输入图片说明

在同一世纪,出于相同的原因,英语从法语中引入了撇号。

直了

撇号不再是新奇事物,而成为常规语法的一部分。它在印刷文本中保持其弯曲的形状。另一方面,直撇号形字形具有不同的功能,例如表示“素数”。但是,在手写文档中,有时将其样式化为直勾号(请参见Yorick的注释)。

随着打字机和键盘的发明(1860年代),工程师面临着在狭小的空间内放置许多字符(键)的问题。他们提出了统一外观相似的字符以节省空间的想法。他们决定不包括左,右和笔直的“撇号”,而是只包括笔直的“撇号”。对于排版中常见的其他字符(例如破折号和破折号)也做出了类似的决定。

https://zh.wikipedia.org/wiki/Typewriter#Typewriter_conventions

这种减少的字符集被编码为世界上第一个二进制字符集,即5位Baudot码(1870年)。该集合还包括将单引号作为单个字符。7位ASCII继承了相同的字符集。

从那时起,所有键入(和电报)文本都仅使用直引号引起来。卷曲的仅用于传统的排版文本中。

变得Am昧

只是随着文字处理器系统的普及,卷曲撇号才被重新引入数字世界。诸如Word之类的系统提供了根据上下文自动用弯引号替换直撇号的功能。但是,这是用户的选择,并不是所有的文字处理器都具有该功能。更令人困惑的是,标准键盘不包含弯引号,因此普通用户很难刻意地键入它们。

创建Unicode时,设计原则之一就是“统一”字符。来自看起来相似的不同脚本或语言的字符应统一并简化为一个字符。您可能会认为它们会回到原点并摆脱直接的撇号。现在,到此为止,对直线和卷曲的撇号和引号的混淆和随意使用是如此之大,以至于Unicode决定同时将两者都包括在内。

今天的使徒

因此,就像今天一样,(大写和单引号)都被接受为单引号和引号,但是有一些注意事项:

  • 如果文本的目的是使它看起来像传统上是排版的,则始终使用原始字体。保持直线表示质数。

  • 使用直撇号和引号可以是一种在文档中暗示数字情绪的方式,同样宽度的字符暗示在打字机或控制台中键入文本的方式也相同。

  • 如果文本是数字的并且要被人眼使用,则将两者(卷曲的和直的撇号)都接受为撇号和引号。这里的学校不同,分裂规则不同。我们继续保持富有表现力的混乱。在同一文档中保持一致。

  • 如果文本的意图在语义上是正确的(例如,您希望计算机能够解析文本的语义),则应密切注意Unicode字符定义。U + 0027(可以用键盘输入的名称)称为“ APOSTROPHE”。尽管这暗示它可能是表示撇号的一个很好的候选者,但是请注意Unicode对于此字符有点歧义,表明至少在英语中,U + 2019是撇号的首选。我个人认为这违反了他们的统一原则。您可能希望撇号将是相同的,而与所使用的语言无关。除此之外,他们将撇号归类为“标点符号”这一事实在法语中可能会被尴尬地接受,但在英语中则毫无意义。那么,您要么困惑,要么对不同的语言使用不同的撇号,或者对英语使用有争议的撇号。讨论区关于哪一个是正确的可能会变得非常热情。另一方面,似乎很清楚应该将U + 2019(而不是直的)用作正确的引号。同样,U + 2032应该用来表示质数,U + 02BC应该用来表示修饰词撇号(例如bu'er的Cockney发音的声门号或“ uh'oh”的转录”)。

  • 请注意,即使您选择或键入正确的字符,使用的字体也可能以卷曲或平直的方式呈现它。


7
注意:U + 02BC的相反名称是U + 02BB,夏威夷的冲绳,其名称本身为“夏威夷”。
usr2564301

6
“创建Unicode时,设计原则之一就是“统一”字符。来自看起来相似的不同脚本或语言的字符应统一并简化为一个字符。” -你有这个来源吗?有无数的Unicode例子,其中有多个看起来相同的字符,但是我不知道有哪个例子使用Unicode将相似的字符制成一个字符。
user2357112 '02

6
Unicode字符的名称不是其定义!当前的政策是不能更改名称。因此,许多Unicode字符的名称具有误导性或直截了当。您应该查看注释而不是如何使用它。这些评论明确指出,与U + 0027相比,U + 2019在语义上更适合表示撇号。
sumelic

3
您可能不同意Unicode委员会,但这不是引用该名称的有效论点;而是使用类似此文章中的参数:哪个Unicode字符应代表英文撇号?(以及为什么Unicode委员会非常错误。)
sumelic

4
直撇号'与素数不同ʹ
安德鲁·里奇

26

进行了一些研究以确保,但是通常,“正确的”排版不使用单引号或双引号。这是有关单/双引号命令和HTML实体的便捷指南。

打字机还负责引入“直引号”(非特定引号),这些引号设计为节省键盘空间,避免了单独的打开和关闭引号。通常使用直引号代替适当的引号或“弯引号”。许多设计师会告诉您,直引号用于表示英尺和英寸,但实际上,英尺和英寸应使用质数表示。单引号已过时,不应使用。

来自印刷素养:第二部分(KA + A)

哑引号


1
嗯,撇号只是一个符号,单引号表示两个符号,一个开始和一个结束符号。泰瑟语符号使用的是哪一个字形,取决于所使用的字体和字体为您提供的拼写符号的字形...
Mensch

5
很好。但是OP询问的是撇号,而不是引号。
cockypup

17

U + 2019(')上Unicode标准注释

这是用于撇号的首选字符

至于正确的编码方式,我想不出更高的权威。

同样,大多数语言的印刷约定也不会将U + 2019用于其他目的或仅用作辅助引号。实际上,英式英语是唯一使用此字符作为主要引号的主要语言。因此,在这里为了区别起见,不需要使用U + 0027(或任何其他字符)。


在印刷上,有三种确定“正确”的方法:

  1. 人们习惯了什么 –在古典和专业排版中,人们通常会使用卷曲的撇号,而打字机的撇号在数字文本中占主导地位。这里没有好的答案。

  2. 不显着影响可读性的情况下,适合字体的一般特征的方法 –在某种程度上取决于字体。让我们看一些例子:

    在此处输入图片说明

    在所有示例中撇号为U + 2019,并在撇呆在一起是U + 0027。首先请注意两个字符在字体上的区别。

    • 第一个示例是浅色无衬线字体。它远不是装饰性的,并且卷曲撇号将不合适。因此,U + 2019仅略微倾斜。笔直的U + 0027也非常适合字体的简单字符。

    • 在第二个示例中,圆形显然是字体的主要范例。因此,U + 2019是卷曲的。U + 0027的设计避免了任何方向感(可能也可以用作开头引号)并因此避免弯曲。而且它很小,大概是在避免打乱大字体的字体字符和阻止小字体的可读性之间进行权衡。如果您问我,这个折衷方案太小了,但这只是症状-实际的问题是折衷方案,可以通过使用卷曲撇号来避免,而这种撇号更适合字体。

    • 在第三个示例中所示的古典衬线字体中,笔划的宽度主要取决于角度(其起源于书法)。垂直的直线通常以衬线结尾。这不是单引号的选项,因此U + 0027使用液滴状的形状,从而破坏了字体的字符(我认为)。可以肯定的是,感叹号也是如此,但是至少该字符无论如何都要打扰。我认为卷曲的U + 2019字体更适合字体的字符。

    • 最后一种字体更具书法性,但是其字符提供了另一种设计垂直元素的方式。因此,U + 0027并不那么令人困扰,与U + 2019的区别也不大。

    总结一下这一点:这取决于字体,但是即使U + 0027设计得当,正确设计的U + 2019也不应该比U + 0027差。这一点不足为奇,因为字体设计者可以更灵活地将U + 2019形状与字体的其余部分匹配,因为不需要对称性。

  3. 从长远来看,最好的方法是可读性 –出于多种目的使用同一字符可能不利于可读性。因此,如果我们假设英国的排版惯例保持不变,则直撇号的优点是可以与大括号括起来的引号区分开。但是,与在数字世界中建立使用弯引号和撇号相比,要建立这种约定(将U + 0027用作撇号,将U + 2019用作单个结束引号)更加困难。

    许多其他语言中,这几乎没有意义,因为无论如何U + 2019都不用作引号。在像德语这样的语言中,使用转过的U + 2018(英文单引号)作为引号,具有两个相反的卷曲或倾斜度(取决于字体)通常会更好地区分-至少在我看来。


好答案!:D您是对的U+2019,没有用德语用引号引起来:“ ...”另一方面,我仍然想知道为什么U+2019德语/奥地利键盘上没有按键。
优雅

9

首先,一些历史

引号和撇号是原始样式。它们也称为打印机的引号和撇号。

引号和撇号与打字机一起出现。打字机是一种机械设备,有局限性,因此使用一组直线标记代替两组单独的卷曲标记(用于打开和关闭单引号和双引号)更有意义。

为了进一步增加混乱,素数也看起来像一个倾斜的直撇号字符。质数用于分钟/秒标记(以及其他科学,数学和音乐符号)。同样,打字机的直撇号也可以用于这些。

综上所述,出于样式原因,某些字体仅设计有直撇号和引号。

总结:除非您是(a)使用1954年的打字机,或者b)使用笔直的样式有风格上的原因,否则始终将卷曲的版本用于实际的引号和撇号。


一个非常不错的概述:)之前我还没有听说过“打印机引号”一词...而且我敢打赌,您有99%会使用(错误的)直撇号写出“的”:D
elegent

5

到目前为止,所有答案都没有提到一项。在命令行界面或编程语言中,单引号(UTF-8字符27)是唯一有效的选择。

剪切和粘贴时使用U + 2019会导致语法错误。通过将字符27自动转换为U + 2019,现在意味着从Word文档(或某些Wiki /网页)中复制命令行将引发错误,这将导致许多人感到困惑,直到指出此问题为止。它还可能导致没有意义的编译器/解释器错误。

在编写带有代码和/或命令行示例的技术文档时,请注意确保创建的所有示例均使用字符27而不是较高的字符。


1
出于好奇...在代码或命令行中是否需要撇号?我不知道很多编码语言,但是我想不出任何需要撇号的情况。
DA01

4
@ DA01类似C的语言(例如C,C ++,Java,C#)使用U + 0027表示单字符文字:'a'是单字符文字“ a”。(这与仅包含字母的字符串形成对比a,后者使用U + 0022:"a"是仅包含字母“ a”的字符串。)某些语言(例如Javascript)允许单引号和双引号可互换使用(但是您有为特定字符串选择一个)。其他语言(例如Pascal,Ada,SQL)使用U + 0027表示字符串文字:在SQL中,'a'是仅包含字母“ a”的字符串。
CVn

4
如您所见,许多语言的确在单字符文字和仅包含单个字符的字符串之间进行了区分。两者都有有效的用途,并且在许多情况下都经常使用。现在,可以很明显地讨论是否意味着需要撇号,但是在任何能够区分的语言中都需要某种方法来表明与编译器或解释器之间的差异,并且许多语言已经确定了一对"'一个方式还是其他。
CVn

1
自动排版员引号在教程中可能是地狱。
joojaa

1
@MichaelKjörling啊,也许是语义,但是我们在这里谈论的是单引号而不是撇号。
DA01

3

我在研究中心工作,我们通常使用相当大的法国和德国语料库(相当近期)。在法国语料库中,直撇号的出现量约为卷曲撇号的4倍。在德语中,直的“不存在,只有卷曲的”可以找到。法语语料库中的差异实际上可能是由于直行的'通常用于打字文本,而卷曲的'主要来自在线复制/粘贴文本。另一方面,德语来源似乎仅使用大写'。还应该考虑以下事实:撇号在法语中比在德语中更常见。


问题是,哪个才是“正确使用者”。现在,您对真实现有文本的输入很有趣。我爱法国,而且事实上他们以某种方式使用了比卷发更多的直发,这一事实间接证实了卷发会是“正确使用的发条”(眨眨眼)……昨天我订购了两张真纸印刷版,有关法文版式规则的书籍(如在其他主题中所建议),所以很快我将了解更多。
Martin Zaske '17

0

将发布的文本用作撇号的正确字符是UTF-8字符U + 2019,即正确的单引号。那是唯一可以为您提供所需结果的字符,即书本级印刷撇号。当您使用写有“智能引号”的书写工具并按撇号键时,该工具将插入UTF-8字符2019。

UTF-8字符U + 02BC修饰词撇号是发音的微小撇号。在写“不能”的情况下,它看起来不正确。

UTF-8字符U + 0027撇号是“程序员的撇号”。当计算机只有127个字符并且被设计用于编写计算机程序而不产生书本级的印刷字体时,它就没有出现在计算之初。UTF-8的前127个字符与原来的127个字符相同,并且计算机键盘基本上没有变化,因此这种不正确的字体会不断出现。

该错误持续存在的原因是,来自计算机传统的人不一定会将程序员的撇号视为错误。来自出版界的人也会这么做。但是,由计算机人员来设计计算机。这不是在发布的文本中未使用正确的排版的借口。今天我们有文本替换,我们有很多解决方法。

理想情况下,写作者应该使用不允许他们键入程序员的撇号的工具,因为他们只是在他们的UTF-8手稿中放入了一个错误。当然,编辑者会修复它,但后来修复的态度多次导致发布错误。

因此,如果您有任何形式的手稿(书籍,短篇小说或文章),并且其中包含程序员的撇号,则在发布前应将其替换为UTF-8字符2019。

程序员的报价也是如此。好的书写工具不应该让书写者键入它们,而应该键入正确的引号,尤其是因为与撇号相比,这些引号在编辑中更难修复,如果不加以固定,则可读性甚至更差。

作为编写工具的示例,您可以看一下BBEdit,它是一个文本编辑器,可以在Mac上使用数十年。如果创建编程文档(HTML或其他语言)并按撇号键,则会得到程序员的撇号。如果创建书写文档(纯文本或Markdown)并按撇号键,则会得到UTF-8字符2019。引号也是如此。在编程文档中,您将获得程序员的引号。在编写文档时,您会得到真正的引号,包括键入时的开始和结束引号。这是放入引号的最佳方法,因为该工具可以在编写者编写时执行适当的开引号和闭引号。首先没有歧义,因此以后(或不应该)解决它。


4
您的规则有一个例外。在书面文档中编写代码或命令行示例时,程序员的撇号是正确的值(其他字符将导致语法错误)。一揽子禁令或替代品将破坏命令/样本。因此,必须允许该字符进行显示代码或命令行示例的技术发布。
Walter

1
仅仅是因为我在Markdown中写作,BBEdit说我不应该使用U + 0027吗?堆栈溢出的很多人可能会觉得这样的事情不是最优的。
CVn

5
我花了一段时间才弄清楚为什么您在谈论U + 8217:CJK Unified Ideograph商店。请对Unicode字符使用十六进制,即您的情况下为U + 2019,或者至少将您的非标准符号告知读者。
Wrzlprmft

2
而且,它们不是UTF-8字符,而是Unicode或UCS字符。UTF-8只是将代码点转换为字节的一种方式。因此,例如U + 2019变为3 UTF-8字节,以十六进制被写入E2 80 99和在十进制226 128 153
deltab
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.