Notepad ++输出中的STX,SOH和GS是什么意思?


20

查看电子邮件的MIME源(大概包含国际字符)后,我在Notepad ++中看到了类似的内容

在此处输入图片说明

我知道这CRLF是回车换行,但是其他呢?这是什么SOHGS以及STX是什么意思?

Answers:


19

Notepad ++使用这些符号来表示控制字符或非打印字符。

控制字符-维基百科

控制字符或非打印字符是字符集中的一个代码点(一个数字),不代表书面符号。

C0和C1控制代码-维基百科

STX-文本开始-消息文本的第一个字符,可用于终止消息标题。

SOH-标头的开始-消息标头的第一个字符。

GS-组分隔符-可用作分隔符,以标记数据结构的字段。如果用于分层级别,则US是最低级别(划分纯文本数据项),而RS,GS和FS处于递增级别,以划分由其下面的级别项组成的组。


嗯...我很困惑为什么电子邮件标题中可能包含非打印字符。将先前的描述解释为“控制字符或非打印字符是字符集中的代码点(数字),不代表书面ASCII符号”是否准确?
Mike B

我既不熟悉邮件标题的规范,也不熟悉为什么它们可能包含不可打印的字符。但是,Notepad ++使用其自己的符号(如您所示)来显示这些控制字符。
史蒂文

不可打印字符都出现在X-Example标头内的引号内。该标头不是任何电子邮件标准的一部分(请参阅stackoverflow.com/questions/14469110/…)。它可能是由创建电子邮件的客户端设置的,也可能是沿途的一种传输方式。无论哪种方式,就处理电子邮件而言,它实际上都是评论,可以是任何东西。好像有人在信封上画了一点心-这不是邮政标准的一部分,完全不影响邮寄。
兰迪·奥里森

...好吧,当然,只要它实际上没有破坏事物即可。如果X-标头的UNICODE字符串很长,则可能会在传输程序中触发缓冲区溢出错误,并且写在地址上的心可能会使邮递员感到困惑。但是在合理的范围内,它只是被忽略了。
兰迪·奥里森

6

SOHStart Of Header

STXStart of teXt

GSGroup Seperator

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.