20 查看电子邮件的MIME源(大概包含国际字符)后,我在Notepad ++中看到了类似的内容 我知道这CRLF是回车换行,但是其他呢?这是什么SOH,GS以及STX是什么意思? notepad++ character-encoding characters — 迈克·B source
19 Notepad ++使用这些符号来表示控制字符或非打印字符。 控制字符-维基百科 控制字符或非打印字符是字符集中的一个代码点(一个数字),不代表书面符号。 C0和C1控制代码-维基百科 STX-文本开始-消息文本的第一个字符,可用于终止消息标题。 SOH-标头的开始-消息标头的第一个字符。 GS-组分隔符-可用作分隔符,以标记数据结构的字段。如果用于分层级别,则US是最低级别(划分纯文本数据项),而RS,GS和FS处于递增级别,以划分由其下面的级别项组成的组。 — 史蒂文 source 嗯...我很困惑为什么电子邮件标题中可能包含非打印字符。将先前的描述解释为“控制字符或非打印字符是字符集中的代码点(数字),不代表书面ASCII符号”是否准确? — Mike B 我既不熟悉邮件标题的规范,也不熟悉为什么它们可能包含不可打印的字符。但是,Notepad ++使用其自己的符号(如您所示)来显示这些控制字符。 — 史蒂文 不可打印字符都出现在X-Example标头内的引号内。该标头不是任何电子邮件标准的一部分(请参阅stackoverflow.com/questions/14469110/…)。它可能是由创建电子邮件的客户端设置的,也可能是沿途的一种传输方式。无论哪种方式,就处理电子邮件而言,它实际上都是评论,可以是任何东西。好像有人在信封上画了一点心-这不是邮政标准的一部分,完全不影响邮寄。 — 兰迪·奥里森 ...好吧,当然,只要它实际上没有破坏事物即可。如果X-标头的UNICODE字符串很长,则可能会在传输程序中触发缓冲区溢出错误,并且写在地址上的心可能会使邮递员感到困惑。但是在合理的范围内,它只是被忽略了。 — 兰迪·奥里森