我将您的问题解释为两个问题:1)为什么->
甚至存在,以及2)为什么.
不自动取消引用指针。这两个问题的答案都有历史渊源。
为什么->
甚至存在?
在C语言的第一个版本(1975年5月第6版Unix附带的C语言,我称为CRM 参考手册)中,运算符->
具有非常排他的含义,不是同义词*
和.
组合
CRM描述的C语言在许多方面与现代C都有很大不同。在CRM结构成员中,实现了字节偏移量的全局概念,该概念可以无限制地添加到任何地址值中。即所有结构成员的所有名称都具有独立的全局含义(因此,必须是唯一的)。例如,您可以声明
struct S {
int a;
int b;
};
并且name a
代表偏移量0,而name b
代表偏移量2(假设int
大小为2,并且没有填充)。该语言要求翻译单元中所有结构的所有成员都必须具有唯一的名称或代表相同的偏移值。例如,在同一翻译单元中,您还可以声明
struct X {
int a;
int x;
};
这样就可以了,因为名称a
始终代表偏移量0。但是,此附加声明
struct Y {
int b;
int a;
};
从形式上来说是无效的,因为它试图“重新定义” a
为偏移量2,b
偏移量0。
这就是->
运算符的作用。由于每个struct成员名称都有自己的自足全局含义,因此该语言支持此类表达式
int i = 5;
i->b = 42; /* Write 42 into `int` at address 7 */
100->a = 0; /* Write 0 into `int` at address 100 */
编译器将第一个分配解释为“获取地址5
,向其添加偏移量2
并分配42
int
结果地址中的值”。即上述内容将分配42
给int
address的值7
。注意这种用法->
并不关心左侧表达式的类型。左侧被解释为右值数字地址(可以是指针或整数)。
这种欺骗是不可能的 *
和.
组合。你做不到
(*i).b = 42;
以来 *i
已经是一个无效的表达式。由于*
运算符与分开.
,因此对其操作数施加了更严格的类型要求。为了提供解决此限制的功能,CRM引入了->
运算符,该运算符与左侧操作数的类型无关。
正如Keith在评论中所指出的,+ ->
和*
+ .
组合之间的区别就是CRM在7.1.8中称为“放松要求”:除了放宽E1
指针类型的需求外,该表达式E1−>MOS
完全等于(*E1).MOS
后来,在K&R C中,对CRM中最初描述的许多功能进行了重新设计。完全删除了“结构成员作为全局偏移量标识符”的想法。和功能->
运营商成为了的功能完全一致*
和.
组合。
为什么不能.
自动取消引用指针?
同样,在该语言的CRM版本中,.
要求运算符的左操作数为lvalue。那是对该操作数施加的唯一要求(这就是使它不同于->
,如上所述)的原因。需要注意的是CRM并没有要求的左操作数.
有一个结构类型。它只是要求它是一个左值,任何左值。这意味着在C的CRM版本中,您可以编写如下代码
struct S { int a, b; };
struct T { float x, y, z; };
struct T c;
c.b = 55;
在这种情况下,即使type 没有名为的字段,编译器也将写入连续内存块中位于字节偏移量2处55
的int
值。编译器根本不关心实际类型。它关心的只是一个左值:某种可写的内存块。c
struct T
b
c
c
现在请注意,如果您这样做
S *s;
...
s.b = 42;
该代码将被视为有效(因为s
它也是一个左值),并且编译器将仅尝试将数据写入指针s
本身字节偏移量2。不用说,类似的事情很容易导致内存溢出,但是这种语言并不关心这类事情。
即在该语言的该版本中,您对重载运算符的建议想法 .
指针类型将不起作用:.
与指针(与左值指针或任何左值一起使用)时,运算符已经具有非常特殊的含义。毫无疑问,这是非常奇怪的功能。但是当时在那里。
当然,这种怪异的功能并不是引入超载的强烈理由 .
在重新设计的C-K&R C版本中指针操作符的(如您所建议的那样),但尚未完成。也许那时是必须要支持一些用CRM版本C编写的遗留代码。
(《 1975 C参考手册》的URL可能不稳定。这里可能有一些细微差别,这是另一份副本。)