当浮点数不能表示所有int值时，为什么C ++将int提升为浮点数？

Question 1

说我有以下几点：

int i = 23;
float f = 3.14;
if (i == f) // do something

i将被提升为afloat并将两个float数字进行比较，但是a可以float代表所有int值吗？为什么不同时将int和都float提升为double？

Question 2

当在整体促销中int被提升为时unsigned，负值也会丢失（这会带来0u < -1真实的乐趣）。

像C中的大多数机制（在C ++中继承）一样，通常的算术转换应从硬件操作的角度进行理解。C的创造者非常熟悉他们所使用的机器的汇编语言，他们编写C的目的是使自己和自己的人在编写直到那时才可以汇编的东西（例如UNIX）时才有意义。核心）。

现在，处理器通常没有混合类型的指令（将float加为double，将int与float比较，等等），因为这将浪费晶圆上的大量资源-您必须实现您想要支持不同类型的操作码数量增加了两倍。仅具有“将int添加到int”，“将float比较为float”，“将unsigned乘以unsigned”等指令首先需要进行常规的算术转换-它们是两种类型的指令映射与他们一起使用最有意义的家庭。

从习惯于编写低级机器代码的人的角度来看，如果您有混合类型，那么一般情况下最有可能考虑的汇编指令是那些需要最少转换的指令。浮点运算尤其如此，因为转换运算会耗费大量运行时间，尤其是在1970年代初，开发C语言时，计算机运行缓慢，并且浮点运算是在软件中完成的。这表明在通常的算术转换中，仅对一个操作数进行了转换（long/的唯一例外是/ unsigned int，其中long可以转换为unsigned long，这在大多数机器上不需要执行任何操作。）。

因此，编写通常的算术转换来执行汇编编码器在大多数情况下会执行的操作：您有两种不合适的类型，将一种转换为另一种类型即可。除非有特殊原因，否则这是您在汇编程序代码中要执行的操作，除非您是习惯于编写汇编程序代码并确实有特定原因要强制执行不同转换的人员，否则明确要求转换是自然的。毕竟，您可以简单地写

if((double) i < (double) f)

有趣的是，注意在此背景下，顺便说一句，这unsigned是分级高于int，这样比较int有unsigned将在一个无符号比较（因此结束0u < -1从一开始就位）。我怀疑这是一个指标，表明人们在过去将其unsigned视为对限制的限制而int不是对其值范围的扩展：我们现在不需要符号，因此让我们将多余的位用于更大的值范围。如果您有理由期望anint会溢出，则可以使用它-在16位ints的世界中，这是一个更大的担忧。

Question 3

甚至double可能无法表示所有int值，具体取决于int包含的位数。

为什么不将int和float都提升为两倍呢？

可能是因为它更昂贵的两种类型的转换double比操作数使用一个，这已经是一个float作为float。它还将为比较运算符引入与算术运算符规则不兼容的特殊规则。

也不能保证浮点类型将如何表示，因此假定转换int为double（甚至long double）进行比较将解决任何问题，这是盲目的。

Question 4

类型提升规则被设计为简单且以可预测的方式工作。C / C ++中的类型自然按照它们可以表示的值范围进行“排序” 。请参阅此了解详情。尽管浮点类型不能表示整数类型表示的所有整数，因为它们不能表示相同数量的有效数字，但它们可能能够表示更大的范围。

为了具有可预测的行为，当需要类型提升时，数字类型始终会转换为范围较大的类型，以避免较小的类型溢出。想象一下：

int i = 23464364; // more digits than float can represent!
float f = 123.4212E36f; // larger range than int can represent!
if (i == f) { /* do something */ }

如果对整数类型进行转换，则将floatf转换为int时肯定会溢出，从而导致未定义的行为。另一方面，转换i为f仅会导致精度下降，这无关紧要，因为f精度相同，因此比较仍然有可能成功。此时，程序员应根据应用程序的要求来解释比较的结果。

最后，除了双精度浮点数会遇到表示整数（有限的有效数字位数）的相同问题外，在这两种类型上使用推广也会导致的精度更高i，而f注定要具有原始精度，因此，如果i有效位数比f开始时的数字多，则比较将不会成功。现在，这也是未定义的行为：比较可能对某些夫妇（i，f）成功，但对另一些夫妇却不成功。

Question 5

可以float代表所有int值吗？

对于一个典型的现代系统，其中int和float都以32位存储。一定要给的东西。价值32位的整数不会一对一映射到包含小数的相同大小的集合上。

在i将被提升到一个float和两个float数字进行比较...

不必要。您真的不知道将采用哪种精度。C ++ 14§5/ 12：

浮动操作数的值和浮动表达式的结果可以比类型所需的精度和范围大。类型不会因此改变。

虽然 i升级后具有名义类型float，但该值可以使用double硬件表示。C ++不保证浮点精度损失或溢出。（这在C ++ 14中不是什么新事物；它自古以来就继承自C。）

为什么不同时推广 int和都float提升为double？

如果您想在任何地方都获得最佳精度，请改用，double而永远不会看到float。或long double，但运行速度可能较慢。考虑到一台机器可以提供多种精度，这些规则被设计为对于大多数有限精度类型的用例而言相对合理。

在大多数情况下，快速和宽松就足够了，因此机器可以自由地执行最简单的操作。这可能意味着四舍五入，单精度比较或双精度而不进行四舍五入。

但是，这样的规则最终是折衷的，有时会失败。要在C ++（或C）中精确指定算术，它有助于使转换和提升明确化。许多关于超可靠软件的样式指南都禁止完全使用隐式转换，并且大多数编译器会提供警告来帮助您删除它们。

要了解这些妥协是如何产生的，可以阅读C基本原理文档。（最新版本最多涵盖C99。）从PDP-11或K＆R时代起，这不只是笨拙的包bag。

Question 6

令人着迷的是，这里的许多答案都来自C语言的起源，明确地将K＆R和历史包名命名为将int与float结合时转换为float的原因。

这是指责错误的政党。在K＆R C中，没有浮点计算之类的东西。所有浮点运算均以双精度进行。因此，从未将整数（或其他任何东西）隐式转换为浮点数，而仅将其转换为双精度数。浮点数也不可能是函数参数的类型：如果确实要避免转换为双精度数，则必须传递一个指向浮点数的指针。因此，功能

int x(float a)
{ ... }

和

int y(a)
float a;
{ ... }

有不同的调用约定。第一个获取一个float参数，第二个获取（现在不再作为语法允许）一个double参数。

单精度浮点算术和函数参数仅在ANSI C中引入。Kernighan/ Ritchie是无辜的。

现在，有了新可用的单个float表达式（以前的单个float仅是一种存储格式），还必须进行新的类型转换。不管ANSI C团队在这里选择了什么（我会为更好的选择而迷失）不是K＆R的错。

Question 7

Q1：浮点数可以表示所有int值吗？

IEE754可以将所有整数精确地表示为浮点数，最多约2 ²³，如本答案所述。

问题2：为什么不将int和float都提高到两倍？

这些转换的标准中的规则是对K＆R中的那些规则的略微修改：这些修改包含添加的类型和值保留规则。添加了显式许可证，以比绝对必要的“更广泛”的类型执行计算，因为这有时会产生更小和更快的代码，更不用说正确答案了。只要获得相同的最终结果，也可以按照规则使用“更窄”的类型执行计算。显式强制转换始终可以用于获取所需类型的值。

资源

以更广泛的类型执行计算意味着 float f1;和float f2;，f1 + f2可能在计算double精度。这也意味着，鉴于int i;并且float f;，i == f可能在计算double精度。但是i == f，如注释中所述，不需要以双精度计算。

C标准也这样说。这些被称为通常的算术转换。以下描述直接取自ANSI C标准。

...如果任何一个操作数具有float类型，则另一个操作数将转换为float类型。

来源，您也可以在参考资料中看到它。

相关的链接是这里答案。更多分析的资料在这里。

这是另一种解释方法：隐式执行通常的算术转换，以将其值转换为通用类型。编译器首先执行整数提升，如果操作数仍然具有不同的类型，则它们将转换为以下层次结构中显示最高的类型：

在此处输入图片说明

来源。

Question 8

创建编程语言后，会直观地做出一些决定。

例如，为什么不将int + float转换为int + int而不是float + float或double + double？如果int-> float拥有相同的位数，为什么要调用它呢？为什么不将float-> int称为促销？

如果您依赖隐式类型转换，则应该知道它们的工作方式，否则只需手动转换即可。

本来可以设计某种语言而根本不进行任何自动类型转换。在设计阶段，并非每个决定都可以在逻辑上有充分的理由作出。

带有鸭子类型的JavaScript在引擎盖下的决策更加晦涩难懂。设计绝对逻辑的语言是不可能的，我认为这取决于Godel不完全性定理。您必须在逻辑，直觉，实践和理想之间取得平衡。

Question 9

问题是为什么：因为它速度快，易于解释，易于编译，而这些都是在开发C语言时非常重要的原因。

您可能有不同的规则：对于算术值的每次比较，其结果都是对实际数值的比较。如果比较的表达式之一是常量，则比较琐碎。在比较有符号和无符号的int时，这是一条额外的指令；如果比较long long和double并在long long无法表示为double时想要正确的结果，则这将非常困难。（0u <-1将是错误的，因为它将比较数值0和-1而不考虑其类型）。

在Swift中，通过禁止不同类型之间的操作可以轻松解决该问题。

Question 10

规则以16位整数（最小所需大小）编写。具有32位int的编译器肯定会将双方都转换为double。无论如何，现代硬件中都没有浮点寄存器，因此必须将其转换为双精度。现在，如果您有64位整数，则不太确定它会做什么。长双精度会比较合适（通常为80位，但这不是标准）。