在阅读Lua的源代码时,我注意到Lua使用a将a macro
舍double
入为32位int
。我提取了macro
,它看起来像这样:
union i_cast {double d; int i[2]};
#define double2int(i, d, t) \
{volatile union i_cast u; u.d = (d) + 6755399441055744.0; \
(i) = (t)u.i[ENDIANLOC];}
这里ENDIANLOC
定义为endianness,0
对于小端,1
对于大端。Lua会小心处理字节顺序。t
代表整数类型,例如int
或unsigned int
。
我做了一些研究,有一个更简单的格式macro
使用了相同的想法:
#define double2int(i, d) \
{double t = ((d) + 6755399441055744.0); i = *((int *)(&t));}
或采用C ++样式:
inline int double2int(double d)
{
d += 6755399441055744.0;
return reinterpret_cast<int&>(d);
}
此技巧可以在使用IEEE 754的任何计算机上使用(这意味着当今几乎所有计算机)。它适用于正数和负数,并且四舍五入遵循Banker规则。(这并不令人惊讶,因为它遵循IEEE754。)
我写了一个小程序来测试它:
int main()
{
double d = -12345678.9;
int i;
double2int(i, d)
printf("%d\n", i);
return 0;
}
并按预期输出-12345679。
我想详细介绍这个棘手的macro
工作原理。幻数6755399441055744.0
实际上是2^51 + 2^52
或1.5 * 2^52
,并且1.5
以二进制形式可以表示为1.1
。当任何32位整数添加到该幻数上时,我从这里迷失了方向。这个技巧如何运作?
PS:这是在Lua源代码Llimits.h中。
更新:
- 正如@Mysticial指出的那样,此方法不限于32位
int
,int
只要数字在2 ^ 52范围内,它也可以扩展为64位。(macro
需要一些修改。) - 一些材料说这种方法不能在Direct3D中使用。
使用适用于x86的Microsoft汇编程序时,
macro
编写的速度甚至更快assembly
(这也摘自Lua源码):#define double2int(i,n) __asm {__asm fld n __asm fistp i}
单精度数字有一个相似的幻数:
1.5 * 2 ^23
ftoi
。但是,如果您正在谈论SSE,为什么不只使用一条指令CVTTSD2SI
呢?
double -> int64
确实在2^52
范围内。这些在使用浮点FFT执行整数卷积时尤其常见。