我在使用Compiler Explorer时,偶然发现使用三元运算符时会发生以下有趣的行为:
std::string get_string(bool b)
{
return b ? "Hello" : "Stack-overflow";
}
编译器为此生成的代码(带有-O3的Clang干线)是这样的:
get_string[abi:cxx11](bool): # @get_string[abi:cxx11](bool)
push r15
push r14
push rbx
mov rbx, rdi
mov ecx, offset .L.str
mov eax, offset .L.str.1
test esi, esi
cmovne rax, rcx
add rdi, 16 #< Why is the compiler storing the length of the string
mov qword ptr [rbx], rdi
xor sil, 1
movzx ecx, sil
lea r15, [rcx + 8*rcx]
lea r14, [rcx + 8*rcx]
add r14, 5 #< I also think this is the length of "Hello" (but not sure)
mov rsi, rax
mov rdx, r14
call memcpy #< Why is there a call to memcpy
mov qword ptr [rbx + 8], r14
mov byte ptr [rbx + r15 + 21], 0
mov rax, rbx
pop rbx
pop r14
pop r15
ret
.L.str:
.asciz "Hello"
.L.str.1:
.asciz "Stack-Overflow"
但是,编译器为以下代码段生成的代码要小得多,并且无需调用memcpy
,也不必关心同时知道两个字符串的长度。跳转到2个不同的标签
std::string better_string(bool b)
{
if (b)
{
return "Hello";
}
else
{
return "Stack-Overflow";
}
}
上面的代码片段(带-O3的Clang干线)的编译器生成的代码是这样的:
better_string[abi:cxx11](bool): # @better_string[abi:cxx11](bool)
mov rax, rdi
lea rcx, [rdi + 16]
mov qword ptr [rdi], rcx
test sil, sil
je .LBB0_2
mov dword ptr [rcx], 1819043144
mov word ptr [rcx + 4], 111
mov ecx, 5
mov qword ptr [rax + 8], rcx
ret
.LBB0_2:
movabs rdx, 8606216600190023247
mov qword ptr [rcx + 6], rdx
movabs rdx, 8525082558887720019
mov qword ptr [rcx], rdx
mov byte ptr [rax + 30], 0
mov ecx, 14
mov qword ptr [rax + 8], rcx
ret
同样的结果是当我将三元运算符用于:
std::string get_string(bool b)
{
return b ? std::string("Hello") : std::string("Stack-Overflow");
}
我想知道为什么第一个示例中的三元运算符会生成该编译器代码。我相信罪魁祸首位于监狱内const char[]
。
PS:strlen
在第一个示例中,GCC会调用,但Clang不会。
链接到Compiler Explorer示例:https : //godbolt.org/z/Exqs6G
感谢您的时间!
对不起代码墙
const char*
字符串分别为const char[N]
s时,大概编译器可以对后者进行更多优化