提问者:小点点

在-O0 vs-O3中__rdtsc()的汇编代码[重复]


我有以下代码:

#include <x86intrin.h>

int main() {
    return __rdtsc();
}

我试图在我的机器上编译(Intel i7-6700CPU)和obobdump

g++ -Wall test_tsc.cpp -o test_tsc -march=native -mtune=native -O0 -std=c++20
objdump -M intel -d test_tsc > test_tsc.O0

然后在test_tsc. O0

0000000000401122 <main>:
  401122:   55                      push   rbp
  401123:   48 89 e5                mov    rbp,rsp
  401126:   0f 31                   rdtsc  
  401128:   48 c1 e2 20             shl    rdx,0x20
  40112c:   48 09 d0                or     rax,rdx
  40112f:   90                      nop
  401130:   5d                      pop    rbp
  401131:   c3                      ret    
  401132:   66 2e 0f 1f 84 00 00    nop    WORD PTR cs:[rax+rax*1+0x0]
  401139:   00 00 00 
  40113c:   0f 1f 40 00             nop    DWORD PTR [rax+0x0]

push rbpmov rbp, rsp做什么?看起来它们是用来保存堆栈指针的,但实际上并没有函数调用。如果g认为__rdtsc()是一个函数调用,那么之后会有类似call的东西吗?

谢谢。


共1个答案

匿名用户

rbp是基指针,而不是堆栈指针。基指针用于调试期间的回溯,但实际运行不需要。

它通过函数调用保留,因此使用-O3仅生成预期的程序集:

main:
        rdtsc
        salq    $32, %rdx
        orq     %rdx, %rax
        ret