无需汇编的C / C ++函数定义

Question 1

我一直认为printf()，在最后一步中，要使用内联汇编来定义类似的函数。stdio.h的深处埋有一些asm代码，该代码实际上告诉CPU该怎么做。例如，在dos中，我记得它是通过首先mov将字符串的开头放置到某个内存位置或寄存器中，而不是调用int中断来实现的。

但是，由于Visual Studio的x64版本根本不支持嵌入式汇编程序，这使我想知道在C / C ++中根本没有汇编程序定义的函数。printf()在不使用汇编代码的情况下，如何在C / C ++中实现类似库的功能？究竟是什么执行正确的软件中断？谢谢。

Question 2

首先，您必须了解环的概念。
内核在环0中运行，这意味着它可以完全访问内存和操作码。
程序通常在环3中运行。它对内存的访问受到限制，并且不能使用所有操作码。

因此，当软件需要更多特权（用于打开文件，写入文件，分配内存等）时，它需要询问内核。
这可以通过许多方式来完成。软件中断，SYSENTER等。

让我们以带有printf（）函数的软件中断为例：
1-您的软件调用printf（）。
2-printf（）处理您的字符串和args，然后需要执行内核函数，因为在第3环中无法完成对文件的写入。
3-printf（）生成软件中断，将内核函数（在这种情况下为write（）函数）的编号放入寄存器中。
4-软件执行被中断，并且指令指针移至内核代码。所以我们现在在内核函数中处于环0。
5-内核处理请求，写入文件（stdout是文件描述符）。
6-完成后，内核使用iret指令返回软件代码。
7-软件代码继续。

因此，可以在C中实现C标准库的功能。它所要做的就是知道需要更多特权时如何调用内核。

Question 3

在Linux中，strace实用程序使您可以查看程序进行了哪些系统调用。因此，采用这样的程序

    int main（）{
    printf（“ x”）;
    返回0;
    }

假设您将其编译为printx，然后strace printx给出

    execve（“ ./ printx”，[“ ./printx”]，[/ * 49个变量* /]）= 0
    brk（0）= 0xb66000
    access（“ / etc / ld.so.nohwcap”，F_OK）= -1 ENOENT（无此类文件或目录）
    mmap（NULL，8192，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_ANONYMOUS，-1，0）= 0x7fa6dc0e5000
    access（“ / etc / ld.so.preload”，R_OK）= -1 ENOENT（无此类文件或目录）
    open（“ / etc / ld.so.cache”，O_RDONLY | O_CLOEXEC）= 3
    fstat（3，{st_mode = S_IFREG | 0644，st_size = 119796，...}）= 0
    mmap（NULL，119796，PROT_READ，MAP_PRIVATE，3，0）= 0x7fa6dc0c7000
    关闭（3）= 0
    access（“ / etc / ld.so.nohwcap”，F_OK）= -1 ENOENT（无此类文件或目录）
    打开（“ /lib/x86_64-linux-gnu/libc.so.6”，O_RDONLY | O_CLOEXEC）= 3
    读取（3，“ \ 177ELF \ 2 \ 1 \ 1 \ 0 \ 0 \ 0 \ 0 \ 0 \ 0 \ 0 \ 0 \ 0 \ 3 \ 0> \ 0 \ 1 \ 0 \ 0 \ 0 \ 200 \ 30 \ 2 \ 0 \ 0 \ 0 \ 0 \ 0“ ...，832）= 832
    fstat（3，{st_mode = S_IFREG | 0755，st_size = 1811128，...}）= 0
    mmap（NULL，3925208，PROT_READ | PROT_EXEC，MAP_PRIVATE | MAP_DENYWRITE，3，0）= 0x7fa6dbb06000
    mprotect（0x7fa6dbcbb000，2093056，PROT_NONE）= 0
    mmap（0x7fa6dbeba000、24576，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_FIXED | MAP_DENYWRITE，3、0x1b4000）= 0x7fa6dbeba000
    mmap（0x7fa6dbec0000，17624，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_FIXED | MAP_ANONYMOUS，-1，0）= 0x7fa6dbec0000
    关闭（3）= 0
    mmap（NULL，4096，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_ANONYMOUS，-1，0）= 0x7fa6dc0c6000
    mmap（NULL，4096，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_ANONYMOUS，-1，0）= 0x7fa6dc0c5000
    mmap（NULL，4096，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_ANONYMOUS，-1，0）= 0x7fa6dc0c4000
    arch_prctl（ARCH_SET_FS，0x7fa6dc0c5700）= 0
    mprotect（0x7fa6dbeba000，16384，PROT_READ）= 0
    mprotect（0x600000，4096，PROT_READ）= 0
    mprotect（0x7fa6dc0e7000，4096，PROT_READ）= 0
    munmap（0x7fa6dc0c7000，119796）= 0
    fstat（1，{st_mode = S_IFCHR | 0620，st_rdev = makedev（136，0），...}）= 0
    mmap（NULL，4096，PROT_READ | PROT_WRITE，MAP_PRIVATE | MAP_ANONYMOUS，-1，0）= 0x7fa6dc0e4000
    write（1，“ x”，1x）= 1
    exit_group（0）=？

橡胶在走线的最后一个呼叫旁边碰到道路（分拣，见下文）write(1,"x",1x)。此时，控制权从用户区域传递printx到处理其余部分的Linux内核。write()是在中声明的包装函数unistd.h

    extern ssize_t write（int __fd，__const void * __ buf，size_t __n）__wur;

大多数系统调用都以这种方式包装。顾名思义，包装函数仅是一个薄代码层，该薄代码层将自变量放置在正确的寄存器中，然后执行软件中断0x80。内核捕获中断，其余的就是历史记录。或者至少这就是它过去的工作方式。显然，中断捕获的开销非常高，并且，正如较早的文章所指出的那样，现代CPU体系结构引入了sysenter汇编指令，该指令可快速实现相同的结果。该页面的系统调用对系统调用的工作方式进行了很好的总结。

我觉得您可能会像我一样对这个答案感到失望。显然，从某种意义上说，这是一个错误的谷底，因为在调用write()与到达该点之间仍然有很多事情要做实际上修改了图形卡帧缓冲区，以使字母“ x”出现在屏幕上。如果要花费大量时间，那么通过深入内核来放大接触点（以与“橡皮筋抵挡道路”类似）是很有教育意义的。我猜想您将不得不经历多个抽象层，例如缓冲的输出流，字符设备等。请确保发布结果，以决定继续进行此操作：）

Question 4

标准库函数在底层平台库（例如UNIX API）上和/或通过直接系统调用（仍然是C函数）实现。系统调用（在我所知道的平台上）是通过对具有内联汇编的函数的调用在内部实现的，该函数将系统调用号和参数放入CPU寄存器中，并触发内核随后处理的中断。

除了系统调用之外，还有其他与硬件进行通信的方法，但是当在现代操作系统下运行时，这些方法通常不可用或受到限制，或者至少启用它们需要一些系统调用。可以将设备映射到内存，以便对某些内存地址的写入（通过常规指针）可以控制设备。I / O端口也经常使用，根据体系结构，可以通过特殊的CPU操作码访问它们，或者也可以将它们映射到特定的地址。

Question 5

好吧，除了分号和注释之外的所有C ++语句最终都变成了告诉CPU怎么做的机器代码。您可以编写自己的printf函数，而无需进行汇编。必须用汇编编写的唯一操作是端口的输入和输出，以及启用和禁用中断的内容。

但是，出于性能原因，汇编仍在系统级编程中使用。即使不支持内联汇编，也没有什么可以阻止您在汇编中编写单独的模块并将其链接到应用程序。

Question 6

通常，库函数是预编译的，并分发广告对象。出于性能原因，仅在特定情况下使用内联汇编程序，但这是例外，不是常规。实际上，在我看来，printf似乎不是内联汇编的好选择。Insetad，功能类似于memcpy或memcmp。底层汇编器（masm？gnu asm？）可能会编译非常低级的函数，并将其作为对象分发到库中。

Question 7

编译器从C / C ++源代码生成程序集。