Answers:
=====> COMPILATION PROCESS <======
|
|----> Input is Source file(.c)
|
V
+=================+
| |
| C Preprocessor |
| |
+=================+
|
| ---> Pure C file ( comd:cc -E <file.name> )
|
V
+=================+
| |
| Lexical Analyzer|
| |
+-----------------+
| |
| Syntax Analyzer |
| |
+-----------------+
| |
| Semantic Analyze|
| |
+-----------------+
| |
| Pre Optimization|
| |
+-----------------+
| |
| Code generation |
| |
+-----------------+
| |
| Post Optimize |
| |
+=================+
|
|---> Assembly code (comd: cc -S <file.name> )
|
V
+=================+
| |
| Assembler |
| |
+=================+
|
|---> Object file (.obj) (comd: cc -c <file.name>)
|
V
+=================+
| Linker |
| and |
| loader |
+=================+
|
|---> Executable (.Exe/a.out) (com:cc <file.name> )
|
V
Executable file(a.out)
C预处理是编译的第一步。它处理:
#define
陈述。#include
陈述。该单元的目的是将C源文件转换为Pure C代码文件。
该单元有六个步骤:
它将源文件中的字符组合起来,形成一个“令牌”。令牌是一组没有“空格”,“制表符”和“换行符”的字符。因此,该编译单元也称为“ TOKENIZER”。它还删除注释,生成符号表和重定位表条目。
该单元检查代码中的语法。例如:
{
int a;
int b;
int c;
int d;
d = a + b - c * ;
}
上面的代码将产生解析错误,因为方程式不平衡。本单元通过如下生成解析器树在内部进行检查:
=
/ \
d -
/ \
+ *
/ \ / \
a b c ?
因此,该单元也称为PARSER。
该单元检查语句中的含义。例如:
{
int i;
int *p;
p = i;
-----
-----
-----
}
上面的代码生成错误“分配不兼容类型”。
该单元独立于CPU,即有两种优化类型
本单元以以下形式优化代码:
例如:
{
int a = 10;
if ( a > 5 ) {
/*
...
*/
} else {
/*
...
*/
}
}
此处,编译器在编译时知道'a'的值,因此它也知道if条件始终为true。因此,它消除了代码中的else部分。
例如:
{
int a, b, c;
int x, y;
/*
...
*/
x = a + b;
y = a + b + c;
/*
...
*/
}
可以优化如下:
{
int a, b, c;
int x, y;
/*
...
*/
x = a + b;
y = x + c; // a + b is replaced by x
/*
...
*/
}
例如:
{
int a;
for (i = 0; i < 1000; i++ ) {
/*
...
*/
a = 10;
/*
...
*/
}
}
在上面的代码中,如果“ a”是本地的并且未在循环中使用,则可以按以下方式对其进行优化:
{
int a;
a = 10;
for (i = 0; i < 1000; i++ ) {
/*
...
*/
}
}
在这里,编译器生成汇编代码,以便将更常用的变量存储在寄存器中。
此处的优化取决于CPU。假设如果代码中有多个跳转,则将它们转换为:
-----
jmp:<addr1>
<addr1> jmp:<addr2>
-----
-----
控件直接跳转到。
然后最后一个阶段是链接(创建可执行文件或库)。运行可执行文件时,将加载其所需的库。
ASCII表示形式:
[Source Code] ---> Compiler ---> [Object code] --*
|
[Source Code] ---> Compiler ---> [Object code] --*--> Linker --> [Executable] ---> Loader
| |
[Source Code] ---> Compiler ---> [Object code] --* |
| |
[Library file]--* V
[Running Executable in Memory]
希望这对您有所帮助。
首先,通过以下图表:
(img source->internet)
您编写一段代码并保存文件(源代码),然后
预处理:-顾名思义,它不是编译的一部分。它们指示编译器在实际编译之前进行必要的预处理。您可以将此阶段称为“文本替换”或解释由#表示的特殊预处理程序指令。
编译:-编译是一个过程,其中用一种语言编写的程序被翻译成另一种目标语言。如果有错误,编译器将检测到并报告。
汇编:-汇编代码被翻译成机器代码。您可以将汇编器称为特殊类型的编译器。
链接:-如果这些代码段需要链接其他一些源文件,则链接器将它们链接起来以使其成为可执行文件。
之后有很多过程发生。是的,您猜测加载器的作用就在这里:
加载程序:-将可执行代码加载到内存中;程序和数据堆栈已创建,寄存器已初始化。
小小额外信息:-http: //www.geeksforgeeks.org/memory-layout-of-c-program/,您可以在那看到内存布局。
编译器:它是一个将高级语言程序转换为机器语言程序的程序。编译器比汇编器更智能。它检查各种限制,范围,错误等。但是它的程序运行时间更多,并且占用了内存的较大部分。它的速度慢。因为编译器会遍历整个程序,然后将整个程序转换为机器代码。如果编译器在计算机上运行并为同一台计算机生成机器代码,则称为自编译器或常驻编译器。另一方面,如果编译器在计算机上运行并为其他计算机生成机器代码,则称为交叉编译器。
链接器:在高级语言中,存储了一些内置的头文件或库。这些库是预定义的,并且包含对执行程序必不可少的基本功能。这些功能通过名为Linker的程序链接到库。如果链接器找不到函数库,则它会通知编译器,然后编译器将生成错误。编译器自动调用链接器,作为编译程序的最后一步。它不是内置库,它还将用户定义的函数链接到用户定义的库。通常,将较长的程序分为称为模块的较小子程序。并且必须将这些模块组合才能执行程序。组合模块的过程由链接器完成。
加载程序:加载程序是将程序的机器代码加载到系统内存中的程序。在计算中,加载程序是操作系统的一部分,负责加载程序。这是启动程序过程中的重要阶段之一。因为它将程序存储到内存中并为执行做准备。加载程序涉及将可执行文件的内容读取到内存中。加载完成后,操作系统通过将控制权传递给加载的程序代码来启动程序。所有支持程序加载的操作系统都具有加载程序。在许多操作系统中,加载程序永久地驻留在内存中。
*
*
LinuxJournal的链接器和加载器清楚地解释了此概念。它还说明了经典名称a.out是如何出现的。(汇编输出)
快速总结
c program --> [compiler] --> objectFile --> [linker] --> executable file (say, a.out)
我们得到了可执行文件,现在将此文件提供给您的朋友或需要此软件的客户:)
当他们运行此软件时,说在命令行./a.out中输入
execute in command line ./a.out --> [Loader] --> [execve] --> program is loaded in memory
一旦程序被加载到存储器中,控制就通过使PC(程序计数器)指向第一个指令来转移到该程序。 a.out
链接器和解释器是互斥的解释器,逐行获取代码并逐行执行代码。
编译器 将源代码转换为目标代码。
链接器 将多个目标文件组合为一个可执行程序文件。
加载程序 将可执行文件加载到主存储器中。
编译器是一种特殊程序,用于处理以特定编程语言编写的语句,并将其转换为计算机处理器使用的机器语言或“代码”
编译器将代码行从编程语言转换为机器语言。
链接器在两个程序之间创建链接。
加载程序将程序加载到主数据库,程序等的内存中。
编译器:这是一个系统软件,可以纠正程序,目标文件,消息等错误
链接器:这是一个系统软件,它将一个或多个目标文件以及可能的某些库代码组合到某些可引用的库或错误列表中
加载程序:将可执行文件加载到计算机主存储器的程序