C语言从入门到实战——编译和链接

本文介绍: 在C语言中，编译和链接是将源代码转换为可执行文件的两个主要步骤。预处理：将源代码中的预处理指令（如#include和#define）替换为实际的代码。编译：将预处理后的代码转换为汇编语言。汇编：将汇编语言转换为机器码指令。目标文件生成：将每个源文件编译后生成的目标文件（.o或.obj）进行合并，生成一个总的目标文件。符号解析：查找并解析目标文件中的所有符号（例如全局变量和函数名），以确保每个符号都有一个唯一的地址。

在C语言中，编译和链接是将源代码转换为可执行文件的两个主要步骤。

编译过程包括以下步骤：

链接过程包括以下步骤：

在编译和链接过程中，可以使用不同的编译器和链接器来完成这些步骤。常见的C语言编译器包括GCC、Clang和MSVC等，而常见的链接器包括GNU ld和Microsoft Linker等。

编译器和链接器的具体命令和选项可以根据不同的平台和编译环境而有所不同，可以通过编译器和链接器的帮助文档或命令行参数来了解更多信息。

ANSIC是一种计算机编程语言，全称为American National Standard Institute C。它是C语言的一个标准化版本，于1989年被美国国家标准学会（ANSI）采纳为正式的国家标准。ANSIC在C语言的基础上进行了一些改进和扩展，增加了一些新的特性和功能，提高了代码的可读性和可靠性。ANSIC的标准化使得不同厂商的编译器能够遵循相同的规范，从而实现了C语言的跨平台性和移植性。

在ANSIC的任何一种实现中，存在两个不同的环境。

其实翻译环境是由编译和链接两个大的过程组成的，而编译又可以分解成：预处理（有些书也叫预编译）、编译、汇编三个过程。
在这里插入图片描述
一个C语言的项目中可能有多个 .c 文件一起构建，那多个 .c 文件如何生成可执行程序呢？

在预处理阶段，源文件和头文件会被处理成为.i为后缀的文件。

在 gcc 环境下想观察一下，对 test.c 文件预处理后的.i文件，命令如下：

gcc -E test.c -o test.i

预处理阶段主要处理那些源文件中#开始的预编译指令。

比如：#include,#define，处理的规则如下：

经过预处理后的.i文件中不再包含宏定义，因为宏已经被展开。并且包含的头文件都被插入到.i入件中。所以当我们无法知道宏定义或者头文件是否包含正确的时候，可以查看预处理后的.i文件来确认。

gcc -S test.i -o test.s

array[index] = (index+4)*(2+6);

记号	类型
`array`	标识符
`[`	左方括号
`index`	标识符
`]`	右方括号
`=`	赋值
`（`	左圆括号
`index`	标识符
`+`	加号
`4`	数字
`）`	右圆括号
`2`	数字
`+`	加号
`6`	数字
`）`	右圆括号

gcc -c test.s -o test.o

比如：在一个C的项目中有2个.c文件（ test.c 和 add.c ），代码如下：
在这里插入图片描述
test.c

#include <stdio.h>
//test.c
//声明外部函数
extern int Add(int x, int y);
//声明外部的全局变量
extern int g_val;
int main()
{
	int a = 10;
	int b = 20;
	int sum = Add(a, b);
	printf("%dn", sum);
	return 0;
}

int g_val = 2022;
int Add(int x, int y)
{
	return x+y;
}

test.c 经过编译器处理生成 test.o
add.c 经过编译器处理生成 add.o

我们在 test.c 的文件中使用了 add.c 文件中的 Add 函数和 g_val 变量。

我们在 test.c 文件中每一次使用Add 函数和 g_val 的时候必须确切的知道 Add 和 g_val 的地址，但是由于每个文件是单独编译的，在编译器编译 test.c 的时候并不知道 Add 函数和 g_val变量的地址，所以暂时把调用Add 的指令的目标地址和 g_val 的地址搁置。等待最后链接的时候由链接器根据引用的符号 Add 在其他模块中查找 Add 函数的地址，然后将 test.c 中所有引用到Add 的指令重新修正，让他们的目标地址为真正的 Add 函数的地址，对于全局变量 g_val 也是类似的方法来修正地址。这个地址修正的过程也被叫做：重定位。