GCC 指令详解及动态库、静态库的使用方法
MElephant 人气:0一、GCC
1.1 GCC 介绍
GCC 是 Linux 下的编译工具集,是「GNU Compiler Collection」的缩写,包含 gcc、g++ 等编译器。这个工具集不仅包含编译器,还包含其他工具集,例如 ar、nm 等。
GCC 工具集不仅能编译 C/C++ 语言,其他例如 Objective-C、Pascal、Fortran、Java、Ada 等语言均能进行编译。GCC 还可以根据不同的硬件平台进行编译,即能进行交叉编译,在 A 平台上编译 B 平台的程序,支持常见的 X86、ARM、PowerPC、mips 等,以及 Linux、Windows 等软件平台。
1.2 安装 GCC
首先,查看 gcc 是否安装:
# 查看 gcc 版本 $ gcc -v $ gcc --version # 查看 g++ 版本 $ g++ -v $ g++ --version
如果在输入指令后可以获取到 gcc 版本,那么就表明你的 Linux 中已经安装了 gcc:
如果没有安装,则可按照如下方法安装 gcc:
# centos $ sudo yum update # 更新本地的软件下载列表, 得到最新的下载地址 $ sudo yum install gcc g++ # 通过下载列表中提供的地址下载安装包, 并安装
1.3 GCC 工作流程
1.3.1 一般使用流程
首先准备一个 C 语言代码,并命名为 test.c:
#include <stdio.h> #define MAX 3 int main() { int i; for (i = 1; i <= MAX; i++) { printf("Hello World\n"); // 输出 Hello World } return 0; }
一般情况下,我们可以直接通过 $ gcc test.c -o test
编译 test.c,并通过$ ./test
指令运行生成的可执行文件:
-o
:output,是 gcc 编译器的可选参数,用于指定输出文件名及路径,默认输出到当前路径下。下图展示了如何通过 -o 参数修改输出路径:
或者不使用 -o 参数,则生成一个默认名称的可执行文件 a.out:
实际上,GCC 编译器在对程序进行编译的时候,分为了四个步骤:
预处理(Pre-Processing):
- 在这个阶段主要做了三件事:展开头文件 、宏替换 、去掉注释行
- 结果得到的还是一个 C 程序,通常是以 .i 作为文件扩展名
编译(Compiling) :
- 在这个阶段中,gcc 首先要检查代码的规范性、是否有语法错误等,以确定代码实际要做的工作
- 在检查无误后,gcc 把代码编译成汇编代码,得到一个以 .s 作为文件拓展名的汇编文件。
汇编(Assembling):
+ 汇编阶段是把编译阶段生成的 .s 文件转化成目标文件 + 最终得到一个以 .o 结尾的二进制文件
链接(Linking):这个阶段需要 GCC 调用链接器对程序需要调用的库进行链接,最终得到一个可执行的二进制文件
而 GCC 的编译器可以将这 4 个步骤合并成一个,这也就是为什么我们使用$ gcc test.c -o test
就可以直接生成可执行文件 test 的原因。下面我们对这 4 个步骤做个详细的介绍。
1.3.2 详细的工作流程
1.3.2.1 预处理
# 通过添加参数 -E 生成预处理后的 C 文件 test.i # 必须通过 -o 参数指定输出的文件名 $ gcc -E test.c -o test.i
让我们来观察一下 test.i 中的代码内容(太长了,只观察 main 函数中的替换情况):
int main() { int i; for (i = 1; i <= 3; i++) { printf("Hello World\n"); } return 0; }
通过分析 test.i 可以发现:
- 宏定义 MAX 被替换为了相应的值 3
- 注释「// 输出 Hello World」也被去掉了
1.3.2.2 编译
# 通过添加参数 -S 将 test.i 转换为汇编文件 test.s(默认生成 .s 文件) $ gcc -S test.i $ gcc -S test.i -o test.s # 写法二
1.3.2.3 汇编
# 通过汇编得到二进制文件 test.o(默认生成 .o 文件,object) $ gcc -c test.s $ gcc -c test.s -o test.o # 写法二
1.3.2.4 链接
# 通过链接得到可执行文件 test $ gcc test.o -o test
在成功生成 test.o 文件后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。
在 test.c 的代码中,我们通过print()
函数打印 Hello World 语句;但是在这段程序中并没有定义 printf 的函数实现,且在预编译中包含进去的「stdio.h」中也只有该函数的声明extern int printf (const char *__restrict __format, ...);
,而没有定义函数的实现,那么是在哪里实现的呢?
答案就是:系统把这些函数实现都做到了名为 libc.so.6 的库文件中去了,在没有特别指定时,gcc 会到系统默认的搜索路径 /usr/lib64 下进行查找,也就是链接到 libc.so.6 库函数中去,这样就有函数 printf 的实现了,而这也就是链接的作用。
而函数库一般分为静态库和动态库两种:
- 静态库是指在编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不需要库文件了。在 Linux 中静态库一般以 .a 作为后缀。
- 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时链接文件加载库,这样就可以节省系统的开销。在 Linux 中动态库一般以 .so 作为后缀。
如前面所述的 libc.so.6 就是动态库,gcc 在编译时默认使用动态库。完成了链接之后,gcc 就可以生成可执行文件了。
有关动态库和静态库的详细介绍,将在下文进行具体讲解。
1.3.2.5 总结
最后,通过一张图来总结一下上述流程:
在 Linux 下使用 GCC 编译器编译单个文件十分简单,直接使用
$ gcc test.c
(test.c 为要编译的 C 语言的源文件),GCC 会自动生成文件名为 a.out 的可执行文件(也可以通过参数 -o 指定生成的文件名);也就是通过一个简单的命令就可以将上边提到的 4 个步骤全部执行完毕了;但是如果想要单步执行也是没问题的。
1.4 GCC 常用参数
下面的表格中列出了一些常用的 gcc 参数,这些参数在 gcc 命令中没有位置要求,只需要编译程序的时候将需要的参数指定出来即可。
gcc 编译选项 | 解释说明 |
---|---|
-E | 预处理,主要是进行宏展开等步骤,生成 test.i |
-S | 编译指定的源文件,但是不进行汇编,生成 test.s |
-c | 编译、汇编源文件,但是不进行链接,生成 test.o |
-o | 指定链接的文件名及路径 |
-g | 在编译的时候,生成调试信息,该程序可以被调试器调试 |
-D | 在程序编译的时候,指定一个宏 |
-std | 指定 C 方言,如 -std=c99。gcc 默认的方言是 GNU C |
-l | 在程序编译的时候,指定使用的库(库的名字一定要掐头去尾,如 libtest.so 变为 test) |
-L | 在程序编译的时候,指定使用的库的路径 |
-fpic | 生成与位置无关的代码 |
-shared | 生成共享目标文件,通常用在建立动态库时 |
1.4.1 指定一个宏(-D)
在程序中我们可以通过使用#define
定义一个宏,也可以通过宏控制某段代码是否能够被执行。
#include <stdio.h> int main() { int num = 60; printf("num = %d\n", num); #ifdef DEBUG printf("定义了 DEBUG 宏, num++\n"); num++; #else printf("未定义 DEBUG 宏, num--\n"); num--; #endif printf("num = %d\n", num); return 0; }
由于我们在程序中并没有定义 DEBUG 宏,所以第 8~9 行的代码就不会被执行:
那么如何才能够在程序中不定义 DEBUG 宏的情况下执行第 8~9 行的代码呢?答案是通过 -D 参数:
需要注意的是,-D 参数必须在生成 test.o 前使用(链接前)。如下所示,是无效的:
说了这么多,-D 参数有什么用呢?下面我们简单叙述一下 -D 参数的应用场景。
1.4.1.1 应用场景一
在发布程序的时候,一般都会要求将程序中所有的 log 输出去掉,如果不去掉会影响程序的执行效率,很显然删除这些打印 log 的源代码是一件很麻烦的事情,解决方案是这样的:
- 将所有的打印 log 的代码都写到一个宏判定中,可以模仿上边的例子;
- 在调试程序的时候指定 -D,就会有 log 输出;
- 在发布程序的时候不指定 -D,log 就不会输出;
1.4.1.2 应用场景二
或者,你编写的一个软件,某个付费功能只对已付费的用户 A 开放,但不对白嫖的用户 B 开放,其中一种解决方法是:
- 每个用户对应一个维护分支,用户 A 对应 project_1 分支包含付费功能的代码,用户 B 对应的 project_2 分支不包含付费功能的代码。
- 当用户 B 付费订阅时,再将付费项目的代码拷贝到 project_2 中
如果再来一个用户 C 呢?有没有感觉很麻烦的样子?那么我们完全可以这样做:
#include <stdio.h> int main() { #ifdef CHARGE //付费用户执行流程 printf("该用户已付费,执行付费功\n"); #else //白嫖用户执行流程 printf("白嫖用户,拒绝执行付费功能\n"); #endif printf("公共功能\n"); return 0; }
在编译付费用户的时候,添加 -D CHARGE 参数;编译白嫖用户,则不添加。这样的话,不管来多少用户,都只需要维护一个分支即可。
1.4.2 指定 C 方言(-std)
对于如下 C 语言代码:
#include <stdio.h> int main() { for (int i = 1; i <= 3; i++) { printf("i = %d\n", i); } return 0; }
在编译时是会报错的:
但如果我们加上 -std=c99,就可以了:
二、静态库和动态库
2.1 扫盲
库是「已经写好的、供使用的」可复用代码,每个程序都要依赖很多基础的底层库。
从本质上,库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。程序中调用的库有两种「静态库和动态库」,所谓的「静态、动态」指的是链接的过程。
2.2 静态库
2.2.1 静态库简介
在 Linux 中静态库以 lib 作为前缀、以 .a 作为后缀,形如 libxxx.a(其中的 xxx 是库的名字,自己指定即可)。静态库以之所以称之为「静态库」,是因为在链接阶段,会将汇编生成的目标文件 .o 与引用的库一起链接到可执行文件中,对应的链接方式称为静态链接。
2.2.2 静态库的生成
在 Linux 中静态库由程序 ar 生成。生成静态库,需要先对源文件进行汇编操作得到二进制格式的目标文件(以 .o 结尾的文件),然后再通过 ar 工具将目标文件打包就可以得到静态库文件了。
使用 ar 工具创建静态库的一般格式为$ ar -rcs libxxx.a 若干原材料(.o文件)
:
2.2.3 静态库的制作举例
在某目录中有如下源文件,用来实现一个简单的计算器。
add.c
#include <stdio.h> int add(int a, int b) { return a + b; }
sub.c
#include <stdio.h> int subtract(int a, int b) { return a - b; }
mult.c
#include <stdio.h> int multiply(int a, int b) { return a * b; }
具体操作步骤如下:
# 第一步:将源文件 add.c、sub.c、mult.c 进行汇编,得到二进制目标文件 add.o、sub.o、mult.o $ gcc -c add.c sub.c mult.c # 第二步:将生成的目标文件通过 ar 工具打包生成静态库 $ ar rcs libcalc.a add.o sub.o mult.o
2.2.4 静态库的使用
定义 main 函数如下所示:
main.c
#include <stdio.h> int main() { int a = 20; int b = 12; printf("a = %d, b = %d\n", a, b); printf("a + b = %d\n", add(a, b)); printf("a - b = %d\n", subtract(a, b)); printf("a * b = %d\n", multiply(a, b)); return 0; }
并将静态库 libcalc.a 置于同级目录下:
通过指令$ gcc main.c -o main -L ./ -l calc
编译 main.c 文件,并链接静态库 libcalc.a:
- -L:指定使用的库的路径(因为在同一级目录下,所以可以直接用了
./
,或者使用绝对路径也是可以的) - -l:指定使用的库(库的名字一定要掐头去尾。如:libcalc.a 变为 calc)
编译结果会提示三个 warning,这是由于没有定义这些函数导致的,先暂时不用管。
运行 main 结果如下:
我们思考这么一个问题:由于静态库是我们自己制作的,其所包含的函数我们很清楚,直接链接并使用即可。但如果别人想要使用呢?他们可不清楚静态库中的函数该如何调用,所以我们有必要提供一个头文件,这样将静态库及头文件交给其他人时,他们知道该如何用了。
head.h
#ifndef _HEAD_H_ #define _HEAD_H_ int add(int a, int b); int subtract(int a, int b); int multiply(int a, int b); #endif
还记得之前的报错吗?现在有了头文件就要使用起来。
main.c
#include <stdio.h> #include "head.h" int main() { int a = 20; int b = 12; printf("a = %d, b = %d\n", a, b); printf("a + b = %d\n", add(a, b)); printf("a - b = %d\n", subtract(a, b)); printf("a * b = %d\n", multiply(a, b)); return 0; }
编译、链接、运行,一气呵成:
2.2.5 ar 命令参数介绍
制作静态库时所使用的指令$ ar rcs libcalc.a add.o sub.o mult.o div.o
共有三个参数:
-c:创建一个库,不管库是否存在,都将创建。这个很好理解,就不做过多的解释了。
-r:在库中插入(替换)模块 。默认新的成员添加在库的结尾处,如果模块名已经在库中存在,则替换同名的模块。
-s:创建目标文件索引,这在创建较大的库时能加快时间。
参数 -r 的详细解释
假设现在有了新的需求,需要静态库 libcalc.a 提供除法运算的功能模块,该怎么操作呢?
首先我们需要新建一个除法运算的源文件 div.c:
#include <stdio.h> double divide(int a, int b) { return (double)a / b; }
并通过汇编操作生成目标文件 div.o。
接下来我们可以通过 -r 参数将除法运算的模块添加到静态库中:$ ar -r libcalc.a div.o
。
并且要在 head.h 中增加对除法运算的声明:
#ifndef _HEAD_H_ #define _HEAD_H_ // Other double divide(int a, int b); #endif
参数 -s 的详细解释
在获取一个静态库的时候,我们可以通过$ nm -s libcalc.a
来显示库文件中的索引表:
而索引的生成就要归功于 -s 参数了。
如果不需要创建索引,可改成 -S 参数。
如果 libcalc.a 缺少索引,可以使用
$ ranlib libcalc.a
指令添加。
2.2.6 其他命令介绍
# 显示库文件中有哪些目标文件,只显示名称 $ ar t libcalc.a # 显示库文件中有哪些目标文件,显示文件名、时间、大小等详细信息 $ ar tv libcalc.a # 显示库文件中的索引表 $ nm -s libcalc.a # 为库文件创建索引表 $ ranlib libcalc.a
2.3 动态库
2.3.1 动态库简介
在 Linux 中动态库以 lib 作为前缀、以 .so 作为后缀,形如 libxxx.so(其中的 xxx 是库的名字,自己指定即可)。相比于静态库,使用动态库的程序,在程序编译时并不会链接到目标代码中,而是在运行时才被载入。不同的应用程序如果调用相同的库,那么在内存中只需要有一份该共享库的实例,避免了空间浪费问题。同时也解决了静态库对程序的更新的依赖,用户只需更新动态库即可。
2.3.2 动态库的生成
生成动态库是直接使用 gcc 命令,并且需要添加 -fpic 以及 -shared 参数:
- -fpic 参数的作用是使得 gcc 生成的代码是与位置无关的,也就是使用相对位置。
- -shared 参数的作用是告诉编译器生成一个动态链接库。
2.3.3 动态库的制作举例
还是以上述程序 add.c、sub.c、mult.c 为例:
# 第一步:将源文件 add.c、sub.c、mult.c 进行汇编,得到二进制目标文件 add.o、sub.o、mult.o $ gcc -c -fpic add.c sub.c mult.c # 第二步:将得到的 .o 文件打包成动态库 $ gcc -shared add.o sub.o mult.o -o libcalc.so # 第三步:发布动态库和头文件 1. 提供头文件 head.h 2. 提供动态库 libcalc.so
至于为什么需要提供头文件,在讲解静态库时已经做了说明,此处不再赘述。
2.3.4 动态库的使用
head.h
#ifndef _HEAD_H_ #define _HEAD_H_ int add(int a, int b); int subtract(int a, int b); int multiply(int a, int b); #endif
main.c
#include <stdio.h> #include "head.h" int main() { int a = 20; int b = 12; printf("a = %d, b = %d\n", a, b); printf("a + b = %d\n", add(a, b)); printf("a - b = %d\n", subtract(a, b)); printf("a * b = %d\n", multiply(a, b)); return 0; }
和静态库的链接方式一样,都是通过指令$ gcc main.c -o main -L ./ -l calc
来进行链接库操作。
gcc 通过指定的动态库信息生成了可执行程序 main,但是可执行程序运行却提示无法加载到动态库:
./main: error while loading shared libraries: libcalc.so: cannot open shared object file: No such file or directory
这是怎么回事呢?
2.3.5 解决动态库加载失败的问题
首先来看一下不同库的工作原理:
- 静态库如何被加载:
- 在程序编译的最后一个阶段也就是链接阶段,提供的静态库会被打包到可执行程序中。
- 当可执行程序被执行,静态库中的代码也会一并被加载到内存中,因此不会出现静态库找不到无法被加载的问题。
- 动态库如何被加载:
- 在程序编译的最后一个阶段也就是链接阶段,在 gcc 命令中虽然指定了库路径,但是这个路径并没有被记录到可执行程序中,只是检查了这个路径下的库文件是否存在。同样对应的动态库文件也没有被打包到可执行程序中,只是在可执行程序中记录了库的名字。
- 当可执行程序被执行起来之后:
- 程序会先检测所需的动态库是否可以被加载,加载不到就会提示上边的错误信息。
- 当动态库中的函数在程序中被调用了,这个时候动态库才加载到内存,如果不被调用就不加载。
动态库的检测和内存加载操作都是由动态链接器来完成的
动态链接器是一个独立于应用程序的进程,属于操作系统。当用户的程序需要加载动态库的时候动态连接器就开始工作了,很显然动态连接器根本就不知道用户通过 gcc 编译程序的时候通过参数 -L 指定的路径。
那么动态链接器是如何搜索某一个动态库的呢,在它内部有一个默认的搜索顺序,按照优先级从高到低的顺序分别是:
可执行文件内部的 DT_RPATH 段。
系统的环境变量 LD_LIBRARY_PATH。
系统动态库的缓存文件 /etc/ld.so.cache。
存储「静态库 / 动态库」的系统目录 /lib、/usr/lib 等。
按照以上四个顺序,依次搜索,找到之后结束遍历。若检索到最终还是没找到,那么动态连接器就会提示动态库找不到的错误信息。一般情况下,我们都是通过修改系统的环境变量的方式设置动态库的地址。
将动态库路径追加到环境变量 LD_LIBRARY_PATH 中:$ LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:动态库的绝对路径
比如,我所需要的动态库的绝对路径为 /mnt/hgfs/SharedFolders/DynamicLibrary,那么:
$ LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/mnt/hgfs/SharedFolders/DynamicLibrary
这样的话,我在运行 main,就不会报错了。
但是通过这种方式设置的环境变量尽在当前的终端中有效,那么怎样才能让这个设置永久生效呢?
通过指令$ vim ~/.bashrc
打开并修改该文件:
修改后,使用$ source ~/.bashrc
使修改立即生效。
经过上述操作,就不用每次开启终端都需要修改环境变量了。当然这种永久生效的方式仅适用于动态库路径唯一的情况,如果你每次使用的动态库都在不同的位置,那么这么设置也没啥用
加载全部内容