C/C++ Lib库文件nm调试之符号表

长平狐 发布于 2013/01/05 18:17
阅读 4K+
收藏 0

        本文主要介绍了一下在Linux下开发c/c++时候,不可避免的会开发或者生成.o .a .so这种中间库状态的文件(可能是自己写了一个lib让别人调用,或者提供.c/.cpp文件嵌入别人的Makefile工程)。如何查看这些库文件的一些基本信息。有时候大家编译程序时候(确切的说是链接器链接的时候)很多错误例如"undefine reference",之类的常见错误,原因就是因为没有找到.o .a .so的库文件,导致链接失败。

        -------------------------------------------------------------------------------

        1、Linux库文件

        2、库文件的使用方式

        3、利用tar/nm查看库文件的信息

        -------------------------------------------------------------------------------

       1、库文件的定义之类的就不在此累赘了,有兴趣Google之。说白了就是我们写好一些对应的.h和.c(.cpp)文件,然后通过编译器的编译,生成中间代码供他人使用,他人只需要将你的中间代码include进自己的程序即可。注意,编译器编译成最终可执行的文件需要好几步,基本可以分为:文本解析->语法解析->此法分析->预处理分析->编译->连接。生成中间库是没有链接阶段的,在Linux Gcc下通过-C参数指定只编译不链接,所以如果写了一个.c文件用到了比如pthread_create之类的外部调用,在Gcc -C编译的时候不用-lpthread因为这个时候是不需要链接的。

      2、(对库文件熟悉话直接跳过)在各个系统平台上,库文件的格式和形式各不相同,Windows下就是如同xxx.dll或者xxx.lib,*inux下就是xxx.so或者xxx.a。两种分别对应的是静态库和动态库,静态库会连同编译器编译链接进入程序成为程序的一部分,好处是作为程序的一部分不用每次运行时都去load(弊端是可能很多进程都用到这个库但是每个进程中都有一份,动态库的话内存中只有一份,通过重定向来加载),而且不会导致因库的缺失而运行失败,坏处是会导致可执行文件偏大。动态库是程序运行时动态加载到进程里去的,而且可以多进程共,并且方便软件更新,直接替换老的库即可。

      到底使用静态还是动态库取决于程序的使用上下文环境,一般第三方库都提供了两种版本,系统库的话一般都是动态链接库,因为同样系统下的库都是一样的。用Linux的Gcc举例:

      一、写了一个.h声明一个foo()函数,然后在.c或者.cpp中实现foo()函数

      二、gcc(g++) -c -o foo.o foo.c (注意此处不需要.h头文件,头文件只是对库的对外接口描述)

      三、生成静态库: ar -r libfoo.a foo.o (静态库.a其实就是.o文件的压缩包,注意这里不支持把.a打入.a)

             生成动态库: gcc foo.c -fPIC -shared -o libfoo.so(-fPIC意思是生成位置无关代码,因为动态库是运行时加载的,需要对代码进行重定向,不清楚可以Google一下)

      四、写个含有main函数的文件,并调用foo()函数 : gcc(g++) -o test test.c -lfoo,这里-lfoo意思是去找以lib开头的某.so或.a文件,默认优先找.so动态库

      需要注意一下的是,如果是cpp引用了c的库或.c那么头文件里要用externc "C"关键字来指定按c的方式读取(根本上是因为c和c++的函数签名不一致,因为c++支持重载,所以按c++的方式是找不到同名的c函数的)。在使用动态库的情况下,程序回去一些预定义的地方找.so文件。比如/usr/lib/下,如果需要自己指定,请修改/etc/ld.so.conf文件。并用ldconfig来刷新cache。

 

      3、如果我们需要查看自己写的库的信息时可以用nm来查看,如查看库中有哪些函数,有哪些全局变量,有哪些依赖别的库的东西等等,下面我们写一个例子来说明一下:

#include <stdio.h>

int g1; 
int g2 = 0;

static int g3; 
static int g4=0;

const int g5=0;

static const int g6 = 0;

int main(int argc, char *argv[])
{
    static int st = 0;

    int t1; 
    int t2 = 0;

    const int t3 = 0;

    printf("printf-function");

    return 0;
}

void foo1(){}
static void foo2(){}
void overload(int i){}
void overload(float i){}


        linux的nm命令可以一个文件中的符号列表,列出以上代码Gcc -c编译出的a.o(a.a a.so)可以通过nm命令来查看其中的符号信息:

0000000000000000 t 
0000000000000000 d 
0000000000000000 b 
0000000000000000 r 
0000000000000000 r 
0000000000000000 n 
0000000000000000 n 
0000000000000000 B g1
0000000000000004 B g2
0000000000000008 b g3
000000000000000c b g4
000000000000001c r g5
0000000000000020 r g6
                 U __gxx_personality_v0
0000000000000000 T main
0000000000000000 a nm.cpp
                 U printf
000000000000003e T _Z4foo1v
0000000000000044 t _Z4foo2v
0000000000000054 T _Z8overloadf
000000000000004a T _Z8overloadi
0000000000000010 b _ZZ4mainE2st

        其中左边第一列是符号的地址值,对应源码可以看出递增的规律。第二列是该符号的类型,第三列是符号的名称(比如函数名,变量名):

        符号类型:介绍几个最常用的,其他的如果遇到了直接Google:

           B --- 全局非初始化数据段(BBS段)的符号,其值表示该符号在bss段中的偏移,如g1

           b --- 全局static的符号,如g3

           r --- const型只读的变量(readonly)

           N --- debug用的符号

           T --- 位于代码区的符号,比如本文件里的函数main foo

           t  --- 位于代码区的符号,一般是static函数

           U --- 位于本文件外的调用函数或变量符号,比如系统的printf()函数

       这里要注意的是,本人使用g++编译的,所以是按c++的支持重载的函数风格编译的,可以看到所有函数均带了前缀和后缀,前缀代表属于类的名字,后缀代表参数列表的类型缩写,因为重载必须是区分参数类型,这里也可以看出,为什么返回值不同的函数不是重载,因为符号表里没有返回值的记录。

       例如两个overload函数的后缀分别是f和i代表一个是float型一个是int型(上面还有v ->void型)。

       nm命令对大家调试多模块的程序很有用处,大部分情况下可以解决"undefined reference"的问题,如果大家发现nm的另类很好的用法,也可以留言哈!!!



原文链接:http://blog.csdn.net/gugemichael/article/details/8215738
加载中
返回顶部
顶部