Linux二进制文件是Linux操作系统中可以直接被CPU执行的文件,它不需要经过编译或者解释过程,内部存储的是机器码指令和对应的数据,系统加载后可以直接调度CPU运行。和文本格式的源代码文件不同,二进制文件无法直接用普通文本编辑器查看内容,需要通过专门的工具解析。

Linux二进制文件的常见类型
Linux下的二进制文件主要分为几类,不同类型的文件作用和使用场景有所区别:
- 可执行文件:用户可以直接运行的程序,比如常用的ls、cd等命令对应的文件,执行时不需要额外参数就能完成对应功能。
- 动态链接库:后缀通常为.so的文件,存放可被多个程序共享调用的函数和数据,程序运行时动态加载使用。
- 静态链接库:后缀通常为.a的文件,编译时会被直接整合到可执行文件中,程序运行时不需要额外依赖。
- 内核模块:后缀为.ko的文件,用于扩展Linux内核功能,可以在系统运行时动态加载和卸载。
Linux二进制文件的格式
Linux中最主流的二进制文件格式是ELF(Executable and Linkable Format),几乎所有原生的二进制文件都遵循这个格式。ELF文件的结构可以分为几个部分:
- ELF头:文件开头的固定结构,记录了文件类型、CPU架构、程序入口地址等基础信息。
- 程序头表:描述文件如何被加载到内存中,告诉系统哪些段需要映射、映射的权限是什么。
- 节头表:描述文件中的各个节的信息,比如代码节、数据节、符号表节等,主要用于链接和调试。
- 数据节:实际存储机器码、常量、字符串等内容的区域。
如何识别Linux二进制文件
可以通过系统自带的工具快速判断一个文件是不是二进制文件,常用的方法有以下几种:
使用file命令
file命令会分析文件的内容和结构,返回文件的类型描述,对于ELF格式的二进制文件会明确标注。示例代码如下:
# 查看ls命令对应的文件类型 file /bin/ls # 输出结果示例:/bin/ls: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, for GNU/Linux 3.2.0, stripped
查看文件权限
可执行类型的二进制文件通常会带有执行权限,可以通过ls -l命令查看文件权限位,如果权限位包含x,说明文件可以被执行。示例代码如下:
# 查看/bin/ls的权限 ls -l /bin/ls # 输出结果示例:-rwxr-xr-x 1 root root 142144 某月 某日 /bin/ls # 权限位的rwx说明所有者有读、写、执行权限
二进制文件和源代码文件的区别
很多用户会混淆二进制文件和源代码文件,两者的核心区别如下:
| 对比维度 | 二进制文件 | 源代码文件 |
|---|---|---|
| 内容形式 | 机器码,无法直接阅读 | 高级语言代码,可直接阅读编辑 |
| 执行方式 | 系统直接加载运行 | 需要编译或解释后才能执行 |
| 文件后缀 | 无固定后缀,常见的有可执行文件无后缀、.so、.a、.ko等 | 有固定后缀,比如.c、.cpp、.py、.sh等 |
| 修改难度 | 修改需要反汇编工具,难度高 | 直接用文本编辑器修改,难度低 |
处理二进制文件的常用操作
日常使用中可能会需要对二进制文件做简单的操作,以下是几个常见场景的示例:
赋予二进制文件执行权限
如果是自己编译生成的可执行二进制文件,默认可能没有执行权限,需要手动添加。示例代码如下:
# 给test_binary文件添加所有用户的执行权限 chmod +x test_binary # 之后就可以直接执行该文件 ./test_binary
查看二进制文件依赖的动态库
动态链接的可执行二进制文件运行时会依赖系统上的动态库,如果缺少依赖会无法运行,可以用ldd命令查看依赖。示例代码如下:
# 查看ls命令依赖的动态库 ldd /bin/ls # 输出结果会列出所有依赖的.so文件及对应的路径
查看二进制文件的符号表
如果需要了解二进制文件包含的函数、变量等符号信息,可以用nm命令查看,不过如果是经过strip处理的二进制文件,符号表会被移除,无法查看。示例代码如下:
# 查看test_binary的符号表 nm test_binary
需要注意的是,不要随意修改系统自带的二进制文件,否则可能导致系统命令无法正常运行,如果需要修改程序功能,建议从源代码重新编译生成新的二进制文件。