C 19-25 编译及预编译
19 编译过程简介
初识编译器
你不知道的事......
预编译
- 处理所有的注释,以空格代替
- 将所有的#define删除,并展开所有的宏定义
- 处理条件编译指令#if,#ifdef,#elif,#else,#endif
- 处理#include,展开被包含的文件
- 保留编译器需要使用的#pragma指令
预处理指令示例:gcc -E file.c -o file.i
编译
- 对预处理文件进行词 法分析,语法分析和语义分析
- 词法分析:分析关键字,标示符,立即数等是否合法
- 语法分析:分析表达式是否遵循语法规则
- 语义分析:在语法分析的基础上进一步分析表达式是否合法
- 分析结束后进行代码优化生成相应的汇编代码文件
编译指令示例:gcc -S file.i -o file.s
汇编
- 汇编器将汇编代码转变为机器的可以执行命令
- 每条汇编语句几乎都对应一条机器指令
汇编指令示例:gcc -c file.s -o file.o
编程实验
- 源码单步编译示例
/*
This is a header file.
*/
char* p = "Hello";
int i = 0;
#include "19-1.h"
// Begin to define macro
#define GREETING "Hello world!"
#define INC(x) x++
// End
int main() {
p = GREETING;
INC(i);
return 0;
}
小结
- 编译过程分为预处理,编译,汇编和链接四个阶段
- 预处理:处理注释,宏以及已经以#开头的符号
- 编译:进行词法分析,语法分析和语义分析等
- 汇编:将汇编代码翻译为机器指令的目标文件
20 链接过程简介
问题:工程中的每个C语言源文件被编译后产生目标文件,这些目标文件如何生成最终的可执行程序?
链接器的主要作用是把各个模块之间相互引用的部分处理好,使得各个模块之间能够正确的衔接。
静态链接
- 由编译器在链接时将库的内容直接 加入到可执行程序中
Linux下静态库的创建和使用
- 编译静态库源码:gcc -c lib.c -o lib.o
- 生成静态库文件:ar -q lib.a lib.o
- 使用静态库编译:gcc main.c lib.a -o main.out
编程实验
- 静态链接示例
//slib.c
char* name()
{
return "Static Lib";
}
int add(int a, int b) {
return a + b;
}
#include <stdio.h>
extern char* name();
extern int add(int a, int b);
int main() {
printf("Name: %s\n", name());
printf("Result: %d\n", add(2, 3));
return 0;
}
动态链接
可执行程序在运行时才动态加载库进行链接;库的内容不会进入可执行程序中
Linux下动态库的创建和使用
- 编译动态库源码:gcc -shared dlib.c -o dlib.so
- 使用动态库编译:gcc main.c -ldl -o main.out
- 关键系统调用
- dlopen:打开动态库文件
- dlsym:查找动态库中的函数并返回调用地址
- dlclose:关闭动态库文件
编程实验
- 动态链接示例
//dlib.c
char* name() {
return "Dynamic Lib";
}
int add(int a, int b) {
return a + b;
}
#include <stdio.h>
#include <dlfcn.h>
int main() {
void* pdlib = dlopen("./dlib.so", RTLD_LAZY);
char* (*pname)();
int (*padd)(int, int);
if( pdlib != NULL ) {
pname = dlsym(pdlib, "name");
padd = dlsym(pdlib, "add");
if( (pname != NULL) && (padd != NULL) )
{
printf("Name: %s\n", pname());
printf("Result: %d\n", padd(2, 3));
}
dlclose(pdlib);
} else {
printf("Cannot open lib ...\n");
}
return 0;
}
小结
- 链接是将目标文件最终链接为可执行程序
- 根据链接方式的不同,链接过程可以分为:
- 静态链接:目标文件直接链接进入可执行程序
- 动态链接:在程序启动后才动态加载目标文件
21 宏定义与使用分析
#define
是预处理器处理的单元实体之一;#define
定义的宏可以出现在程序的任意位置;#define
定义之后的代码都可以使用这个宏;#define
定义的宏常量可以直接使用;#define
定义的宏常量本质为字面量。
下面的宏常量定义正确吗?
#define ERROR -1
#define PATH1 "D:\test\test.c"
#define PATH2 D:\test\test.c
#define PATH3 D:\test\
test.c
实例分析
- 宏定义分析
#define ERROR -1
#define PATH1 "D:\test\test.c"
#define PATH2 D:\test\test.c
#define PATH3 D:\test\
test.c
int main()
{
int err = ERROR;
char* p1 = PATH1;
char* p2 = PATH2;
char* p3 = PATH3;
}
#define
表达式的使用类似函数调用#define
表达式可以比函数更强大#define
表达式比函数更容易出错
下面的宏表达式定义正确吗?
#define _SUM_(a,b) (a)+(b)
#define _MIN_(a,b) ((a)<(b)?(a):(b))
#define _DIM_(a) sizeof(a)/sizeof(*a)
实例分析
- 宏表达式分析
// #include <stdio.h>
#define _SUM_(a, b) (a) + (b)
#define _MIN_(a, b) ((a) < (b) ? (a) : (b))
#define _DIM_(a) sizeof(a)/sizeof(*a)
int main()
{
int a = 1;
int b = 2;
int c[4] = {0};
int s1 = _SUM_(a, b);
int s2 = _SUM_(a, b) * _SUM_(a, b);
int m = _MIN_(a++, b);
int d = _DIM_(c);
// printf("s1 = %d\n", s1);
// printf("s2 = %d\n", s2);
// printf("m = %d\n", m);
// printf("d = %d\n", d);
return 0;
}
- 宏表达式被预处理器处理,编译器不知道宏表达式的存在
- 宏表达式用“实参”完全替代形参,不进行任何运算
- 宏表达式没有任何的“调用开销”
- 宏表达式中不能出现递归定义
#define _SUM_(n) ((n>0)?(_SUM(n-1)+n):0)
int s = _SUM_(10);
宏定义的常量表达式是否有作用域限制?
下面的程序合法吗?
void def(){
#define PI 3.1415926
#define AREA(r) r*r*PI
}
double area(double r){
return AREA(r);
}
实例分析:宏的作用域分析
// #include <stdio.h>
void def()
{
#define PI 3.1415926
#define AREA(r) r * r * PI
}
double area(double r)
{
return AREA(r);
}
int main()
{
double r = area(5);
// printf("PI = %f\n", PI);
// printf("d = 5; a = %f\n", r);
return 0;
}
强大的内置宏
宏 | 含义 | 示例 |
---|---|---|
_FILE_ | 被编译的文件名 | file1.c |
_LINE_ | 当前行号 | 25 |
_DATE_ | 编译时的日期 | Jan 31 2012 |
_TIME_ | 编译时的时间 | 17:01:01 |
_STDC_ | 编译器是否遵循标准C规范 | 1 |
实例分析
- 宏使用综合示例
#include <stdio.h>
#include <malloc.h>
#define MALLOC(type, x) (type*)malloc(sizeof(type)*x)
#define FREE(p) (free(p), p=NULL)
#define LOG(s) printf("[%s] {%s:%d} %s \n", __DATE__, __FILE__, __LINE__, s)
#define FOREACH(i, m) for(i=0; i<m; i++)
#define BEGIN {
#define END }
int main()
{
int x = 0;
int* p = MALLOC(int, 5);
LOG("Begin to run main code...");
FOREACH(x, 5)
BEGIN
p[x] = x;
END
FOREACH(x, 5)
BEGIN
printf("%d\n", p[x]);
END
FREE(p);
LOG("End");
return 0;
}
小结
- 预处理器直接对宏进行文本替换
- 宏使用时的参数不会进行求值和运算
- 预处理器不会对宏定义进行语法检查
- 宏定义时出现的语法错误只能被编译器检测
- 宏定义的效率高于函数调用
- 宏的使用会带来一定的副作用
22 条件编译使用分析
- 条件编译的行为类似于C语言中的if...else...
- 条件编译是预编译器指示命令,用于控制是否编译某段代码
#define C 1
int main(){
#if(C==1)
printf("This is first printf...\n");
#else
printf("This is second printf...\n")
#endif
return 0;
}
实例分析
- 条件编译初探
// #include <stdio.h>
#define C 1
int main()
{
const char* s;
#if( C == 1 )
s = "This is first printf...\n";
#else
s = "This is second printf...\n";
#endif
// printf("%s", s);
return 0;
}
- 预编译器根据条件编译指令有选择的删除代码
- 编译器不知道代码分支的存在
- if...else...语句在运行期进行分支判断
- 条件编译指令在预编译期进行分支判断
- 可以通过命令行定义宏
gcc -Dmacro=value file.c或gcc -Dmacro file.c
编程实验
- 通过命令行定义宏
//#include <stdio.h>
int main()
{
const char* s;
#ifdef C
s = "This is first printf...\n";
#else
s = "This is second printf...\n";
#endif
//printf("%s", s);
return 0;
}
-
#include的本质是将已经存在的文件内容嵌入到当前文件中
-
#include的间接包含同样会产生嵌入文件内容的操作
问题:间接包含同一个头文件是否会产生编译错误?
实例分析
- 条件编译的使用
// global.h
#ifndef _GLOBAL_H_
#define _GLOBAL_H_
int global = 10;
#endif
// test.h
#ifndef _TEST_H_
#define _TEST_H_
#include "global.h"const char* NAME = "test.h";char* hello_world(){ return "Hello world!\n";}
#endif
//main.c
// #include <stdio.h>
#include "test.h"
#include "global.h"
int main() {
const char* s = hello_world();
int g = global;
// printf("%s\n", NAME);
// printf("%d\n", g);
return 0;
}
- 条件编译可以解决头文件重复包含的编译错误
#ifdef _HEADER_FILE_H_
#define _HEADER_FILE_H_
//source code
#endif
- 条件编译使得我们可以按照不同的条件编译不同的代码段,因为可以产生不同的目标代码
- #if...#else...#endif被预编译器处理,而if...else...语句被编译器处理,必然被编译进目标代码
- 实际工程中条件编译主要用于以下两种情况:
- 不同的产品线共用同一份代码
- 区分编译产品的调试版和发布版
实例分析
- 产品线区分及调试代码应用
//product.h
#define DEBUG 1
#define HIGH 1
//main.c
#include <stdio.h>
#include "product.h"
#if DEBUG
#define LOG(s) printf("[%s:%d] %s\n", __FILE__, __LINE__, s)
#else
#define LOG(s) NULL
#endif
#if HIGH
void f()
{
printf("This is the high level product!\n");
}
#else
void f()
{
}
#endif
int main() {
LOG("Enter main() ...");
f();
printf("1. Query Information.\n");
printf("2. Record Information.\n");
printf("3. Delete Information.\n");
#if HIGH
printf("4. High Level Query.\n");
printf("5. Mannul Service.\n");
printf("6. Exit.\n");
#else
printf("4. Exit.\n");
#endif
LOG("Exit main() ...");
return 0;
}
小结
- 通过编译器命令行能够定义预处理器使用的宏
- 条件编译可以避免重复包含同一个头文件
- 条件编译是在工程中可以区别不同产品线的代码
- 条件编译可以定义产品的发布版和调试版
23#error和#line使用分析
- #error用于生成一个编译错误消息
- 用法
#error message
message不需要用双引号包围 #error编译指示字用于自定义程序员特有的编译错误消息;类似的,#warning用于生成编译警告。
- #error是一种预编译指示字
- #error可用于提示编译条件是否满足
#idndef __cplusplus
#error This file should be processed with C++ compiler.
#endif
编译过程中的任意错误信息意味着无法生成最终的可执行程序。
实例分析:#error预处理初探
#include <stdio.h>
#ifndef __cplusplus
#error This file should be processed with C++ compiler.
#endif
class CppClass {
private:
int m_value;
public:
CppClass() { }
~CppClass() { }
};
int main() {
return 0;
}
- #error在条件编译中的应用
#include <stdio.h>
void f() {
#if ( PRODUCT == 1 )
printf("This is a low level product!\n");
#elif ( PRODUCT == 2 )
printf("This is a middle level product!\n");
#elif ( PRODUCT == 3 )
printf("This is a high level product!\n");
#endif
}
int main() {
f();
printf("1. Query Information.\n");
printf("2. Record Information.\n");
printf("3. Delete Information.\n");
#if ( PRODUCT == 1 )
printf("4. Exit.\n");
#elif ( PRODUCT == 2 )
printf("4. High Level Query.\n");
printf("5. Exit.\n");
#elif ( PRODUCT == 3 )
printf("4. High Level Query.\n");
printf("5. Mannul Service.\n");
printf("6. Exit.\n");
#endif
return 0;
}
#line
用于强制指定新的行号和编译文件名,并对源程序的代码重新编号,用法:
#line number filename
filename
可省略,#line
编译指示字的本质是重定义__LINE__
和__FILE__
编程实验
- #line的使用
#include <stdio.h>
// The code section is written by A.
// Begin
#line 1 "a.c"
// End
// The code section is written by B.
// Begin
#line 1 "b.c"
// End
// The code section is written by Delphi.
// Begin
#line 1 "delphi_tang.c"
int main()
{
printf("%s : %d\n", __FILE__, __LINE__);
printf("%s : %d\n", __FILE__, __LINE__);
return 0;
}
// End
小结
- #error用于自定义一条编译错误信息
- #warning用于自定义一条编译警告信息
- #error和#warning常应用于条件编译的情形
- #line用于强制指定新的行号和编译文件名
24 #pragma使用分析
- #pragma用于指示编译器完成一些特定的动作
- #pragma所定义的很多指示字是编译器特有的
- #pragma在不同的编译器间是不可移植的
- 预处理器将忽略它不认识的#pragma指令
- 不同的编译器可能以不同的方式解释同一条#pragma指令
一般用法:
#pragma parameter
注:不同的parameter参数语法和意义各不相同
#pragma message
- message参数在大多数的编译器都有相似的实现
- message参数在编译时输出消息到编译输出窗口中
- message用于条件编译中可提示代码的版本信息
#if defined(ANDROID20)
#pragma message("Compile Android SDK 2.0...")
#define VERSION "Android 2.0"
#endif
与#error和#warning不同,#pragma message仅仅代表一条编译消息,不代表程序错误。
实例分析:#pragma message
使用示例
#include <stdio.h>
#if defined(ANDROID20)
#pragma message("Compile Android SDK 2.0...")
#define VERSION "Android 2.0"
#elif defined(ANDROID23)
#pragma message("Compile Android SDK 2.3...")
#define VERSION "Android 2.3"
#elif defined(ANDROID40)
#pragma message("Compile Android SDK 4.0...")
#define VERSION "Android 4.0"
#else
#error Compile Version is not provided!
#endif
int main()
{
printf("%s\n", VERSION);
return 0;
}
#pragma once
- #pragma once用于保证头文件只被编译一次
- #pragma once是编译器相关的,不一定被支持
#ifndef HEADER_FILE_H
#define HEADER_FILE_H
//source code
#endif
#pragma once
上面这两种方式有什么区别?
实例分析:#pragma once
使用分析
//global.h
#pragma once
int g_value = 1;
#include <stdio.h>
#include "global.h"
#include "global.h"
int main()
{
printf("g_value = %d\n", g_value);
return 0;
}
#pragma pack
- 什么是内存对齐?
- 不同类型的数据在内存中按照一定的规则排列
- 而不一定是顺序的一个接一个的排列
struct Test1{
char c1;
short s;
char c2;
int i;
};
struct Test2{
char c1;
char 2;
short s;
int i;
};
Test1和Test2所占的内存空间是否相同?
- 为什么需要内存对齐?
- CPU对内存的读取不是连续的,而是分成块读取的,块的大小只能是1、2、4、8、16...字节
- 当读取操作的数据未对齐,则需要两次总线周期来访问内存,因此性能会大打折扣
- 某些硬件平台只能从规定的相对地址处读取特定类型的数据,否则产生硬件异常
- #pragma pack用于指定内存对齐方式
- #pramga pack能够改变编译器的默认对齐方式
#pragma pack(1)
struct Test1{
char c1;
short s;
char c2;
int i;
};
##pragma pack()
#pragma pack(1)
struct Test2{
char c1;
char c2;
short s;
int i;
};
##pragma pack()
//sizeof(struct Test1) = ?
//sizeof(struct Test1) = ?
- struce占用的内存大小
- 第一个成员起始于0偏移处
- 每个成员按其类型大小和pack参数中较小的一个进行对齐
- 偏移地址必须能被对齐参数整除
- 结构体成员的大小取其内部长度最大的数据成员作为其大小
- 结构体总长度必须为所有对齐参数的整数倍
编译器在默认情况下按照4字节对齐。
编程实验
- 结构体大小计算
#include <stdio.h>
#pragma pack(2)
struct Test1
{
char c1;
short s;
char c2;
int i;
};
#pragma pack()
#pragma pack(4)
struct Test2
{
char c1;
char c2;
short s;
int i;
};
#pragma pack()
int main()
{
printf("sizeof(Test1) = %d\n", sizeof(struct Test1));
printf("sizeof(Test2) = %d\n", sizeof(struct Test2));
return 0;
}
#include <stdio.h>
#pragma pack(8)
struct S1
{
short a;
long b;
};
struct S2
{
char c;
struct S1 d;
double e;
};
#pragma pack()
int main()
{
printf("%d\n", sizeof(struct S1));
printf("%d\n", sizeof(struct S2));
return 0;
}
小结
- #pragma用于指示编译器完成一些特定的动作
- #pragma所定义的很多指示字是编译器特有的
- #pragma message用于自定义编译消息
- #pragma once用于保证头文件只被编译一次
- #pragma pack用于指定内存对齐方式
25 #和##操作符使用分析
- #操作符用于在预处理期将宏参数转换为字符串
- #的转换作用是在预处理期完成的,因此只在宏定义中有效
- 编译器不知道#的转换作用
- 用法
#define STRING(x) #x
printf("%s\n",STRING(Hello World!));
实例分析
- #运算符的基本用法
#include <stdio.h>
#define STRING(x) #x
int main()
{
printf("%s\n", STRING(Hello world!));
printf("%s\n", STRING(100));
printf("%s\n", STRING(while));
printf("%s\n", STRING(return));
return 0;
}
- #运算符的妙用
#include <stdio.h>
#define CALL(f, p) (printf("Call function %s\n", #f), f(p))
int square(int n)
{
return n * n;
}
int func(int x)
{
return x;
}
int main()
{
int result = 0;
result = CALL(square, 4);
printf("result = %d\n", result);
result = CALL(func, 10);
printf("result = %d\n", result);
return 0;
}
##运算符
- ##运算符用于在预处理期粘贴两个标识符
- ##的连接作用是在预处理期完成的,因此只在宏定义中有效
- 编译器不知道##的连接作用
- 用法
#define CONNECT(a,b) a##b
int CONNECT(a,1); //int a1;
a1=2;
实例分析
- ##运算符的基本用法
#include <stdio.h>
#define NAME(n) name##n
int main()
{
int NAME(1);
int NAME(2);
NAME(1) = 1;
NAME(2) = 2;
printf("%d\n", NAME(1));
printf("%d\n", NAME(2));
return 0;
}
- ##运算符的工程应用
#include <stdio.h>
#define STRUCT(type) typedef struct _tag_##type type;\
struct _tag_##type
STRUCT(Student)
{
char* name;
int id;
};
int main()
{
Student s1;
Student s2;
s1.name = "s1";
s1.id = 0;
s2.name = "s2";
s2.id = 1;
printf("s1.name = %s\n", s1.name);
printf("s1.id = %d\n", s1.id);
printf("s2.name = %s\n", s2.name);
printf("s2.id = %d\n", s2.id);
return 0;
}
小结
- #运算符用于在预处理期将宏参数转换为字符串
- ##运算符用于在预处理期粘贴两个标识符
- 编译器不知道#和##运算符的存在
- #和##运算符只在宏定义中有效