LCC编译器的源程序分析(27)基本语句

由前面的例子可以知道,C函数里包含数据定义部分和执行部分,执行部分就是由语句组成。计算机最基本的动作就是具备条件判断,这也是计算机具有这么大魔力的原因。而这些条件判断是通过语句来实现的。基本的语句有下面几种:
1. 控制语句:
if else
for
while
do while
continue
break
switch
goto
return
2. 函数调用语句
max(a,b);
3. 表达式语句
nPos = 10;
4. 空语句
;
最后面一种在LCC里会提示警告的。
在这节和后面跟着的节就是分析这些基本语句是怎么样处理,以及会生成什么样的代码。在compound函数里是这样调用语句分析函数的:
#052 while (kind[t] == IF || kind[t] == ID)
#053 {
#054 statement(loop, swp, lev);
#055 }
#056
因此要去分析函数statement是怎么样分析处理上面出现的语句。

下面就是statement的代码:
#001 //所有基本语句处理函数。
#002 //蔡军生 2007/06/02
#003 void statement(int loop, Swtch swp, int lev)
#004 {
#005 float ref = refinc;
#006
#007 if (Aflag >= 2 && lev == 15)
#008 warning("more than 15 levels of nested statements\n");
#009
第5行是保存引用计数。
第7行是判断递归调用超过15层。

#010 switch (t)
#011 {
#012 case IF:
#013 ifstmt(genlabel(2), loop, swp, lev + 1);
#014 break;
第13行是调函数ifstmt来处理if语句。

#015 case WHILE:
#016 whilestmt(genlabel(3), swp, lev + 1);
#017 break;
第16行是调用函数whilestmt来处理while语句。

#018 case DO:
#019 dostmt(genlabel(3), swp, lev + 1);
#020 expect(';');
#021 break;
#022
第19行是调用函数dostmt来处理do while语句。
第20行是处理do while语句后需要分号。

#023 case FOR:
#024 forstmt(genlabel(4), swp, lev + 1);
#025 break;
第24行是调用函数forstmt来处理for语句。

#026 case BREAK:
#027 walk(NULL, 0, 0);
#028 definept(NULL);
#029
#030 if (swp && swp->lab > loop)
#031 branch(swp->lab + 1);
#032 else if (loop)
#033 branch(loop + 2);
#034 else
#035 error("illegal break statement\n");
#036
#037 t = gettok();
#038 expect(';');
#039 break;
#040
第31,33行是调用函数branch来处理break语句。

#041 case CONTINUE:
#042 walk(NULL, 0, 0);
#043 definept(NULL);
#044
#045 if (loop)
#046 branch(loop + 1);
#047 else
#048 error("illegal continue statement\n");
#049
#050 t = gettok();
#051 expect(';');
#052 break;
#053
第46行是调用函数branch来处理continue语句。

#054 case SWITCH:
#055 swstmt(loop, genlabel(2), lev + 1);
#056 break;
第55行是调用函数swstmt来处理switch语句。

#057 case CASE:
#058 {
#059 int lab = genlabel(1);
#060 if (swp == NULL)
#061 error("illegal case label\n");
#062
#063 definelab(lab);
#064 while (t == CASE)
#065 {
#066 static char stop[] = { IF, ID, 0 };
#067 Tree p;
#068 t = gettok();
#069 p = constexpr(0);
#070 if (generic(p->op) == CNST && isint(p->type))
#071 {
#072 if (swp)
#073 {
#074 needconst++;
#075 p = cast(p, swp->sym->type);
#076 if (p->type->op == UNSIGNED)
#077 p->u.v.i = extend(p->u.v.u, p->type);
#078 needconst—;
#079 caselabel(swp, p->u.v.i, lab);
#080 }
#081 }
#082 else
#083 error("case label must be a constant integer expression\n");
#084
#085 test(':', stop);
#086 }
#087 statement(loop, swp, lev);
#088 }
#089 break;
第59行是调用函数genlabel生成标号。
第64行是处理所有case语句。
第69行是处理case语句后面的常量表达式,调用函数constexpr来处理。
第70行到第81行是作类型转换的工作,如果不能处理常量类型,就会在第83行里提示出错。
第87行是递归调用函数statement处理case语句里语句。

#090 case DEFAULT:
#091 if (swp == NULL)
#092 error("illegal default label\n");
#093 else if (swp->deflab)
#094 error("extra default label\n");
#095 else
#096 {
#097 swp->deflab = findlabel(swp->lab);
#098 definelab(swp->deflab->u.l.label);
#099 }
#100 t = gettok();
#101 expect(':');
#102 statement(loop, swp, lev);
#103 break;
第97行是查找default语句生成的标号。
第98行是定义这个标号。
第102行是调用函数statement递归处理所有后面语句。

#104 case RETURN:
#105 {
#106 Type rty = freturn(cfunc->type);
#107 t = gettok();
#108 definept(NULL);
#109 if (t != ';')
#110 if (rty == voidtype)
#111 {
#112 error("extraneous return value\n");
#113 expr(0);
#114 retcode(NULL);
#115 }
#116 else
#117 retcode(expr(0));
#118 else
#119 {
#120 if (rty != voidtype)
#121 {
#122 warning("missing return value\n");
#123 retcode(cnsttree(inttype, 0L));
#124 }
#125 else
#126 retcode(NULL);
#127 }
#128 branch(cfunc->u.f.label);
#129 }
#130 expect(';');
#131 break;
#132
第106行是取得函数返回的类型。
第109行是判断返回语句是否有返回值,如果有返回值,但函数定义类型没有返回值就提示出错,这是在第110行里处理。如果函数定义有返回值,并且return语句也有返回值就调用第117行里的retcode(expr(0))来处理返回表达式的值。
如果return语句后面没有返回值,但函数需要返回值,这样是出错的,是在第120行里处理。如果真的没有返回值,就是返回空值,在第126行里处理。
第128行跳转到函数调用之后标号执行。

#133 case '{':
#134 compound(loop, swp, lev + 1);
#135 break;
当是大括号开始时,又是复合语句,所以要递归调用函数compound来处理。

#136 case ';':
#137 definept(NULL);
#138 t = gettok();
#139 break;
上面是空行语句的处理。

#140 case GOTO:
#141 walk(NULL, 0, 0);
#142 definept(NULL);
#143 t = gettok();
#144 if (t == ID)
#145 {
#146 Symbol p = lookup(token, stmtlabs);
#147
#148 if (p == NULL)
#149 {
#150 p = install(token, &stmtlabs, 0, FUNC);
#151 p->scope = LABELS;
#152 p->u.l.label = genlabel(1);
#153 p->src = src;
#154 }
#155 use(p, src);
#156 branch(p->u.l.label);
#157 t = gettok();
#158 }
#159 else
#160 error("missing label in goto\n"); expect(';');
#161 break;
#162
上面是goto语句的处理。
第144行先判断goto语句后面是否标号ID,如果是就运行146行的代码来查找已经定义的标号。如果没有找到就生成一个新的标号。最后在第156行里跳到标号的位置运行后面的代码。

#163 case ID:
#164 if (getchr() == ':')
#165 {
#166 stmtlabel();
#167 statement(loop, swp, lev);
#168 break;
#169 }
上面处理标号语句。
第166行调用函数stmtlabel来处理标号语句,最后调用函数statement处理其它跟着的语句。

#170 default:
#171 definept(NULL);
#172 if (kind[t] != ID)
#173 {
#174 error("unrecognized statement\n");
#175 t = gettok();
#176 }
#177 else
#178 {
#179 Tree e = expr0(0);
#180 listnodes(e, 0, 0);
#181 if (nodecount == 0 || nodecount > 200)
#182 walk(NULL, 0, 0);
#183 else if (glevel) walk(NULL, 0, 0);
#184 deallocate(STMT);
#185 }
#186 expect(';');
#187 break;
#188
#189 }
#190
#191 if (kind[t] != IF && kind[t] != ID
#192 && t != '}' && t != EOI)
#193 {
#194 static char stop[] = { IF, ID, '}', 0 };
#195 error("illegal statement termination\n");
#196 skipto(0, stop);
#197 }
#198 refinc = ref;
#199 }
#200
如果一个ID后面没有跟着冒号,那么它是一个表达式语句。
比如像例子里的语句:
nTest3 = nTest1 + nTest2;
这就是ID开始的表达式语句。它会调用前面介绍的表达式处理函数expr0来分析的。
第172行到175行处理不是ID的出错。
第179行是处理右边的表达式。
第180行是调用函数listnodes来遍历整个语句树,主要的目的是生成中间的树表示,删除公共的表达式节点,起到优化代码的作用,为后面生成代码作好准备工作。
第181行是当中间表示的树节点多于200个就进行代码生成。
第191行是出错的符号,并进入第195行到第196行的错误处理。

到这里就把基本语句函数分析完成,接着后面就需要专门地分析具体语句的处理函数。

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License