1.2.2 C语言程序中的字符集
1.C语言中的字符
任何一种计算机系统所使用的字符都是固定、有限的,它们受到硬件设备的限制。要使用某种计算机语言来编写程序,就必须要符合该语言的规定,按照计算机硬件提供的或支持的字符。C语言和其他语言一样,它的编写是由一系列的英文和汉字及一些能表示图形的符号组成的,主要包括以下四类:
(1)英文字母:大小写字母各26个,共52个。
(2)阿拉伯数字:0~9,共10个。
(3)空白符:空格符、制表符、换行符等统称为空白符。空白符只在字符常量和字符串常量中起作用。在其他地方出现时,只起间隔作用,编译程序会忽略它们。因此在程序中使用空白符与否,对程序的编译不产生影响,但在程序中适当的地方使用空白符将增加程序的清晰度和可读性。
(4)标点和特殊字符(见表1-1)。
表1-1 标点和特殊字符表

续表

2.C语言中的词汇
在C语言中使用的词汇分为六类:标识符、关键字、运算符、分隔符、常量、注释符等。
(1)标识符
标识符用来表示函数、类型及变量的名称。标识符可以由大写字母、小写字母、下画线(_)和数字0~9组成,但必须是以大写字母、小写字母或下画线(_)开头。在C语言程序中,大写字母和小写字母不能混用,比如Name和name就代表两个不同的标识符。在表2-1中,我们给出了几个正确和不正确的标识符实例。
表1-2 正确和不正确的标识符实例

标识符的命名规则:
①所有标识符必须由一个字母(a~z或A~Z)或下画线(_)开头;
②标识符的其他部分可以用字母、下画线或数字(0~9)组成;
③大小写字母表示不同意义,即代表不同的标识符,如前面的cout和Cout。
注意
在定义标识符时,虽然语法上允许用下画线开头,但是,最好避免定义以下画线开头的标识符,因为编译器常常定义一些下画线开头的标识符。
(2)关键字
关键字是由C语言规定的具有特定意义的字符串,通常也称为保留字。用户定义的标识符不应与关键字相同。C语言的关键字有以下32个:
auto break case char const continue default do
double else enum extern float for goto if
int long register short signed sizeof static return
struct switch typedef union unsigned void volatile while
(3)运算符
C语言中含有相当丰富的运算符。运算符与变量,函数一起组成表达式,表示各种运算功能。运算符由一个或多个字符组成。
(4)分隔符
在C语言中采用的分隔符有逗号和空格两种。逗号主要用在类型说明和函数参数表中,分隔各个变量。空格多用于语句各单词之间,作间隔符。在关键字、标识符之间必须要有一个以上的空格符作间隔,否则将会出现语法错误,例如:把“int a;”写成“inta;”,C编译器会把inta当成一个标识符处理,其结果必然出错。
(5)常量
C语言中使用的常量可分为数字常量、字符常量、字符串常量、符号常量、转义字符等多种,在第2章中将专门进行介绍。
(6)注释符
C语言的注释符是以“/*”开头并以“*/”结尾的串。在“/*”和“*/”之间的即为注释。程序编译时,不对注释作任何处理。注释可出现在程序中的任何位置。注释用来向用户提示或解释程序的意义。在调试程序中对暂不使用的语句也可用注释符括起来,使翻译跳过不作处理,待调试结束后再去掉注释符。