项目三 计算机中常见的信息编码

在计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化处理,即用二进制编码来表示。信息编码就是规定如何用二进制编码来表示文字和符号。本学习活动将帮助读者了解计算机如何用二进制编码表示西文、中文和其他符号。

1. 西文字符的编码

字符编码就是规定所有字符的二进制代码的表示形式。目前在计算机中使用最多的西文编码是ASCII码,采用7位二进制数表示-个字符的编码,共有128种编码组合,可表示128个字符,其中数字10个、大小写英文字母52个、其他字符32个和控制字符34个,具体编码内容见表1.2。ASCII码表的全称是“美国信息交换标准代码”。

表1.2 ASCII码表

续表

2. 汉字编码

根据汉字处理过程中的不同要求,有多种编码,主要分为4类,分别是汉字输入编码、汉字国标码、汉字机内码和汉字字形码。汉字编码间的关系如图1.5所示。

图1.5 汉字编码间的关系

(1)国标码。根据GB 2312-1980标准,汉字和图形符号共7445个,其中汉字6763个,按使用频度分为一级汉字3755个,二级汉字3008个,图形符号682个。GB 2312-1980标准将全部国标汉字及符号组成一个94×94的矩阵,每行称为一个“区”,每列称为一个“位”,将区号和位号组合就形成了“区位码”。

国标码采用2个7位二进制数编码。

国标码前2位=区码+20H;国标码后2位=位码+20H。

(2)汉字输入码。指输入汉字的编码方法,分为拼音输入法、字形输入法、音形结合的输入法等。

(3)汉字机内码。汉字机内码是表示汉字的存储位置的编码,机内码是把国标码的两个字节的最高位置1而得到的。

① 机内码=国标码+8080H。

② 机内码的第一字节=区码+A0H。

③ 机内码的第二字节=位码+A0H。

(4)汉字字形码。汉字字形码表示汉字的字形编码,也称字模。点阵字模标准有16×16、24×24、32×32、48×48等,点阵越大,字符的笔画越光滑,但是字模的存储容量也就越大。存放字模的数据文件称为汉字字库,简称字库。

练一练

1. 已知字符A的ASCII码是01000001B,字符D的ASCII码是________。

A. 01000011B

B. 01000100B

C. 01000010B

D. 01000111B

2. 字符比较大小实际是比较它们的ASCII码值,下列正确的是________。

A. “A”比“B”大

B. “H”比“h”小

C. “F”比“D”小

D. “9”比“D”大

3. 一个字符的标准ASCII码用________位二进制数表示。

A. 8

B. 7

C. 6

D. 4

4. 已知“装”字的拼音输入码是“zhuang”,而“大”字的拼音输入码是“da”,则存储它们内码分别需要的字节数是________。

A. 6,2

B. 3,1

C. 2,2

D. 3,2

5. 在下列字符中,其ASCII码值最小的一个是________。

A. 空格字符

B. 0

C. a

D. A

6. 在计算机中,对汉字进行传输、处理和存储使用了汉字的________。

A. 字形码

B. 国标码

C. 输入码

D. 机内码

7. 下列4个4位十进制中,属于正确的汉字区位码的是________。

A. 5601

B. 9596

C. 9678

D. 8799

8. 下列关于ASCII码的叙述中,正确的是________。

A. 一个字符的标准ASCII码值占1字节,其最高进制位总为1

B. 所有大写英文字母的ASCII码值都小于小写英文字母“a”的ASCII码值

C. 所有大写英文字母的ASCII码值都大于小写英文字母“a”的ASCII码值

D. 标准ASCII码表有256个不同的字符编码

9. 下列4个4位十进制中,属于正确的汉字区位码的是________。

A. 5601

B. 9596

C. 9678

D. 8799

10. 区位码输入法的最大优点是________。

A. 只用数码输入,方法简单、容易记忆

B. 易记易用

C. 一字一码,无重码

D. 编码有规律,不易忘记