1.2 数据传输代码

在各种计算机和终端设备构成的数据通信系统中,内部信息是用二进制数表示的,而数据终端设备或计算机发出的数据信息则是由各种字母、数字或符号的组合来表示的。因而,为了实现正确的数据通信,需将二进制数和字母、数字或符号的对应关系做统一的规定,这种规定称为传输代码或编码。目前常用的传输代码有:ASCII、国际电报 2 号码(ITA2码)、EBCDIC、信息交换用汉字代码等。

1.ASCII

ASCII(IA5)称为美国信息交换用标准代码,1963 年由美国国家标准学会(ANSI)最早提出,后被ISO和原CCITT采纳并发展成为国际通用的信息交换用标准代码。

ASCII也称为国际5号码(IA5),是一种7单位代码,即以7位二进制码来表示一个字母、数字或符号。

7 位二进制共有27=128 种组合,可以表示128 个不同的数字、字母和符号,如表1-1 所示。其分配是:大、小写英文字母各26个,数字10个,图形符号33个,控制符号32个,还有一个DEL(删除)符号。表1-1中二进制为b7b6b5b4b3b2b1,其中b7为高位,b1为低位。

表1-1中第0列和第1列是32个控制字符集,称为C集(控制集)。C集不能被显示或打印,只产生控制功能,如回车、换行、移位等。C 集的 32 个控制字符从功能上可分为以下5大类。

表1-1 ASCII(IA5)编码表

(1)FE0~FE5为页面格式控制字符,用于控制所要打印或显示字符的位置。

(2)TC1~TC10 为传输控制字符,用于各种数据终端设备或系统之间的基本数据传输控制。

(3)DC1~DC4 为外围设备控制字符,用于控制同数据处理系统或数据通信系统相联系的设备,而不能用于控制通信传输。

(4)ISl~IS4为分隔字符,用于标识信息的构成。

(5)其他特殊功能控制字符,用于特殊功能控制。

表中的第 2~7 列除 SP(Space,空格)和 DEL(Delete,删除)两个字符外,其余均为可显示或打印用的图形字符,简称 G 集(图形字符集),包括大、小写英文字母各 26个,数字10个,图形符号32个,共94个。例如,“A”的代码为“1000001”。

代码在顺序传输过程中一般以 b1为第一位,b7为最后一位。为了提高可靠性,常在 b7之后附加一位b8用于奇偶校验。

ASCII 是当前在数据通信中使用最普遍的一种代码,我国在 1980 年颁布的国家标准GBl988-80“信息处理交换用的七位编码字符集”也是根据ASCII制定的,它与ASCII的差别只在于2/4位置上,将国际通用货币符号“¤”改为“¥”,在国内通用。

2.国际电报2号码

国际电报 2 号码(ITA2)是一种 5 单位代码,又称波多码,是起止式电传电报通信中的标准代码。目前在采用普通电传机作为终端的低速数据通信系统中,仍使用这种代码。

3.EBCDIC

EBCDIC 是扩充的二——十进制码的简称,是一种 8 单位代码。由于第 8 位用于扩充功能,不能用于奇偶校验,故这种码一般不用于远距离传输,而用于计算机的内部码,尤其为IBM机采用。

4.信息交换用汉字代码

信息交换用汉字代码是汉字信息交换用的标准代码,它适用于一般的汉字处理、汉字通信等系统之间的信息交换。其对于任何一个图形字符都采用两个字节表示,每个字节均采用国家标准GBl988-80“信息处理交换用的七位编码字符集”的7单位代码。