5.2 选择数据类型的方法

MySQL提供了大量的数据类型,为了优化存储,提高数据库性能,在任何情况下均应使用最精确的类型。即在所有可以表示该列值的类型中,选择占用存储空间最少的类型。

1.整数和浮点数

如果不需要表示小数部分,则使用整数来保存数据;如果需要表示小数部分,则使用浮点数类型。对于浮点数据列,存入的数值会根据该列定义的小数位进行四舍五入。例如,如果列值的范围为1~99999,若使用整数,则MEDIUMINT UNSIGNED是最好的类型;若需要存储小数,则使用FLOAT类型。

浮点类型包括FLOAT和DOUBLE类型。DOUBLE类型的精度比FLOAT类型高,因此,如要求存储精度较高时,应选择DOUBLE类型。

2.浮点数和定点数

浮点数FLOAT、DOUBLE相对于定点数DECIMAL的优势是:在长度一定的情况下,浮点数能表示更大的数据范围。但是由于浮点数容易产生误差,因此对精确度要求比较高时,建议使用DECIMAL来存储。DECIMAL在MySQL中是以字符串存储的,用于定义货币等对精确度要求较高的数据。在数据迁移中,float(M,D)是非标准的SQL定义,会导致数据库迁移出现问题,最好不要这样使用。另外,两个浮点数进行减法和比较运算时也容易出问题,因此在进行计算的时候,一定要小心。如果进行数值比较,最好使用DECIMAL类型。

3.日期与时间类型

对于不同种类的日期和时间有很多的数据类型,比如YEAR和TIME。如果只需要记录年份,则使用YEAR类型即可;如果只记录时间,只需使用TIME类型;如果需要同时记录日期和时间,则可以使用TIMESTAMP或者DATETIME类型。由于TIMESTAMP列的取值范围小于DATETIME的取值范围,因此存储范围较大的日期时最好使用DATETIME。

TIMESTAMP也有一个DATETIME不具备的属性。默认情况下,当插入一条记录但并没有指定TIMESTAMP的列值时,MySQL会把TIMESTAMP列设为当前的时间。因此当需要插入记录并同时插入当前时间时,使用TIMESTAMP是很方便的。

4.CHAR与VARCHAR

1)CHAR和VARCHAR的区别

CHAR存储固定长度字符,VARCHAR存储可变长度字符。CHAR会自动删除插入数据的尾部空格,VARCHAR不会删除尾部空格。

CHAR采用固定长度,所以它的处理速度比VARCHAR的速度要快,但是它的缺点就是浪费存储空间。所以对存储长度不大,但在检索速度上有要求的数据可以使用CHAR类型,反之可以使用VARCHAR类型来实现。

2)选择CHAR和VARCHAR对存储引擎的影响

对于MyISAM存储引擎,最好使用固定长度的数据列代替可变长度的数据列。这样可以使整个表静态化,从而使数据检索更快,用空间换时间。

对于InnoDB存储引擎,使用可变长度的数据列。因为InnoDB数据表的存储格式不分固定长度和可变长度,因此使用CHAR不一定比使用VARCHAR更好,但由于VARCHAR是按照实际的长度存储,比较节省空间,所以对磁盘I/O和数据存储总量来说比较好。

5.ENUM和SET

ENUM只能取单值,它的数据列表是一个枚举集合。它的合法取值列表最多允许有65535个成员。因此,在需要从多个值中选取一个时,可以使用ENUM。例如,性别字段适合定义为ENUM类型,每次只能从“男”或“女”中取一个值。

SET可取多值。它的合法取值列表最多允许有64个成员。空字符串也是一个合法的SET值。在需要取多个值的时候,适合使用SET类型。例如,要存储一个人的兴趣爱好,最好使用SET类型。

ENUM和SET的值是以字符串的形式出现的,但在内部,MySQL以数值的形式存储它们。

6.BLOB和TEXT

BLOB是二进制字符串,TEXT是非二进制字符串,两者均可存放大容量的信息。BLOB主要存储图片、音频信息等,而TEXT只能存储纯文本文件。应分清两者的用途。