- 测量系统分析(MSA)实用指南
- 杨朝盛
- 1688字
- 2024-11-04 08:02:41
4.2 测量数据的分类
我们知道,一批零件的某个特性(如零件的重量)是随机变量,对零件特性所测得的量值(零件的重量值)也是随机变量。
随机变量在统计上通常分为离散型和非离散型两大类,其中非离散型又分为连续型和其他类型两类。
离散型随机变量可能的取值是有限个或可列无限多个。如通止规的测量只取1(通)和0(止)两个数值,这就是有限个取值,这一类数据的分布服从的是(0,1)分布(或称二项分布);又如客服热线24小时内收到的电话次数就是可列无限多个取值,这一类数据的分布服从的是泊松分布。实际生产中,我们更常遇到的是(0,1)分布的测量数据。
连续型随机变量的取值则是连续变化且无限多个的。如某批次溶液的pH值、某批次零件的厚度等,这些数据的分布通常按正态分布处理。当然连续型随机变量的数值也有其他的分布类型,如均匀分布、指数分布、三角分布、梯形分布、反正弦分布等。通常在实际生产中,我们碰到的都是正态分布或近似正态分布。
因此,在MSA的实际研究和分析工作中,一般只研究两种类型的随机变量:
离散型中的有限个取值的离散型、非离散型中的连续型。
我们把第一种随机变量的数据类型称为“计数型”数据;把第二种随机变量的数据类型称为“计量型”数据。这两类数据是我们在MSA中要重点关注的。
在实际工作中可能会对计数型数据有一定的争议,比如对手机外壳的外观检查的结果“合格”和“不合格”是否可被看作是计数型的测量数据?再比如自动化颜色识别影像系统对“红”“黄”“蓝”“黑”这四种电缆线的颜色的识别结果是否也能被看作是计数型的测量数据?
“测量数据”只是一种通俗的叫法,实际上,无论是什么类型的测量数据,其专业的术语叫“量值”。我们需要引用“量值”的计量学定义来作说明。
量值,是用数和参照对象一起表示的量的大小。[2]
根据参照对象的类型,量值可表示为以下几种形式:
1)一个数和一个测量单位的乘积,例如,某人的体重为65kg。
2)量纲为一,测量单位1,通常不表示,例如,第一批玻璃样品的平均折射率为1.67。
3)一个数和一个作为参照对象的测量程序,例如,204X型软包装电芯在700g的压力下保持5s时间所得的电芯厚度值为3.77mm。
4)一个数和一个标准物质,例如,今天的大气压强为1.25个标准大气压强。
通常情况下,“手机外壳的外观”和“四种电缆线的颜色”都有标准参照,包括它们的确认方法都有一定的测量程序。那么,量值表达的第三种方式——“一个数和一个作为参照对象的测量程序”,其中这个数的表达逻辑有以下几种形式。
(1)手机外壳外观的检查
1)外观符合参照标准=合格=OK=1。
2)外观不符合参照标准=不合格=NG=0。
(2)四种电缆线的颜色确认
1)红色=Red=1。
2)黄色=Yellow=2。
3)蓝色=Blue=3。
4)黑色=Black=4。
而测量结果在文字的表达上,无论是用中文、英文,还是用阿拉伯数字,只要这些符号具备可识别性和可区分性,就测量系统本身而言并没有本质的区别。而且这种表达在现代计算机软件的逻辑判断中更加常见,如1和0的表达,就算得到的结果为“合格”或“不合格”,软件也会把这种表达转换成计算机语言1和0。对于多种分类“红”“黄”“蓝”“黑”也是一个道理,完全有理由转成1、2、3、4。
因此,“外观的判断”和“颜色的确认”本身产生的有限个取值就属于计数型的研究范畴,这在MSA参考手册中对计数型测量系统的数据就是进行这样的转换处理的。
针对连续型数据的分布问题,我们可能也会有疑问,这种疑问来自于用样本的参数去估计总体的参数是否需要考虑总体的数据分布类型。
设总体X(无论服从什么分布,只要均值和方差都存在)的均值为μ,方差为σ2,X1,X2,…,Xn是来自X的一个样本,,S2分别是样本均值和样本方差,则有:
样本均值的期望:
样本均值的方差:
由于:
即:
样本方差的期望:
由式(4.2.1)和式(4.2.2)可知,无论总体服从什么样的分布,样本均值都是总体均值μ的无偏估计;样本方差都是总体方差σ2的无偏估计。
这也从统计学上说明,在进行MSA研究时,通常主要是针对样本的均值和方差(或标准差或替代的极差)进行的,纵观MSA六大特性的分析,都是建立在这个理论基础上的。
[1] 参考陈晋美所著《国内外企业常用抽样检验与测量技术》一书,由中国计量出版社出版。
[2] 参考VIM1.19或JJF1001-2011 3.20。