Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,基本统计概念,1,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,6,普及,培训,第二部分 基本统计概念,(,ZTE-WB102-V1.0),2002年三月,6普及培训第二部分 基本统计概念(ZTE-WB10,统计概念,解释以下基本统计概念。,1.,波动(偏差),2.,连续数据和离散数据,3.,平均值、方差、标准差,4.,正态曲线,5.用,Z,值将数据标准化,6.,中心极限定理,7.,过程能力,-,使用,Z,值作为衡量工序能力的指标,-,通过改进关键值,Xs,来改进,Y,8.,稳定性因子,统计概念解释以下基本统计概念。,波动,所有的人不会都是同样的高度;,所有的葡萄不可能同一天采摘,问题:,你期望存在波动吗?什么类型的波动?,波动所有的人不会都是同样的高度;,观测值变化,当重复进行测量的时候,通常会得到不同的答案,,这就是波动!,系统波动,预期的和可预测的测量结果之间的差异。,举例,:,夏季和冬季的空调的销售量不同,。,随机波动,不可预测的测量结果之间的差异。,举例,:具有同一种设计的两台冰箱,由同一个技术人员、在同样的气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消耗进行测试.可能得到两个不同的结果。,1.,2.,观测值变化当重复进行测量的时候,通常会得到不同的答案,这就,观测值变化(,续,),我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。,如果所有地区的手机销售量是一样的,那么我们就会怀疑是数据库出了问题。,.,如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测量是否正确。,这种变化使我们的工作更具挑战性!,一般来说,我们不能相信来自一个数据点的结果。通常我们收集,多个,数据点,而且非常注意如何选取这些样本,以减少偏差。,波动的产生是很自然的,意料之中的,是统计学的基础,观测值变化(续)我们预期观测值会有差异。如果没有差异,我们就,统计学的作用,统计学用以下方法处理误差:,(,置信区间和假设检验,)。,统计描述,用图表和几个总结性数字(均值、方差、标准差)描述一组数据。,统计推理,确定结果之间的差异何时可能是由于随机误差引起的,何时不能归因于随机误差。,收集并分析数据,以估算过程变化的,影响。,试验设计,统计学的作用统计学用以下方法处理误差:统计描述用图表和几个总,数据的两种类型,连续,(可,变,),数据,使用一种度量单位,比如英寸或小时。,离散,(,属性,),数据,是类别信息,比如“通过”或“未通过”。,连续数据,离散数据,问题,解决办法,举例,:,部件号,离散,连续,1,通过,2.031,2,通过,2.034,3,未通过,2.076,4,通过,2.022,5,未通过,2.001,数据的两种类型 连续(可变)数据 使用一种度量单位,连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的特性。测量标准可以有意义地不断分割,使精确度提高。,你能举出我们用来获得连续数据的三个器具例子吗?,相对于仅仅知道部件是否合格而言,,连续数据可以提供更多的信息。,连续数据,(,也称为可变数据,),连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过,离散数据不能更进一步精确地细分。,离散数据是某件事发生或未发生的次数,以发生的,频数,来表示。,离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。,离散数据,(,也包括属性或类别数据,),地区,亮和不亮,离散数据不能更进一步精确地细分。离散数据是某件事发生,离散数据,一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获得更多的信息。,如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出判断。,.,连续数据与离散数据进行比较的解释:,离散数据举例:,有凹痕的部件数量,通过,/,未通过,申诉决议,产出,生产线不合格品数量,及时交货,离散数据需要更多的数据点才能进行有效的分析,离散数据连续数据与离散数据进行比较的解释:离散数据举例:离,请在下面的例子旁,写出它是“连续”还是“离散”,1 销售订单准确度,2,数据输入准确度,3,销售地区,4 使用“合格/不合格”测量仪器得到的孔径,5 孔径,6 应答中心对话时间,7 制冷氟利昂的重量(克),8 每百万部件中有缺陷部件的数量,9 装配线缺陷,(,ALD),应用你所学到的东西,请在下面的例子旁,写出它是“连续”还是“离散”1 销售订单准,总体,全组数据,,全部,对象。,-,一个总体中的元素数量用,N,来表示,样本,总体的一个子集,-,样本的元素数量用,n,来表示,平均值,总体或样本的平均值,-,总体的平均值用,来表示,样本的平均值用,X,或,来表示,方差,数据,与其平均值之间差值的平方的平均值,。(,它代表该组数据的分散程度,),-,总体的方差用,表示,-,样本的方差用,s,2,或,表示,均方差,是方差的,(,正,),平方根。,(,它也代表该组数据的分散程度)。,-,总体的标准差用,来表示,-,样本的标准差用,s,或,来表示,统计学术语,总体 全组数据,全部对象。统计学术语,统计学术语和定义,总体,全部,对象,.,举例,1998,年5月在深圳生产的所有的21英寸彩电,样本,代表,总体的一个子集数据。,举例,-1998年5月在,深圳,生产的一百二十台21英寸彩电,举例:,这个矩阵代表25个,X,的总体。画上圆圈的那些是由总体中的六个,X,组成的样本。,统计学术语和定义总体 全部对象.这个矩阵代表25个X的总,平均值,-,总体或样本的平均值。,用,x,或,来表示样本,用,来表示总体。,举例:给定一个样本:,1,3,5,4,7,,平均值就是:,统计学术语和定义,x,=,x,n,在这里,X,1,是样本的第一个点,,X,n,是样本的最后一个点。,.,i,1,n,平均值的公式,x =,(1+3+5+4+7),=,20,=4.0,5 5,样本的平均值等于4。,平均值 -总体或样本的平均值。统计学术语和定义x =,标准差,衡量,数据分散程度的一个指标。一般用,表示总体,用,s,或,表示样本。,=,(,X,i,-,),2,i,=,1,N,N,总体,的公式,方差,-,与平均值之差的平方的平均值。一般用,s,2,或,2,来表示。,=,S,=,(,X,i,-,X,),2,i,=,1,n,n,-,1,样本,的公式,统计学术语和定义,标准差 衡量数据分散程度的一个指标。一般用表示总体,用,举例,课堂举例:,计算样本,2,6,4,的方差和标准差,首先计算均值,:(2+6+4)/3=12/3=4,计算平均值、方差和标准差,x,=,x,n,i,i=1,n,s,2,=,n,(,X,i,-,X,),2,i,=,1,n,-,1,s=,(,X,i,-,X,),2,i,=,1,n,n,-,1,平均值,方差,标准差,方差,(,s,2,)=8/(3-1)=4,标准差,(,s)=sqrt(4)=2,i,x,i,(x,i,-4),(x,i,-4),2,1 2-24,2 6 24,3,4,0,0,和,12 08,举例课堂举例:计算样本2,6,4 的方差和标准差,课堂练习,课堂举例:,计算样本,1,3,5,4,7,的方差和标准差,(,使用下面的表作为向导。,),首先计算平均值,X:,计算平均值、方差和标准差,x,=,x,n,i,1,n,s,2,=,n,(,X,i,-,X,),2,i,=,1,n,-,1,s=,(,X,i,-,X,),2,i,=,1,n,n,-,1,均值,方差,标准差,方差,(,s,2,)=,标准差,(,s,或,)=,课堂练习课堂举例:计算样本1,3,5,4,7 的方差,统计学术语和定义,缺陷;未满足与预期或规定用途有关的要求。(引起顾客不满意),单位缺陷数(,DPU):,PPM(Parts per Million),不合格品,PPM=,用,PPM,来表示缺陷率:,PPM=DPU,1000000,不合格品数量,检验的产品数量,1000000,x,x,统计学术语和定义缺陷;未满足与预期或规定用途有关的要求。(引,统计术语和定义,缺陷机会:做一项工作(或生产一件产品等)所有产生缺陷的可能性。,如:一个过程的步骤数;,一个产品的零件数。,每百万机会的缺陷数(,DPMO),DPMO=,单位缺陷数,每单位的缺陷机会,1000000,统计术语和定义缺陷机会:做一项工作(或生产一件产品等)所有产,我能计算缺陷率吗?,我的过程产生了多少缺陷,?,生产40000只灯泡,其中50只有缺陷.,DPMO,是多少?,x,1,000,000,=,50,40,000,1250,DPMO,我能计算缺陷率吗?我的过程产生了多少缺陷?生产40000,如何计算,DPMO?,我的过程产生了多少缺陷,?,1999,年,A19,灯泡的客户退货率是1.0%。,DPMO,是多少?,x,1,000,000,=,如何把%转化成,DPMO?,把%转化成 小数,DPMO,小数点向前移动2位,0.01,x,1,000,000,=,10,000,DPMO,如何计算DPMO?我的过程产生了多少缺陷?1999年A19灯,作业,-,商务,一名客户服务代表3天收到这些电话:,小时:第 1 天:第 2 天,:,第 3 天,:,电话数回答数,电话数回答数,电话数回答数,1202025232222,2151220182524,3252315152017,4232022202424,5262426232019,6272528282424,7232324212522,8212025232116,未回答电话的,DPMO,是多少:,a),第1天,b),第2天,c),第3天,d)3,天,作业-商务一名客户服务代表3天收到这些电话:小时:第,绘制直方图,75,70,65,60,15,10,5,0,高 度,频 数,59 61 63 63 64 59,62 66 65 65 64 60,65 62 64 68 70 65,63 64 68 66 65 66,67 64 66 58 65 65,71 63 69 63 66 70,64 67 64 66 62 64,64 64 61 64 63 65,64 68 66 67 69 71,68 66 65 63 64 64,68 67 65 64 65 64,70 65 68 65 66 69,66 66 65 63 68 66,62 67 65 66 67 66,60 67 63 60 64 73,90,位女士的身高,绘制直方图75706560151050高 度 频 数 5,用直方图形成一个连续分布,测定单位,条形的中心点,平滑的曲线连接每个条形的中心点,许多,(,但非全部,),数据符合“正态”分布,或钟形曲线。,用直方图形成一个连续分布测定单位条形的中心点平滑的曲线连接,正态分布的标准差,(,),拐点,1,USL,p(d),上限,(,USL),下限,(,LSL),均值,(,),标准差,(,),3,拐点与平均值之间的距离是一个,标准差。如果三倍的标准差都落在目标值和规范的上下限内,我们就称这个过程具有“三个西格玛能力”,平均值,LSL,曲线从较陡的状态变得越来越平坦,正态分布的标准差()拐点1USLp(d)上限(US,面积和概率,合格部件,控制限,曲线下的面积是1.0。我们可以计算规范上下限之外的面积,也就是出现缺陷的概率,。,一个缺陷部件的概率,正态曲线与横轴之间的面积等于1,所以曲线下面的面积与缺陷发生的概率相关。,正态分布可以用来将,和,转换为,出现缺陷的百分比。,面积和概率合格部件控制限曲线下的面积是1.0。我们可以