单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,西南科技大学生命科学与工程学院周海廷制作,*,用Excel进行,描述统计分析,实验三,11/15/2024,1,西南科技大学生命科学与工程学院周海廷制作,用Excel进行实验三10/9/20231西南科技大学生命科,集中趋势的测定与分析,1均值函数,均值函数主要包括算术平均数、调和平均数和几何平均数。,(1)算术平均数,语法:AVERAGE(number1,number2,.),其中:Number1,number2,.为需要计算平均值的1到30个参数,参数可以是数字,或者是涉及数字的名称、数组和引用,如果数组或单元格引用参数中包含文字、逻辑值或空单元格,这些值将被忽略,但包含零值的单元格将计算在内。,11/15/2024,2,西南科技大学生命科学与工程学院周海廷制作,集中趋势的测定与分析 1均值函数10/9/20232西南科,(2)调和平均数,语法:HARMEAN(number1,number2,.),其中:Number1,number2,.为需要计算其平均值的 1 到 30 个参数。,(3)几何平均数,语法:GEOMEAN(number1,number2,.),其中:Number1,number2,.为需要计算其平均值的1到30个参数。,11/15/2024,3,西南科技大学生命科学与工程学院周海廷制作,(2)调和平均数10/9/20233西南科技大学生命科学与工,2中位数(中位次数)函数,语法:MEDIAN(number1,number2,.),如果参数集合中包含有偶数个数字,函数MEDIAN()将返回位于中间的两个数的平均值。,3众数函数,语法:MODE(number1,number2,.),如果数据集合中不含有重复的数据,则MODE()函数返回错误值N/A。,4最大(小)值函数,语法:MAX(number1,number2,.),MIN(number1,number2,.),如果参数不包含数字,函数MAX(MIN)返回0。,11/15/2024,4,西南科技大学生命科学与工程学院周海廷制作,2中位数(中位次数)函数10/9/20234西南科技大学生,例18-1:某商场家用电器销售情况如图1所示。,图18-,1,某商场家用电器销售情况,11/15/2024,5,西南科技大学生命科学与工程学院周海廷制作,例18-1:某商场家用电器销售情况如图1所示。图18-1,(1)计算各种电器的全年平均销售量,如图2所示。,图18-,2,家用电器销售量平均数,11/15/2024,6,西南科技大学生命科学与工程学院周海廷制作,(1)计算各种电器的全年平均销售量,如图2所示。图18-2,(2)计算各种电器销售量的中位数,如图3所示。,图,18-3,家用电器销售量中位数,11/15/2024,7,西南科技大学生命科学与工程学院周海廷制作,(2)计算各种电器销售量的中位数,如图3所示。图18-3,(,3,)计算各种电器销售量的众数,如图,4,所示。,图,18-4,家用电器销售量众数,11/15/2024,8,西南科技大学生命科学与工程学院周海廷制作,(3)计算各种电器销售量的众数,如图4所示。图18-4,离中趋势的测定与分析,1样本标准差,语法:STDEV(number1,number2,.),其中:Number1,number2,.为对应于构成总体样本的 1 到 30 个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。,11/15/2024,9,西南科技大学生命科学与工程学院周海廷制作,离中趋势的测定与分析 1样本标准差10/9/20239西南,2总体标准差,语法:STDEVP(number1,number2,.),其中:Number1,number2,.为对应于样本总体的1到30个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。,当样本数较多(,n,30)时,函数STDEV()和STDEVP()计算结果差不多相等。,11/15/2024,10,西南科技大学生命科学与工程学院周海廷制作,2总体标准差10/9/202310西南科技大学生命科学与工,例18-2:使用例18-1资料,计算各家电销售量的总体标准差,如图18-5所示。,样本标准差的计算方法与总体标准差相同。,图18-,5,计算总体标准差,11/15/2024,11,西南科技大学生命科学与工程学院周海廷制作,例18-2:使用例18-1资料,计算各家电销售量的总体标准差,3 四分位数与四分位距,语法:QUARTILE(array,quart),array:需要求四分位数值的数组或数字型单元格区域。,quart:决定返回哪一个四分位值。,quart,值,函数,QUARTILE,返回值,0,最小数值,1,第一个四分位数(第,25,个百分排位),2,中分位数(第,50,个百分排位),3,第三个四分位数(第,75,个百分排位),4,最大数值,表,1 Quart,值与,QUARTILE,返回值的对应关系,11/15/2024,12,西南科技大学生命科学与工程学院周海廷制作,3 四分位数与四分位距quart值 函数QUARTILE返,四分位距是总体中第3四分位数与第1四分位数之差。,例18-3:使用例1资料,计算四分位数和四分位距,如图18-6所示。,图18-,6,计算四分位数和四分位距,11/15/2024,13,西南科技大学生命科学与工程学院周海廷制作,四分位距是总体中第3四分位数与第1四分位数之差。图18-6,分布形态的测定与分析,分析总体次数的分布形态有助于识别整个总体的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为,偏度或偏斜度,,后者的测定参数称为,峰度,。,11/15/2024,14,西南科技大学生命科学与工程学院周海廷制作,分布形态的测定与分析 分析总体次数的分布形态有助于识别整个总,1偏度函数,语法:SKEW(number1,number2,.),其中:Number1,number2.为需要计算偏斜度的1到30个参数。,2峰度函数,语法:KURT(number1,number2,.),其中:Number1,number2,.为需要计算峰值的1到30个参数。,11/15/2024,15,西南科技大学生命科学与工程学院周海廷制作,1偏度函数10/9/202315西南科技大学生命科学与工程,例18-4:使用例18-1资料,计算各家电销售量的偏度和峰度,如图7所示。,图18-,7,销售量的偏度和峰度,11/15/2024,16,西南科技大学生命科学与工程学院周海廷制作,例18-4:使用例18-1资料,计算各家电销售量的偏度和峰度,偏度为0时为正态分布,正值时为正偏态(峰向左倾),负值时为负偏态(峰向右倾),,峰度为0时为正态峰,正值时为尖峰,负值时为平峰。,11/15/2024,17,西南科技大学生命科学与工程学院周海廷制作,偏度为0时为正态分布,正值时为正偏态(峰向左倾),负值时为负,参数估计,11/15/2024,18,西南科技大学生命科学与工程学院周海廷制作,参数估计 10/9/202318西南科技大学生命科学与工程学,总体均值区间估计的基本内容,1总体方差,2,已知,求,的置信区间,当总体方差,2,已知时,在置信度为的情况下,可以构造总体均值,的置信区间为:,利用,Excel,计算总体均值置信区间,11/15/2024,19,西南科技大学生命科学与工程学院周海廷制作,总体均值区间估计的基本内容利用Excel计算总体均值置信区间,2总体方差,2,未知,求,的置信区间,当总体服从正态分布,总体方差,2,未知时,要用样本方差代替,2,来建立置信区间。这时,新的统计量不服从标准正态分布,而是服从于自由度为的t分布,在置信度为的情况下,可以构造均值,的置信区间为:,11/15/2024,20,西南科技大学生命科学与工程学院周海廷制作,2总体方差2未知,求的置信区间10/9/202320西,例20-,1,:从某班男生中随机抽取,10,名学生,测得其身高(,cm,)分别为,170,、,175,、,172,、,168,、,165,、,178,、,180,、,176,、,177,、,164,,以,95%,的置信度估计本班男生的平均身高。,(,1,)建立工作表,将以上数据录入。,(,2,)分别计算样本个数、样本的平均数、样本标准差、样本标准误差、对应于置信度,95%,的概率度、抽样极限误差、置信区间的上、下限。计算结果如图20-,1,所示。,。,11/15/2024,21,西南科技大学生命科学与工程学院周海廷制作,例20-1:从某班男生中随机抽取10名学生,测得其身高(cm,图20-,1,总体均值置信区间的计算,11/15/2024,22,西南科技大学生命科学与工程学院周海廷制作,图20-1 总体均值置信区间的计算 10/9/202322,必要抽样容量的计算公式,在其他条件相同的情况下,抽样单位数越多,抽样误差越小,抽样单位数越少,抽样误差越大。,确定抽样数目,应考虑以下几个问题:,(,1,)被调查总体的标志变动程度,(,2,)对推断精确度的要求,即被允许的抽样误差范围。,(,3,)对推断把握程度的要求。,(,4,)抽取调查单位的方式。,利用,Excel,计算必要样本单位数,11/15/2024,23,西南科技大学生命科学与工程学院周海廷制作,必要抽样容量的计算公式利用Excel计算必要样本单位数 10,用样本均值估计总体均值时所允许的最大绝对误差是抽样极限误差,它表示抽样误差的可能范围,又称允许误差。,如果用表示抽样极限误差,则,那么样本容量,n,的大小则为,11/15/2024,24,西南科技大学生命科学与工程学院周海廷制作,用样本均值估计总体均值时所允许的最大绝对误差是抽样极限误差,,例20-2:某县进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?,(1)建立“样本容量计算”工作表。,(2)分别计算与置信度95.45%对应的z值、样本容量并对其取整。计算结果如图20-2所示。,11/15/2024,25,西南科技大学生命科学与工程学院周海廷制作,例20-2:某县进行农村经济情况调查,已知农户平均年收入标准,图20-,2,必要样本容量计算,11/15/2024,26,西南科技大学生命科学与工程学院周海廷制作,图20-2 必要样本容量计算 10/9/202326西南科,总体标准差及方差的估计,方差估计的内容和工作表函数,1,大样本情况下总体标准差的区间估计,只要样本足够大,样本标准差,s,就服从正态分布,其均值近似等于总体标准差,,其标准差 ,,所以在置信度为时,,的置信区间为:,11/15/2024,27,西南科技大学生命科学与工程学院周海廷制作,总体标准差及方差的估计 方差估计的内容和工作表函数10/9/,2小样本情况下正态总体方差的置信区间,设为来自均值为、方差为,2,的正态总体,、,2,均为未知,则,2,的点估计量为,且,,那么置信度为时总体方差的置信区间为,11/15/2024,28,西南科技大学生命科学与工程学院周海廷制作,2小样本情况下正态总体方差的置信区间10/9/202328,Excel提供了两个用于方差估计的工作表函数。,(1)卡方分布函数,语法:CHIDIST(x,degrees_freedom),其中:x为用来计算分布的数值,degrees_freedom为自由度。,(2)卡方分布反函数,语法:CHIINV(probability,degrees_freedom),其中:probability为卡方分布的单尾概率,degrees_freedom为自由度。,11/15/2024,29,西南科技大学生命科学与工程学院周海廷制作,Excel提供了两个用于方差估计的工作表函数。1