,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章,计量资料的统计描述,1,第二章计量资料的统计描述1,主要内容,第一节 频数分布,第二节 集中趋势,第三节 离散趋势,第四节 正态分布,第五节 医学正常值范围的估计,2,主要内容第一节 频数分布2,第一节 频数分布,什么是频数,频数分布的特点,频数分布的类型,频数分布的用途,3,第一节 频数分布什么是频数3,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。,频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。,4,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个,频数分布的两个特征:,集中趋势与离散趋势,频数分布的类型:,对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态),频数表的主要用途:,1.揭示分布类型,2.发现特大值和特小值,3.计算集中趋势指标与离散趋势指标,5,频数分布的两个特征:5,6,6,一、频数表,(,Frequency Table),频数表:同时列出观察指标的可能取值区间及其在各区间内出现的频数。,1.,确定组数,k,:通常选择在,8,15,之间,2.,确定组距:参考组距为,R,/,k,R,为全距,(R=,最大值,-,最小值,),3.,确定组段:,应符合专业习惯,4.对各组段计数:划记或由软件完成,7,一、频数表(Frequency Table)7,1998年100名18岁健康女大学生身高的频数分布,身高组段,(1),划记,频数,f,(2),154,11,2,156,1111,4,158,11111,11111,1,11,160,11111,11111,111,13,162,11111,11111,11111,11111,11,22,164,11111,11111,11111,1111,19,166,11111,11111,11111,15,168,11111,1111,9,170,1111,4,172174,1,1,合 计,100,8,1998年100名18岁健康女大学生身高的频数分布身高组段划,SPSS,建立数据库,1.进入,SPSS,操作窗口,2.进入数据编辑窗口,Variable View,变量名 类型,整数位 小数位,输入数据:,Data View,9,SPSS建立数据库1.进入SPSS操作窗口9,10,10,第二节 集中趋势,集中位置的描述,即大多数数值落在什么位置。,描述集中趋势的几种指标:,1.算术均数(均数),2.几何均数,3.中位数,11,第二节 集中趋势 集中位置的描述,即大多数数值落在什么位置,1.算术均数(均数,),意义:一组,性质相同,的观察值在数量上的平均水平。,表示,(总体),X(,样本),计算:直接法、间接法、计算机,特征:(,X,-,X)=0,估计误差之和为0。,应用:正态分布或近似正态分布,注意:合理分组,才能求均数,否则没有意义。,12,1.算术均数(均数)意义:一组性质相同的观察值在数量上的平均,SPSS,计算算术均数,Analyze,-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK,13,SPSS计算算术均数Analyze-Descrip,2.几何均数,意义:,N,个数值的乘积开,N,次方即为这,N,个数的几何均数。,表示:,G,计算:,应用:,原始数据分布不对称,经对数转换后呈对称分布的资料,。例如抗体滴度。,14,2.几何均数意义:N个数值的乘积开N次方即为这N 个数的几何,SPSS,计算几何均数,Analyze,-Reports-Case Summaries-Statistics-Geometric Mean-Continue-OK,15,SPSS计算几何均数15,3.中位数、百份位数,意义:,将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。,表示:,M、P,X,计算:,百分位数:,将,N,个观察值从小到大依次排列,再分成100等份,对应于,X%,位的数值即为第,X,百分位数。中位数是百分位的特殊形式。,应用:偏态资料,开口资料,16,3.中位数、百份位数意义:将一组观察值从小到大排序后,居于中,SPSS,计算中位数、百分位数,Analyze,-Descriptive Statistics-Frequencies-Statistics-Median-Continue-OK,17,SPSS计算中位数、百分位数17,Statistics,f,238,0,1.228,1.100,.300,.300,.700,.700,.700,.700,1.100,1.100,1.100,1.500,1.500,1.500,2.300,2.300,3.900,Valid,Missing,N,Mean,Median,1,5,10,20,25,30,40,50,60,70,75,80,90,95,99,Percentiles,18,Statisticsf23801.2281.100.300.,小 结,1.运用频数表、直方图和统计指标这些技巧,能够有效地组织、整理和表达,计量,资料的信息。,2,.,平均数是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。其中,均数的应用最为广泛,几何均数则多用于血清学和微生物学中,中位数主要用于偏度较大的数据分布资料。,3.,百分位数可用来描述资料的观察值序列在某百分位置的水平,中位数是其中的一个特例。,19,第三节 离散趋势,常用指标:,全距:,即观察值中最大值和最小值之差。,四分位数间距:,方差:,是将离均差平方和再取平均。,标准差:,将方差取平方根。,变异系数,描述一组数据参差不齐的程度,。,20,第三节 离散趋势常用指标:描述一组数据参差不齐的程度。,标准差,相关概念:离均差、离均差平方和、方差(,2,S,2,),标准差的符号:,S,意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数的代表性越好),计算,:,应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围,21,标准差21,SPSS,计算标准差,Analyze,-Descriptive Statistics-Frequencies-Statistics-Dispersion-Std.deviati-Continue-OK,22,SPSS计算标准差22,变异系数,意义:,标准差与均数之比用百分数表示。,符号:,CV,计算:,CV=(S/X),100%,无单位,应用:,单位不同的多组数据比较,均数相差悬殊的多组资料,23,变异系数意义:标准差与均数之比用百分数表示。23,第四节 正态分布,1、图形,2、特征,3、面积,24,第四节 正态分布1、图形24,25,25,SPSS,绘制正态曲线,Analyze,-Descriptive Statistics-Frequencies-Charts-Histograms-Normal Curve-Continue-OK,26,SPSS绘制正态曲线Analyze-Descripti,27,27,正态分布的特征,均数处最高;,均数为中心对称;,2个参数,N(,u,,,),标准正态分布:,N(,0,,,1);,标准正态变换,(,变换公式,);,曲线下的面积有一定规律。,28,正态分布的特征均数处最高;28,正态曲线下的面积分布规律,横轴上、曲线下的面积为1;,曲线下,横轴上对称于0的面积相等。,29,正态曲线下的面积分布规律横轴上、曲线下的面积为1;29,30,30,31,31,第五节 医学正常值范围的估计,定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。,单双侧:,根据指标的实际用途,有的指标有上下界值(双侧)。某些指标只需确定上限(单);某些指标只需确定下限(单)。,估计的方法:1、正态分布法2、百分位数法,32,第五节 医学正常值范围的估计 定义:又称参考值范围,是,应用条件:正态分布或近似正态分布资料,计算(双侧):95%正常值(医学参考值)范围公式:(,x,1.96 S,,x,1.96 S),即(,x1.96 S),1、正态分布法,33,应用条件:正态分布或近似正态分布资料 1、正态分布法3,SPSS,求正常值范围(正态分布法),Analyze,-Descriptive Statistics-Explore-Statistics-Descriptives-Continue-OK,34,SPSS求正常值范围(正态分布法)Analyze-De,2、百分位数法,应用条件:偏态分布资料,计算公式:双侧界值:,P,2.5,P,97.5,单侧 上界:,P,95,单侧 下界:,P,5,35,2、百分位数法应用条件:偏态分布资料 35,SPSS,求正常值范围(百份位数法),Analyze,-Descriptive Statistics-Frequencies-Statistics-Percentile Values-Continue-,OK,36,SPSS求正常值范围(百份位数法)Analyze-De,1.描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。,2.衡量变异程度大小的指标有多种:极差、四分位数间距、方差、标准差和变异系数。其中应用最多的是标准差和变异系数。,3.,标准差与均数结合能够完整地描述一个正态分布,。对任何参数的正态分布,都可以通过一个简单的变量变换化成标准正态分布。,利用正态分布可以很容易地确定其数值出现在任意指定范围内的概率,。,小 结,37,4.医学参考值范围指“正常,参照人群”,的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。,主要用,作划分正常人与异常人的界线,。,5,.,医学参考值范围的制定,需要按照一定步骤进行,。实际中最好结合正常人和病人的数据分布特点,权衡假阳性和假阴性的比例,选择一个适当的百分范围,,,最常用的百分界限是95%。,6.,参考值范围估计的方法有多种,其中最基本的有百分位数法和正态分布法。,正态法的优点是结果较稳定,但对资料要求严格;,百分位数法,适合于任何分布类型的资料,但要求大样本。,38,4.医学参考值范围指“正常参照人群”的解剖、生理,例,1.3,某地随机抽取正常的成年男子,120,名,其红细胞计数值(,10,12,/L,),5.12,4.32,5.14,4.85,5.13,4.28,4.70,4.13,4.68,3.42,3.92,5.35,5.13,4.84,5.46,5.28,5.26,4.46,4.28,5.22,5.48,4.68,5.04,3.71,4.58,4.91,4.66,4.78,3.84,5.03,4.37,4.44,5.31,4.52,4.70,5.27,4.31,5.14,4.20,4.32,4.17,5.69,5.33,4.13,4.53,5.19,4.54,4.52,4.09,5.25,4.21,4.94,4.56,5.25,4.78,4.43,4.83,3.70,3.95,5.21,4.41,4.89,3.73,5.21,3.52,4.56,4.75,4.02,4.11,5.51,4.40,4.37,4.33,4.79,5.17,4.68,4.50,5.53,5.39,5.86,3.29,4.64,4.31,4.80,4.58,4.90,5.79,5.09,4.05,4.58,5.27,5.12,4.18,4.92,3.77,4.75,4.24,5.09,5.46,4.68,4.92,4.86,4.89,5.36,4.13,4.93,4.16,3.86,5.45,4.04,4.49,4.91,4.87,4.97,6.18,3.86,4.06,4.90,4.58,5.69,1.,绘制直方图,