,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/2/2,#,plot,参数,标题,可以使用函数,title,格式,为:,title(main=,sub=,xlab=,ylab=),也可以直接把,title,里面的参数直接放在,plot(),里面,plot,参数,坐标轴,plot,参数,axes=FALSE,将禁用全部,坐标轴,框架,和刻度全部没有了,xaxt=n,禁用,x,轴的刻度线,yaxt=n,禁用,y,轴的刻度线,xlimx,坐标轴的,范围,只,写出最小值和最大值,ylim y,坐标轴的,范围,只,写出最小值和最大,值,例如:,plot(1:10,xlim=c(-,10,10,),ylim=,c(0,10)xlim,和,ylim,只是坐标轴的,范围,与,每个点的,x,和,y,坐标没有关系,plot,参数,pch,指定绘制点时使用的符号,plot,参数,cex,指定符号的,大小,lwd,指定线条宽度。,cex,是一个,数值,表示,绘图符号相对于默认大小的缩放倍数。默认大小为,1,1.5,表示放大为默认值的,1.5,倍,0.5,表示缩小为默认值的,50,%,等等,lwd,是以默认值的相对大小来表示的(默认值为,1,)。,例如,lwd=2,将生成一条两倍于默认宽度的线条,plot,参数,lty,指定线条,类型,plot,参数,字体,cex.axis,坐标轴刻度文字的缩放倍数。类似于,cex,cex.lab,坐标轴标签(名称)的缩放倍数。类似于,cex,cex.main,标题的缩放倍数。类似于,cex,cex.sub,副标题的缩放倍数。类似于,cex,font,整数。用于指定绘图使用的字体样式。,1=,常规,2,=,粗,体,3,=,斜体,4,=,粗,斜体,5,=,符号字体(以,Adobe,符号编码表示),font.axis,坐标轴刻度文字的字体样式,font.lab,坐标轴标签(名称)的字体样式,font.main,标题的字体样式,font.sub,副标题的字体样式,ps,字体磅值(,1,磅约为,1/72,英寸)。文本的最终大小为,ps*cex,family,绘制文本时使用的字体族。标准的取值为,serif,(衬线)、,sans,(无衬线)和,mono,(等宽),plot,参数,图形尺寸和边界尺寸,用于控制图形尺寸和边界大小的参数,pin,以英寸表示的图形尺寸(宽和高),mai,以数值向量表示的边界,大小,顺序,为“下、左、上、右,”,单位,为英寸,mar,以数值向量表示的边界,大小,顺序,为“下、左、上、右,”,单位,为英分*。默认值为,c(5,4,4,2)+,0.1,plot(x,pin=2,mai=c(5,5,5,5),plot,参数,type,类型,plot,参数,参考线,abline(h=yvalues,v=xvalues),例如:,plot(1:10),abline(h=c(1,5)#,则在,y=1,和,5,处各有一条水平线,abline(v=c(1,5)#,则在,x=1,和,5,处各有一条垂直线,plot,参数,col,用于,指定颜色的参数,col,默认的绘图颜色。某些函数(如,lines,和,pie,)可以接受一个含有颜色值的向量并自动循环使用。,例如,如果,设定,col=c(red,blue),并需要绘制三条,线,则,第一条线将为,红色,第二,条线为,蓝色,第三,条线又将为红色,col.axis,坐标轴刻度文字的颜色,col.lab,坐标轴标签(名称)的颜色,col.main,标题颜色,col.sub,副标题颜色,fg,图形的前景色,bg,图形的背景色,绘图练习,散点图,attach(swim),as.factor(sex),plot(swim,col=sex),title(main=A,sub=B,xlab=,X,ylab,=Y,cex.sub=2),plot(time,col=sex,pch=5,font.axis=1),绘图练习,散点图,set.seed(200),x=rnorm(100,1);,plot(x,col,=cornflowerblue),plot(x,col,=cornflowerblue,col.axis,=blue,),plot(x,col,=cornflowerblue,col.axis,=blue,fg,=red),同时构造多个散点图,par(mfrow=c(2,2,),plot(rnorm(50,),pch=17,),plot(rnorm(20),type,=l,lty=5,),plot(rnorm(100),cex=0.5),plot(rnorm(200,),lwd=2,),par(mfrow=c(2,2,),同时构造多个图形,mtcars,attach(mtcars,),layout(matrix(c(1,2),2,1,byrow=TRUE),hist(wt),hist(disp),layout(matrix(c(1,1,2,3),2,2,byrow=TRUE),hist(wt),hist(mpg),hist(disp),layout,图形叠加,plot(cars,main=lowess(cars),lines(lowess(cars),col,=“red),points(lowess(cars,),col,=blue),利用,lines,points,低级作图命令,图形叠加,先做一个图,然后输入,par(new=T),命令,再以后的作图前都先输入这个命令新图就不停地叠加。,例:,plot(cars,col=2,pch=1),par(new,=TRUE,),plot(lowess(cars,),col=1,axes=F,xlab,=,ylab=,type,=l,),par(new=TRUE,),plot(lowess(cars),col=3,axes=F,xlab,=,ylab=,pch=4),par(new=TRUE),R,中嵌入的基本绘图功能,茎叶图,茎叶图(Stem-and-Leaf display,),由,统计学家约翰托奇设计(John Tukey),思路:是将数组中的数按位数进行比较,具体化:将数的大小基本不变或,变化不大,的,位,作为一个主干(茎,),将,变化大,的,位,的数作为分枝(叶,),列,在主干的,后面,这样,就可以清楚地看到每个主干后面的几,个数,每个,数具体是多少。,绘制变量的茎叶图,茎叶图简介,探究,:某篮球运动员在某赛季各场比赛的得分情况如下:,12,15,24,25,31,31,36,36,37,39,44,49,50,如何分析该运动员的整体水平及发挥稳定程度,?,通过绘制茎叶图可以解决上述问题。,从这个图可以直观的看出,:该,运动员中位数、众数都在20和40,之间,且,呈单峰,状且,分布较,对称,集中,程度,高,说明,其发挥比较稳定,注意:,在制作茎叶图,时,重复,出现的数据要重复,记录,不能遗漏,特别是,“,叶,”,部分;,同一数据出现几,次,就要,在图中体现几次.,对于样本数据:,3.,1,2,.,5,2,.,0,0,.,8,1,.,5,1,.,0,4,.,3,2,.,7,3,.,1,3,.,5,也,可,用茎叶图表示,。,利用,R,语言绘制茎叶图,x1=c(,8,13,14,16,23,26,28,33,38,39,51,);,x2=c(,3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,),stem(x1,scale=,1,width=,80,atom,=,1e-08,),stem(x2,scale=1,width=80,atom=1e-08),stem,函数,箱线图,箱形图的绘制步骤:,1,、画,数轴,,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的,全距,稍长。,2,、画一个矩形盒,两端边的位置分别对应数据批的上下,四分位数,(,Q1,和,Q3,)。在矩形盒内部,中位数,(,Xm,)位置画一条线段为,中位线,。,3,、在,Q3+1.5IQR,(,四分位距,)和,Q1,1.5IQR,处画两条与中位线一样的线段,这两条线段为,异常值,截断点,称其为内限;在,Q3+3IQR,和,Q1,3IQR,处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(,mild outliers,),在外限以外的为极端的异常值,(extreme outliers),。四分位距,=Q3-Q1,。,.,4,、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。,5,、用“”标出温和的,异常值,.,stem,函数总结,R,的,stem,函数其实是一个比较糟糕的设计,由于其设计的初衷是让其在控制台上能尽量简短的显示(否则控制台宽度不够),所以,当数据之间的差距较大的时候,就会出问题,他会跳着提升枝干,所以一般要设置,sacle,,而,sacle,设置的越大,分茎越多,精度越高,如果你的,scale,较小,他甚至会自动帮你的数据做四舍五入(这样会降低精度),利用,R,语言绘制茎叶图,x1=c(,8,13,14,16,23,26,28,33,38,39,51,);,x2=,c(,12,15,24,25,31,31,36,36,37,39,44,49,100,120),X=data.frame(c(x1,x2),c(rep(a1,length(x1),rep(a2,length(x2),X1=c(x1,x2,),X2=c(rep(a1,length(x1),rep(a2,length(x2,),as.factor(X2),boxplot(X1X2,outlier=T),boxplot(len dose,data=,ToothGrowth,boxwex,=,0.55,at=1:3-,0.2,subset,=supp=VC,col=yellow,main,=Guinea Pigs Tooth Growth,xlab,=Vitamin C dose mg,ylab,=tooth length,xlim,=c(0.5,3.5),ylim=c(0,35),add=T),boxplot,函数,直方图,在,统计学,中,,直方图,(英语:,Histogram,)是一种对数据分布情况的图形表示,是一种,二维,统计图表,,它的两个坐标分别是,统计样本,和该样本对应的某个属性的度量。,描述概率分布,假设收集,到这,63,名同学的身高(单位,cm),数据如下:,158,158,160,168,159,159,151,158,159,168,158,154,158,154,169,158,158,158,159,167,170,153,160,160,159,159,160,149,163,163,162,172,161,153,156,162,162,163,157,162,162,161,157,157,164,165,156,165,166,156,154,166,164,165,156,157,153,165,159,157,155,164,156,频数,分布,表,组数一般为,5,至,12,组,把分成的组的个数称为,组数。,每一组两个端点的差称为,组距,组距,小长方形的高,绘制四个直方图,par(mfrow,=c(2,2),hist(islands,),hist(islands,col=gray,labels=TRUE,),hist(sqrt(islands),breaks=12,col=lightblue,border=pink),hist(sqrt(islands),breaks=c(4*0:5,10*3:5,70,100,140,),col,=blue1),QQ,图,在统计学中,,QQ,图(,Q,代表分位数,Quantile,)是一种通过画出分位数来比较两个概率分布的图形方法。首先选定