单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章STATA 入门,导论,Stata公司在1980年代中后期开发的整合性商业统计软件包,具有超强的统计功能、完整的绘图功能、数据管理能力、程序设计能力;高等统计功能更完备,使用接口为WINDOWS、MAC和UNIX等操作系统;能跨平台操作,Stata的9.0版本新增Internet功能,可以将程序放在网络上,因其使用的简便,功能的完备而迅速被广泛应用。有130个国家的使用者,适合经济、政治、社会科学及生物统计及流行病学及其他科学使用,本章主要内容,2.1特点与功能,2.2版本,2.3运行方式,2.4界面,2.5帮助系统,功能I,数据管理Data management,根本统计Basic statistics,统计绘图Graphics,方差分析ANOVA/MANOVA,线性模式Linear models及广义型线性模式Generalized linear models(GLMs),二元、计数及有限因变量Binary,count,and limited dependent variables,多层模型Linear mixed,multilevel,and hierarchical models和群集分析Cluster analysis,存活分析Survival analysis,Panel数据/交叉-组合时间序列Panel data/cross-sectional time-series及时间序列Time series,功能II,因子分析factor analysis,模拟分析Resampling and simulation methods,抽样调查方法Survey methods,模型检验及事后估计量支持分析Model testing and post-estimation support,无参数分析Nonparametric methods,流病学统计工具Tools for epidemiologists,最大似然估计Maximum likelihood,转换和常态检验(Transforms and normality tests),其他统计方法(Other statistical methods,Matrix programming,Programming language,版本,假设以承载能力的大小区分,Stata有三种版本:,Stata/SE 用于大型数据处理,Intercooled Stata 用于标准数据处理,Small Stata 用于小型数据处理,供学生和教学使用,假设以功能的多寡区分,Stata共有10个版本,目前最新的版本是10.0,于2007年开发成功,本课程使用9.0版,运行方式,完全窗口方式:该方式通过选择窗口菜单和对话框完成各种操作,优点:用户无需学会编程,简单易用,局限:用过的命令难以保存,程序运行方式:这种方式是在命令窗口中直接运行编写好的程序,优点:可记录保存所有所用过的命令,留作以后再用或和帮助研究者检讨以前对某个研究问题的分析思路和方法,缺点:使用者需要掌握一定的编程语言,启动,Stata软件安装完毕后,系统自动在Windows菜单中创见快捷方式。单击Windows的“开始按钮,在程序菜单项中点击Stata,即可启动Stata,Stata 9.0有菜单栏和工具栏。在Stata的编辑data editor窗口中,还有编辑栏,变量名栏,输入结果区域,菜单栏列出Stata的命令菜单。每个菜单对应一组相应的功能。使用者可以利用这些菜单进入软件的各项功能,工具栏中列出常用的快捷图标。假设要查看某个工具的具体功能,只需将鼠标指向该工具标识,即可显示对该工具的解释,主界面I,主页面上有四个大小可自由调节的次界面,Review,Results,Variables,Command,Results输出结果:位于界面的中央。在输入命令程序后,结果将在这里表现出来。假设该窗口的底端显示“more的字样,说明还有更多的结果在当前页面之外。可按“回车键查看更多结果;也可按“q键,终止输入结果,Command命令:位于界面的下方。输入命令的窗口,Stata的界面,翻开 Stata 软件时,印入眼帘的页面是:,执行过的命令窗口,输出结果窗口,变量名窗口,输入命令窗口,菜单栏,工具栏,主界面II,Review回忆:位于界面的左上方。记录保存所有最新命令。当关闭Stata 软件时,这些命令也随之消失,点击某个命令,该命令就会转移到Command 窗口,并可再次执行该命令,可点击鼠标右键保存该窗口的命令,Variables变量:位于界面的左下方。当前使用数据中的所有变量都在这里显现。点击某个变量,该变量就会转移到Command 窗口,数据窗口I,Stata的两个数据界面:,Data Editor ,Data Browser ,Stata的数据文件是一张长方形的二维表。文件的范围是由观测observations和变量(variables)的数目组成,每一行row表示一个观测observation或个案case,每一列column表示一个变量,即个案的特征,每个单元cell是观测和变量的交叉,表示某个观测的单个变量值,数据窗口II,Data Editor:数据编辑窗口。该窗口允许手工输入、修改数据,也可以直接将Excel和SPSS等格式数据剪切、复制、粘贴到该窗口,输入新数据时,Stata自动将变量命名为var1,var2等。双击var1会弹出另一个页面,可以给重新命名、定义变量,内容区最左边是行的标志;内容区列出每个个案的变量取值,Data Browser:数据浏览窗口。只可浏览、不能更改数据,注意:在程序运行的时候,该窗口必须是关闭的。否那么Stata将不工作,程序编辑窗口,Do-File Editor :命令程序编辑窗口图标。位于Stata的工具栏和Windows菜单下。将鼠标指向图标,即出现“bring do-file editor to front的文字说明;点击该图标就会出现do文件的编辑窗口。可在该窗口直接编写程序、运行编写好的程序。使用者需要掌握一定的Stata 编程语言,文件的保存格式是.do文件,Do-file窗口有菜单和工具栏。工具栏的右边有Do current file和Run current file图标。点击两个图标中的一个便可运行整个do文件,也可选择运行局部命令。二者的差异在于,前者产生输出结果,后者没有输出结果,帮助窗口,New viewer 新看客:帮助窗口。这只类似“大眼睛的图标代表“帮助。单击该图标,View(#1)Advice on Help帮助对话框被调到当前页面,在指定位置即help的后面输入需要帮助的内容即可,Stata拥有很完善的帮助系统,图形窗口,Graph :该图标表示图形窗口,仅在图形生成时才被激活并自动弹出,根本运算符及含义,