常用生物统计方法的SAS 程序一、SAS 系统简介二、SAS 系统的启动与关闭三、SAS 程序结构、程序的输入、修改调试和运行四、常用生物统计方法的SAS 程序—t 检验—方差分析—线性回归与相关分析一、SAS 系统简介—SAS (Statistical Analysis System )是美国使用最为广泛的三大著名统计分析软件(SAS ,SPSS ,SYSTAT )之一;—1966 年美国North Carolina 州立大学开始开发—目前国际上最流行的一种大型统计分析系统—统计分析的标准软件—其基本部分是SAS/BASE 软件,在此基础上可根据需要加上SAS 系统的其他模块SAS/STAT (统计分析);SAS/ETS (经济预测或时间序列分析);SAS/QC (质量控制管理);SAS/OR (运筹学);SAS/IML (矩阵运算);SAS/GRAPH (绘图)等—信息存储简单(能读取任何形式的数据)—语言编程能力强—对数据连续处理—统计分析方法丰富,使用简单—SAS 过程傻瓜系统……二、SAS 系统的启动与关闭(一)启动在WINDOWS 操作系统中,直接用鼠标双击桌面上SAS 系统的快捷键图标,即进入SAS 系统。SAS 系统软件有时间租期限制,因此只有机器时间在软件有效期内才能运行OUTPUT (SAS 结果输出窗口)LOG (SAS 日志窗口,随着SAS 语句的执行,显示出SAS 系统的信息和已执行的语句)PGM (SAS 程序编辑窗口)(二)退出四、SAS 程序结构(一)程序结构在SAS 系统中任何一个完整的处理过程均可分为两大步——数据步和过程步数据步——将不同来源的数据读入SAS 系统建立起SAS 数据集。由DATA 语句开始,以RUN 语句结束。—数据可以由外部或过程读入;或者由CARDS 语句开始,直接输入数据,数据输入完后提行单独加“;”结束过程步——调用SAS 系统中已编好的各种过程来处理和分析数据集中的数据。—每一个过程步均以PROC 语句开始,RUN 语句结束,并且每个语句后均以“;”结束。(二)程序的输入、修改调试和运行SAS 程序只能在PGM 窗口输入、修改,可在各行的任何位置开始SAS 语句的书写。一个语句可以连续写在几行中,一行中也可以同时写上几个语句,但每个语句后面必须用“;”隔开。当一个程序输入完后,发送程序的命令为F10 功能键或SUBMIT 。当程序发送到SAS 系统后,PGM 的程序语句全部自动清除,LOG 窗口将逐步记下程序运行的过程和出现的错误信息(用红色提示错误)。—如果过程步没有错误,运行完成后,通常会在OUTPUT 窗口打印出结果—如果程序运行出错,则需要在PGM 窗口用RECALL (或F9 )命令调回已发送的程序进行修改。四、常用生物统计方法的SAS 程序(一)t 检验1 、样本平均数与总体平均数的差异显著性检验(教材【例5.1 】) DATA A; INPUT y@@; y=y-4.50; cards; 4.33 4.62 3.89 4.14 4.78 4.64 4.52 4.48 4.55 4.26 ; PROC MEANS N MEAN STDERR T PRT; RUN; 程序说明:样本平均数与总体平均数的差异显著性检验可调用MEANS 过程。DATA 语句产生临时数据集A,表明数据步的开始;INPUT 语句指明读取变量y,@@ 表示读入一条观测值后不换行,连续读入数据,减少数据输入行;CARDS 语句表明以下为数据行,数据行下的“;”表示数据行结束;PROC MEANS 语句指明调用MEANS 过程对数据集A进行分析,输出样本含量N、平均数MEAN 、平均数的标准误STDERR 、学生氏T值和t值概率PRT ;RUN 语句表示过程步结束,开始运行过程步。2、配对试验资料的t检验(教材【例5.5 】)DATA B; INPUT ID x1 x2; d=x1-x2; CARDS; 1 37.8 37.9 2 38.2 39.0 3 38.0 38.9 4 37.6 38.4 5 37.9 37.9 6 38.1 39.0 7 38.2 39.5 8 37.5 38.6 9 38.5 38.8 10 37.9 39.0 ; PROC MEANS MEAN STDERR T PRT; VAR d; RUN; 3、非配对试验资料的t检验(教材【例5.3 】)DATA C; INPUT breed y@@; CARDS; 1 57 2 89 1 120 2 36 1 101 2 82 1 137 2 50 1 119 2 39 1 117 2 32 1 104 2 57 1 73 2 82 1 53 2 96 1 68 2 31 1 118 ; PROC TTEST; CLASS breed; VAR y; RUN; (二)方差分析对于一般的方差分析(平衡资料,即各处理重复数相等)可用ANOVA 过程;对于非平衡资料(各处理重复数不等)的方差分析可用GLM 过程。1. 单因素试验(各处理重复数相等,教材【例6.1 】)2. 单因素试验(各处理重复数不等,教材【例6.3 】)3. 两因素交叉分组单独观察值(教材【例6.4 】)4. 两因素交叉分组重复观察值(教材【例6.5 】)5. 两因素系统分组次级样本含量相等(教材【例6.6 】)6. 随机单位组试验资料(教材【例12.3 】)7. 拉丁方试验资料(教材【例12.4 】)教材【例6-1 】DATA E; INPUT TR$ y@@; cards; A1 15 A1 16 A1 15 A1 17 A1 18 A2 45 A2 42 A2 50 A2 38 A2 39 A3 30 A3 35 A3 29 A3 31 A3 35 A4 31 A4 28 A4 20 A4 25 A4 30 A5 40 A5 35 A5 31 A5 32 A5 30 ; PROC anova; CLASS TR; model y=TR; MEANS TR/T; RUN; DATA F; INPUT BREED$ y@@; cards; B1 21.5 B1 19.5 B1 20.0 B1 22.0 B1 18.0 B1 20.0 B2 16.0 B2 18.5 B2 17.0 B2 15.5 B2 20.0 B2 16.0 B3 19.0 B3 17.5 B3 20.0 B3 18.0 B3 17.0 B4 21.0 B4 18.5 B4 19.0 B4 20.0 B5 15.5 B5 18.0 B5 17.0 B5 16.0 ; PROC GLM; CLASS BREED; model y=BREED; MEANS BREED/T; RUN; DATA F; INPUT A$ B$ y@@; cards; A1 B1 3.5 A1 B2 2.3 A1 B3 2.0 A2 B1 2.6 A2 B2 2.0 A2 B3 1.9 A3 B1 2.0 A3 B2 1.5 A3 B3 1.2 A4 B1 1.4 A4 B2 0.8 A4 B3 0.3 ; PROC ANOVA; CLASS A B; model y=A B; MEANS A B/DUNCAN; RUN; DATA CaP; DO a=1 to 4; DO b=1 to 4; DO n=1 to 3; input y@@; output; end; end; end; DROP n; CARDS; 22.0 26.5 24.4 30.0 27.5 26.0 32.4 26.5 27.0 30.5 27.0 25.1 23.5 25.8 27.0 33.2 28.5 30.1 38.0 35.5 33.9 26.5 24.0 25.0 30.5 26.8 25.5 36.5 34.0 33.5 28.0 30.5 24.6 20.5 22.5 19.5 34.5 31.4 29.3 29.0 27.5 28.0 27.5 26.3 28.5 18.5 20.0 19.0 ; PROC ANOVA; CLASS A B; MODEL y=A B A*B; RUN; DATA G; DO a=1 to 3; DO b=1 to 3; DO n=1 to 2; input y@@; output; end; end; end; DROP n; CARDS; 82.5 82.4 87.1 86.5 84.0 83.9 86.6 85.8 86.2 85.7 87.0 87.6 82.0 81.5 80.0 80.5 79.5 80.3 ; PROC ANOVA; CLASS A B; MODEL y=A B(A); RUN; DATA R; INPUT T$ B$ X@@; CARDS; A1 B1 205 A1 B2 168 A1 B3 222 A1 B4 230 A2 B1 230 A2 B2 198 A2 B3 242 A2 B4 255 A3 B1 252 A3 B2 248 A3 B3 305 A3 B4 260 A4 B1 200 A4 B2 158 A4 B3 183 A4 B4 196 A5 B1 265 A5 B2 275 A5 B3 315 A5 B4 282 ; PROC GLM; CLASS T B; MODEL X=T B; MEANS T/DUNCAN; RUN; DATA L; INPUT T$ ROW COL X@@; CARDS; D 1 1 23 E 1 2 21 A 1 3 24 B 1 4 21 C 1 5 19 A 2 1 22 C 2 2 20 E 2 3 20 D 2 4 21 B 2 5 22 E 3 1 20 A 3 2 25 B 3 3 26 C 3 4 22 D 3 5 23 B 4 1 25 D 4 2 22 C 4 3 25 E 4 4 21 A 4 5 23 C 5 1 19 B 5 2 20 D 5 3 24 A 5 4 22 E 5 5 19 ; PROC GLM; CLASS T ROW COL; MODEL X=T ROW COLl; MEANS T/DUNCAN; RUN; (三)一元线性回归与相关分析(教材【例8.1 】)DATA G ;INPUT x y@@ ;CARDS ;80 2350 86 2400 98 2720 90 2500 120 3150 102 2680 95 2630 83 2400 113 3080 105 2920 110 2960 100 2860 ;PROC REG CORR ;MODEL y=x ;RUN ;(四)协方差分析(教材【例10.1 】)DATA K; INPUT T$ X Y@@; CARDS; CK 1.50 12.40 CK 1.85 12.00 CK 1.35 10.80 CK 1.45 10.00 CK 1.40 11.00 CK 1.45 11.80 CK 1.50 12.50 CK 1.55 13.40 CK 1.40 11.20 CK 1.50 11.60 CK 1.60 12.60 CK 1.70 12.50 1 1.35 10.20 1 1.20 9.40 1 1.45 12.20 1 1.20 10.30 1 1.40 11.30 1 1.30 11.40 1 1.15 12.80 1 1.30 10.90 1 1.35 11.60 1 1.15 8.50 1 1.35 12.20 1 1.20 9.30 2 1.15 10.00 2 1.10 10.60 2 1.10 10.40 2 1.05 9.20 2 1.40 13.00 2 1.45 13.50 2 1.30 13.00 2 1.70 14.80 2 1.40 12.30 2 1.45 13.20 2 1.25 12.00 2 1.30 12.80 3 1.20 12.40 3 1.00 9.80 3 1.15 11.60 3 1.10 10.60 3 1.00 9.20 3 1.45 13.90 3 1.35 12.80 3 1.15 9.30 3 1.10 9.60 3 1.20 12.40 3 1.05 11.20 3 1.10 11.00 ; PROC GLM; CLASS T; MODEL Y= T X/SOLUTION; MEANS T/DUNCAN; LSMEANS T/STDERR PDIFF TDIFF; RUN; * *
下载此电子书资料需要扣除0点,