样本均数的比较检验分类检验基本命令:Ttest 过程:Proc ttest options; Class variable;/* 分组语句,必不可少*/ Var variable; By variable; Run; Proc ttest options; 选择项为data=sasdatasets; Class 语句:Class variable; 该变量为字符型(16 字节)或者数值型均可,但只能有两个分类。Var 语句;列出要比较分析的变量,如果不列出,则用在其他语句中未出现的数值型变量分析。By 语句;By variable; 按by 语句的变量分组进行统计推断;by 语句使用前要进行排序,或者用notsorted 与descending T检验分类单样本均数t检验两独立样本t检验配对样本t检验几何均数t检验(略)等效性检验可信区间的计算单样本均数t检验(one-sample test) Data one_sample test; N=36; S_m=130.83; Std=25.74; P_m=140; Df=n-1; T-(s_m-p_m)/(std/sqrt(n)); P=(1-probt(abs(t),df))*2; Proc print; Var t p; Run; 两独立样本t检验示例:stscores 程序Data stscores; input sex$ score@@; Cards; F 75 f 76 f 80 f 77 f 80 f 77 f 73 m 82 m 80 m 85 m 85 m 78 m 87 m 82 ; proc ttest; class sex; var score; run; 配对样本t检验先求各对子差值,然后对差值是否为零,运用proc univariate 完成。示例:程序paired t test (univariate )data work1; input f m @@; dif=m-f; datalines; 169 170 102 96 67 74 206 178 109 86 97 92 156 179 73 92 83 87 ; proc univariate data=work1; var dif; title ' 成对差值T检验'; run; Paired ttest (means) data a; input id pretest posttest@@; dif=posttest-pretest; cards; 1 80 82 2 73 71 3 70 95 4 60 69 5 88 100 6 84 71 7 65 75 8 37 80 9 91 95 10 98 99 11 52 65 12 78 83 13 40 60 14 79 86 15 59 62 ; proc means mean std t prt; var dif; title 'paired conparisons t test'; run; 等效性检验data euqal_test; n1=102;n2=100; m1=0.57;m2=0.48; s1=0.89;s2=0.82; delta=0.52; sc2=(s1**2*(n1-1)+ s2**2*(n2-1))/(n1+n2-2); 单一总体均数的可信区间计算Data onesample_cl; N=10; Mean=166.95; Std=3.64; T=tinv(0.975,n-1); In=t*std/sqrt(n); Lclm=mean-in; Uclm=mean+in; Run; Proc print; Var lclm ulclm; Run; 两个总体均数差的可信区间方差分析可用于方差分析的方法包括:GLM ANOVA NESTED VARCOMP GLM :进行方差分析、回归、协方差分析、多元方差分析. ANOVA :对平衡设计进行方差分析NESTED :纯嵌套随机模型的方差分析VARCOMP :估计方差成分ANOVA 用于平衡设计对实验的每种组合安排相同的实验单位,称为平衡设计。研究设计类型完全随机设计随机区组设计拉丁方设计析因设计正交设计系统设计裂区设计命令:Proc anova options; Class variables; Model dependent=effects/options; Means effects/options; Absorb variables; Freq variables; Proc anova options; 选项为Data=sasdatesets Class variables; 在ANOVA 语句中的分类变量必须用class 首先指明。Model dependent=effects/options; Model 指明因变量与自变量,如果没有指明,则仅拟合截距项。它是检验因变量均数为0的假设。选项有:nouni int: 要求打印模型中与截距项效应有关的intercept 假设检验Means 语句;Means effects/options; 无论效应是否在模型中指定,你均可算这个效应的均数。而且可使用多个means 语句。Proc anova; Class A B C; MODEL Y=A B C; MEANS A B C A*B; Means 语句后的选择项;Bonferronit,duncan’s,gabriel,regwf,regwq, Scheffe,sidka,smm,gt2,snk,t,tukey,alpha=value,waller,kratio=vlaue,line,cldiff : absorb, E=effect 指出在多重比较中的误差均方,如果省略了E,则使用残差均方。指定项必须为模型中的一项,否则将使用残差均方。Absorb variables; Freq 语句;Freq variables; 用法与含义同前。Test 语句Test h=effects E=effect; h=effects 指定前一个模型中的某些效应为假设效应(分子)E=effect 指定一个(对每个test 仅仅一个)效应作为误差项(分母); 如:proc anova; class A B C; model A|B(A)|C; TEST H=A E=B(A); TEST H=C A*C E=B*C(A) MANOVA 语句;(略)Manova e=effect M=equation1, equation2,---,Mnames=list of names prefix=name/options; 完全随机设计是将受试对象随机分配到同一处理因素下不同水平的处理组中,然后观察实验效应,并检验不同水平间效应差别有无统计学意义。程序complerandom data complrandom; do c=1 to 3; do i=1 to 7; input y @@; output; end; end; cards; .1437 .1567 .1598 .1696 .1878 .22 .2296 .1546 .1679 .1957 .1978 .2222 .2371 .2384 .1774 .1834 .1854 .1915 .2041 .2186 .2344 ; proc anova; class c; model y=c; means c/snk; run; 随机区组设计资料的方差分析随机区组资料是先将除处理因素外其他条件相同或相近的受试对象归入一个区组,再将一个区组内的受试对象随机分配到不同的实验组内,从而保证同一个区组内的受试对象的其他条件相同或相近,则彼此间的试验效应的差异主要是由处理因素引起的,而且处理间或区组因素间没有交互作用。程序:data randomblock; do a=1 to 5; do b=1 to 3; input y @@; output; end; end; 交叉设计资料的方差分析交叉设计是指受试对象在不同的实验阶段分别接受不同的处理因素,则实验效应受到3个因素的影响,一个是处理因素,一个是处理顺序因素,还有一个是实验阶段因素。同时要求这3个因素间没有交互作用。交叉设计程序Data order; Do time=1 to 2; Do r=1 to 10; Input treat $ x @@; output; End; End; Cards; A 760 b 860 a 568 a 780 b 960 b 940 a 635 b a 440 b 528 b 800 a 958 a 952 b 650 a 450 b 530 a 803 ; Proc anova; class time r treat; model x=r time treat; run; 析因设计析因设计既考虑单独效应(主效应),又考虑交互效应。析因设计程序data interaction; do a=1 to 2; do b=1 to 2; do i=1 to 5; input x@@; output; end; end; end; 正交设计析因设计时,如果因素比较多,或者各个因素的水平数较多,则所有水平数的组合将产生非常多的处理,实现将回很困难,此时可选择正交设计。正交设计并不考虑所有水平的交互作用,只考虑部分因素的一级交互作用。重复测量资料的方差分析重复测量资料是指同一受试对象在不同的时点上多次测量同一个指标所得到的资料,因此,该资料不仅收到处理因素的影响,还受到时间因素的影响,故分析过程中应该考虑到时间因素。分析方法:GLM 和MIXED 。GLM General linear model 一般线性模型既可用于平衡资料,也可用于非平衡资料。既可以处理分类自变量,也可以处理连续性自变量。cards; .82 .65 0.51 .73 .54 .23 .43 .34 .28 .41 .21 .31 .68 .43 .24 ; proc anova; class a b; model y=a b; means b/snk; run; 程序:anova cards; 10 10 40 50 10 30 30 70 60 30 10 20 30 50 30 50 50 70 60 30 ; proc anova; class a b; model x=a b a*b; Run; * 检验:ttest 过程方差分析:anova 过程se=sqrt(sc2*(1/n1+1/n2)); te=(abs(m1-m2)-delta)/se; pe=probt(te,n1+n2-2)*2; run; proc print; var te pe; run; Data twosample_ci; n1=29;n2=32; m1=20.1;m2=16.89; s1=7.02;s2=8.64; sc2=(s1**2*(n1-1)+s2**2*(n2-1))/(n1+n2-2); st=sqrt(sc2*(1/n1+1/n2)); t=tinv(0.975,n1+n2-2); in=t*st; dm=m1-m2; lcim=dm-in; ucim=dm+in; Run; Proc print; Var lcim ucim; Run; Test h=effects E=effect; Manova h=effects E=effect; M=equations/options; Repeated factornames/options; By variables; Class 语句必须在model 语句之前;如果有manova 与test 语句,class 必须在model 之后。*
下载此电子书资料需要扣除0点,