(3)正态总体参数的无偏估计 ① 的无偏估计有两个,即 和 。 ② 的无偏估计常用的只有一个,即 。 ③ 的无偏估计有两个,即 和 二、区间估计 (一)区间估计的概念 设θ是总体分布中的未知参数,其一切可能取值组成的参数空间为 ,从总体中抽取一个样本(x1,x2,……,xn),对给定的 ,确定两个统计量: 与 对任意的 有 则称[θL,θu]是θ的置信水平为 的置信区间。 ? 1- 置信区间的含义: 所构造的一个随机区间[ ]能包含未知参数 的概率为1- 。由于这个随机区间会随样本观察值的不同而不同,它有时包含了参数 ,有时没有包含 ,但是用这种方法作区间估计时,100次中大约有100(1- )个区间能包含未知参数 。 (二)一个正态总体均值与方差的置信区间 (1) 已知,求 的置信区间 的1- 置信区间为: (2) 未知,求 的置信区间 (3)方差 的1- 的置信区间( 未知) (4)标准差 的1- 的置信区间(未知) (三)比例p的置信区间(大样本场合) 设总体 ,样本为x1,x2,…,xn,样本之和为K,样本均值为 则 (点估计) 当n相当大时, ,故p的 置信区间。 其中 是标准正态分布的 分位数。 第五节 假设检验 ? 基本思想 根据所获得的样本,运用统计分析的方法,对总体X的某种假设H0作出接受或拒绝的决定。 (二)基本步骤 1.建立假设 H0称为原假设,H1称为备择假设,如关于均值 常用有三类假设: H0: ,H1: (1) H0: ,H1: (2) H0: H1: (3) (1),(2)称为单边假设检验 (3)称为双边假设检验 2.寻找检验统计量T,确定拒绝域的形式 3.给出显著性水平 4.给出临界值,确定拒绝域 5.根据样本观察值计算检验统计量的观察值,根据计算结果作出拒绝或接受H0的判断。 ? 一个正态总体的假设检验 1. 已知 ,检验H0: ,H1: (1)检验统计量 (2)给定 ,查标准正态分布函数值表定出临 界值 (3)由样本观察值计算出统计量u (4)作出判定 当 接受H0 拒绝H0,接受H1 2. 已知 ,检验H0: ,H1: (1)检验统计量 (2)给定 ,定出临界值 (3)由样本观察值计算出统计量 (4)判定 当 接受H0 拒绝H0,接收H1 3. 已知 ,检验H0: ,H1: (1)检验统计量 (2)给定 ,定出临界值 (3)由样本观察值计算出统计量u (4)判定 当 接受H0 拒绝H0,接受H1 4. 未知 ,则用t检验法 把上述的统计量u换成t,即 对给定的 ,查t一分布表,确定临界值,然后作出接受或拒绝的判定。 5. 未知,检验H0: ,H1: (1)检验统计量 (2)给定 ,查 -分布表,定出临界值 和 (3)由样本观察值计算出统计量 当 接受H0,否则拒绝H0,接受H1。 三、有关比例p的假设检验 设X~b(1,p),x1,x2,……xn由总体X抽取的一个样本,当n较大时,根据中心极限定理, 近似服从正态分布, ,则 近似服从N(0,1) 则可获得p的近似u检验。 五、中心极限定理 ? 随机变量的独立性 随机变量X1与X2相互独立是指其中一个取什么值不影响另一个的取值,或者说是指两个随机变量独立的取值,互不影响。 随机变量的独立性可以推广到3个或更多个随机变量。 ? 中心极限定理 在统计中,多个相互独立随机变量的平均值(仍然是一个随机变量)将服从或近似服从正态分布。 即n个相互独立同分布的随机变量X1,X2, ……Xn,均值μ和方差 都存在,则在n较大时,其样本均值 服从或近似服从正态分布N(μ, )。 第三节 统计基础知识 一、总体、个体与样本 (一)总体与个体 总体:在一个统计问题中,我们把研究对象的 全体成为总体。 —— 当研究产品某个特定的质量特性X时, 也常把全体产品的特性看做为总体。 个体:构成总体的每个成员。 —— 当研究产品的某个特定的质量特性X时, 把一个具体产品的特性值x视为个体。 (二)随机样本 满足下面两个条件的样本称为简单随机样本,简称随机样本: 1. 随机性。总体中每个个体都有相同的机会 入样。 2. 独立性。从总体中抽取的每个样品对其它 样本的的抽取无任何影响。 ? 随机样本可看做n个相互独立的、同分布 的随机变量,其分布与总体分布相同。 ? 下面所述的样本都是指满足这两个要求的 简单随机样本。 二、频数(频率)直方图 为了研究数据的变化规律,需要对数据进行一定的加工整理。直方图是为研究数据变化规律而对数据进行加工整理的一种基本方法。 (一)直方图的作法 [例1.3-3] 食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取100个进行称量,获得罐头的净重数据如下: 为了解这组数据的分布规律,对数据做如下整理: (1)找出这组数据中的最大值xmax及最小值xmin,计算它们的差R= xmax- xmin,R称为极差,也就是这组数据的取值范围。在本例中xmax=356,xmin =332,从而R=356-332=24。 (2)根据数据个数,即样本量n,决定分组数k及组距h。 一批数据究竟分多少组,通常根据n的多少而定,不过这也不是绝对的,教材中1.3-2是可以参考的分组数。 选择k的原则是要能显示出数据中所隐藏的规律,组数不能过多,但也不能太少。 每一组的区间长度,称为组距。组距可以相等,也可以不相等。组距相等的情况用得比较多,不过也有不少情形在对应于数据最大及最小的一个或两个组,使用与其他组不相等的组距。对于完全相等的组距,通常取组距h为接近的某个整数值。 在本例中,n=100,取k=9,R/k=24/9=2.7,故取组距h=3。 (3)确定组限,即每个区间的端点及组中值。为了避免一个数据可能同时属于两个组
第1章 概率统计基础知识(中级).ppt
下载此电子书资料需要扣除0点,