假设检验的意义和步骤 摘要】 假设检验(hypothesis test)亦称显著性检验(significant test),是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。目的 讨论假设检验的意义和步骤。方法 查阅文献资料并结合个人经验进行归纳总结。结论 假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的不同,目的是评价两种不同处理引起效应不同的证据有多强,这种证据的强度用概率P来度量和表示。除t分布外,针对不同的资料还有其他各种检验统计量及分布,如F分布、x2分布等,应用这些分布对不同类型的数据进行假设检验的步骤相同,其差别仅仅是需要计算的检验统计量不同。 【关键词】假设检验 意义 步骤 1 假设检验的原理与思想 假设检验(hypothesis test)亦称显著性检验(significant test),是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。实际中多数情况是用样本数据去推断总体,由于存在生物个体变异和随机测量误差,不能简单地根据样本统计量数值的大小直接比较总体参数。如在比较甲乙两种治疗高脂血症药物疗效的试验中,甲乙两组各为l00名患者,甲药使血清甘油三酯平均下降1.36mmol/L、乙药使血清甘油三酯平均下降1.12mmol/L,并不能说明甲药优于乙药,因为如果再重新做一次试验其结果可能相反。假设检验的基本思想是首先对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设。其意义可由下面的例子说明。 例4.4使用黑加仑油软胶囊治疗高脂血症,30名患者治疗前后血清甘油三酯检测结果的差值为1.38±0.76(mmol/L),问治疗后血清甘油三酯是否有所改善? 对上面问题可以作如下考虑:如果治疗前后血清甘油三酯没有改善,则前后变化差值的总体均数应为μd=0,但现在计算出的样本差值均数d-=l.38,其差别可能由两种原因引起,即药物的作用和生物变异性波动。现用假设H0:μd=0表示治疗前后没有差别,需要判断的是这个假设是否符合实际检测结果。我们知道,即使治疗前后血清甘油三酯没有改善,由于生物的变异性,d-不会恰好等于0;但当d--0较大时,血清甘油三酯的改变就难以完全用生物变异来解释,从而认为药物具有作用。问题是d--0究竟要大到多少才能够下这样的结论? 由前一节知道,如果治疗前后血清甘油三酯检测结果的差值服从正态分布,在H0:μd=0成立的条件下,t=(d--0)//(Sd/)服从t分布(Sd为差值的标准差)。因此,可以利用现有样本计算t统计量,如果计算出的t值超出了给定的界限(说明在H0为真时获得现有样本的概率很小),则倾向于拒绝假设H0,认为治疗前后有差别。 假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的不同,目的是评价两种不同处理引起效应不同的证据有多强,这种证据的强度用概率P来度量和表示。除t分布外,针对不同的资料还有其他各种检验统计量及分布,如F分布、x2分布等,应用这些分布对不同类型的数据进行假设检验的步骤相同,其差别仅仅是需要计算的检验统计量不同。 2 假设检验的基本步骤 2.1建立假设和确定检验水准 假设检验中,包括无效假设(null hypothesis)和备择假设(alternative hypothesis)两种假设。 无效假设符号为H0,指需要检验的假设,如治疗前后血清甘油三酯没有差别,即H0:μd=0这一假设通常与我们要验证的结论相反,是计算检验统计量和P值的依据。 备择假没符号为H1,是在H0成立证据不足的情况下而被接受的假设,如拒绝治疗前后血清甘油三酯相同的假设,可表示为H1: μd≠0备择假没有双侧和单侧两种情况。双侧检验指无论是正方向还是负方向的误差,若显著地超出检验水准则拒绝H0,H1:μd≠0即为双侧检验。单侧检验指仅在正方向或负方向误差超出规定的水准时则拒绝H0,如治疗后血清甘油三酯下降的假设可表示为H1:μd>0(或H1:μd<0)双侧检验和单侧检验应如何选择,需根据研究目的和专业知识而定。例如,比较两种降血脂药物的疗效,因无法判断两种药物的优劣,应选用双侧检验;如果是检验一种药物的降血脂作用,因为药物一般总是能降低血脂而不是升高血脂,这时可以采用单侧检验。由于双侧检验将拒绝域的概率等分在t分布两侧的尾部,因此单侧检验的t界值(绝对值)总是小于双侧检验所用的界值。对同一样本,双侧检验得出有显著性差别的结论,单侧检验也一定是显著的,因而在实际中使用较多的是双侧检验。本书中在未作说明的情况下,选用的均是双侧检验。 建立检验假设的同时,还必须给出检验水准。检验水准亦称显著性水准(significantlevel),用α表示,是预先规定的拒绝域的概率值,实际中一般取α=0.05或α=0.01。显然,α值越大越容易得出有差别的结论。 2.2选择检验方法和计算检验统计量 根据资料类型、研究设计方案和统计推断的目的,选择适当的检验方法和计算公式。许多假设检验方法是以检验统计量来命名的,如t检验、u检验、F检验和x2检验等,这些都是后面章节要学习的重要内容。 2.3确定P值和作出统计推断结论查表得到检验用的临界值,然后将算得的统计量与拒绝域的临界值作比较,确定P值。如对双侧t检验|t|≥tα/2,v,则P≤α,按α检验水准拒绝H0,接受H1;若P>α,则不能拒绝H0。P值是假设检验下结论的主要依据,其含义是指在原假设成立的条件下,观察到的样本差别是由于机遇所致的概率。因此,P值越小越有理由拒绝无效假设,认为总体之间有差别的统计学证据越充分。需要注意:不拒绝H0不等于支持H0成立,仅表示现有样本信息不足以拒绝H0。 传统上,通常将P>0.05称为“不显著”,0.0l称为“显著”,P≤0.0l称为“非常显著”。目前有学者主张应尽量使用有无统计学意义进行表述。由于统计软件的应用和普及,最好列出精确的P值,以便对检验结果的可靠性作出准确地判断。
参 考 文 献
[1]徐勇勇.多变量均数假设检验在医学研究中的应用[J].第四军医大学学报.1984年01期. [2]章扬熙.两阶段整群抽样调查的参数估计与假设检验[J].中国卫生统计.1985年04期.
本文来源:https://www.wddqw.com/doc/5e0f83dd996648d7c1c708a1284ac850ac0204c8.html