请选择 进入手机版 | 继续访问电脑版

233 生物和医学统计中的假设检验(深度好文,请收藏!)

[复制链接]
233 0
基本概念

    假设的概念:对总体参数(均值、比例等)的具体数值所作的陈述。比如,我认为新的药要先要比原来的更好。

    假设检验(Hypothesis Testing)的概念:在统计学中,为根据一定假设条件,由样本推断总体的一种方法。

    具体又分为以下几个步骤:

a.根据需要对所研究的总体作某种假设,记作H0

b.选取相对合适的统计量

c.规定显著性水平

d.由抽取的样本量,算出统计量,并检验预先定好的显著性水平是否达到,作出拒绝或接受假设H0的判断

5.做出统计决策

    显著性水平:是在进行假设检验时事先确定一个可允许的作为判断界限的小概率临界值。一个概率值,原假设为真时,拒绝原假设的概率。表示为α,常用值为0.01,0.05,0.1。

    举个例子:某医院要来招医务人员,本来实际有500人准备测试,但院方希望最多只有5%的人通过,所以,可能会有500*0.05=25个人进来,显著性水平α,就是允许最多有多大比例通过测试。

基本思想

    假设检验的基本思想是小概率反证法思想。

    小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。

    先提出假设(检验假设H0),再用适当的统计方法计算并验证假设事件发生的概率大小,如果小于一个我们预先定好的临界值,则认为不会发生,拒绝H0假设。但反之,也不能说假设一定成立。

常用方法

原假设与备选假设:

a.准备检验的假设叫做原假设,也叫作0假设,表示为H0。

b.与原假设对立的假设,叫做备选假设

c. 比较的时候,分为等于、大于、小于

检验统计量:

a. 运用合适的软件和方法计算检验统计量

b 根据预定的显著性水平,查表得出相应的临界值

c. 将算出统计量的值与预定显著性水平的值进行比较

d. 得出接受或拒绝0假设的结论

统计中的小概率:

a. 几乎不可能发生的事情发生的概率

b. 小概率事件一旦发生,就有理由拒绝原假设

c.由事先确定的小概率

统计中的 P值:

a. 是一个概率值

b. 如果原假设为真,P-值是抽样分布中大于或小于样本统计计量的概率

c. 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积

d. 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积

单侧与双侧检验

a. 当目标词有不小于的时候用左侧检验。比如:治疗前空腹时间不得少于6小时

b. 当关键词有不大于的时候用右侧检验。比如:不合格率不大于3%

C. 双侧检验,α/2

单侧检验结果:若p值 > α,不拒绝H0;若p值 < α,拒绝H0

双侧检验结果:若p值 > α/2,不拒绝H0;若p值 < α/2,拒绝H0

正确选择检验方法要注意

确定假设检验方法的两大要素:

研究设计:

成组设计:比较男性和女性对某药效的打分

配对设计(2个)/配伍设计(3个):患者在三种治疗方案中选择最满意的一种

复杂的试验设计:拉丁方设计、均匀设计等

变量类型:

连续变量:两组患者红细胞的数量比较

有序变量:疗效结果为优良中差的比较

无序变量:不同性别的血型比较

对自身总体进行推断

连续变量:单样本t检验。如:新药品评分是否达到基本要求

有序分类变量:秩和建议。如治疗效果优良中差的分布是否符合假定情况

无序分类变量:二项分布、卡方分布检验。筛子分布是否均匀;性别比例是否为假定数值

确定假设检验方法的两大要素:

因变量——连续

单个自变量:二分类 t检验
    成组t检验
    配对t检验

单个自变量:多分类
    单因素方差分析
    后续有两两比较问题

单个自变量:连续
    相关分析:考察两量变量在数量上的依存关系
    回归分析:考察一个变量对另一个变量影响程度的大小

多个自变量:分类变量为主
    方差分析模型
    便于两两比较
    有多重图形帮助分析
    自变量间可能有主次之分

多个自变量:连续变量为主 线性回归模型
    本质上和方差分析模型灯架
    可利用散点图、回归线等图形帮助解释
    可用逐步发对自变量进行自动筛选

因变量——有序分类
    当分类数较多时,可按照连续变量处理
    单个自变量时:
    二分类 秩和检验
    多分类 秩和检验
    连续 Logistic回归

多个自变量:
    Logistic回归
    判别分析
    最优尺度分析

因变量——无序分类(含二分类)

单个自变量
    二分类 卡方检验
    多分类 卡方检验
    连续 没有简单模型

多个自变量:
    Logistic回归
    判别分析
    最优尺度分析

简单推断方法总结:

对连续因变量的统计方法是最全面的;

有序分类变量往往都近似当做连续型变量处理,或者退化成无序分类变量处理;

无序分类因变量一般用卡方检验,但结果粗糙,精细分析困难;

复杂的统计模型实际上是让各种变量在拟合时尽量向连续性变量靠拢(变量变换、概率评分)

五、应用

    建立检验假设:如要比较X药和Y药的疗效是否相等,则假设两组样本来自同一总体,X药的总体疗效和Y药相等,差别仅由抽样误差引起的。

    选用适当的统计方法计算原假设成立的可能性即概率有多大,概率用P值表示。(根据实际数据情况选择Z检验,T检验,秩和检验和卡方检验等)

    根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。如果P>0.05,不能否定“差别由抽样误差引起”,接受H0;如果P<0.05或P <0.01,认为差别不由抽样误差引起,拒绝H0,接受另一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册  

x

当他人从你分享的链接访问本页面时,你将获得奖励

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

悬赏提问(必答)

搜索

快速提问

悬赏提问(必答)

 
 
在线咨询
提供一站式
数据分析服务
客服QQ/微信号
370666643
微信扫一扫添加客服
快速回复 返回顶部 返回列表