请选择 进入手机版 | 继续访问电脑版

268 医学和生物统计全过程:研究目的、数据搜集、数据整理、数据分析(做数据统计分析前一定要看)

[复制链接]
268 0
做完一个医学和生物统计分析项目,并成功发表,通常要完成研究目的、数据搜集、数据整理、数据分析四大步骤,如下图:

1研究目的
    确定研究目的是整个统计分析的最核心的内容,就好比无论做多高的建筑,蓝图是最重要的。只有确定了清晰的研究目的,才能进一步去根据目的选取适当的分析方法,具体则需要考虑以下内容:

    首先要确定研究变量(因变量)、影响因子(因变量)、研究目的。而研究目的通常包括以下几点:

    ①总体描述性分析

    ②比较因变量在不同分类分组的差异

    ③研究变量之间的相关关系

    ④考察研究变量与影响因子的关系

    ⑤事件发生的概率评估

    自变量和因变量:

    通常用自变量(研究因素和水平)及因变量进行描述。例如研究降血糖药物和治疗时间对血糖的影响,连续7天用药,测量得到7天的数据并进行分析:研究因素2个(药物和时间)、研究水平7个、因变量1个(血糖)。对于单个因变量,采用单因素分析,如果是多个因变量,采用多元分析。多元分析如果分别采用N个独立的单因素分析其结果可信度将会降低到50%多。

    数据类型按表1进行定义和判别;数据变量的分布则要通软件的模拟分布运算或者查询相关的资料文献来确定,常用到的分布见表2,常用的统计学方法见表3。

   抽样和样本量

    抽样的目的:抽样目的是研究总体的特征,因为总体中的个体间存在误差。正因为个体间存在差别,所以我们会抽取足够的样本量来评估总体特征,同时,评估差异的程度。每种设计方法其样本量的评估都有其公式。反过来说,如果总体中不存在误差或样品的误差对总体研究不存在影响,那就不存在样本量的问题。当我们对我们研究结果进行最后总结时,正规的语言描述应该是:例如,我们认为两个研究总体间不存在统计学差别。总体上讲,如果个体间变异越大,或者我们希望犯错误的概率越低,就需要更大的样本量。

2数据收集
    收集数据要保持数据的完整性,避免信息缺失。应该在设计阶段就要规划出来数据收集方式,并仔细衡量。常见要收集的有以下几点:

    基本信息:身高、体重、BMI、年龄、性别等。

    家族信息:是否有家族遗传史。

    生活习惯信息:是否抽烟、喝酒、睡眠状况及饮食生活习惯改变等等。
疾病信息:血压、糖尿病、心脏病等等常见病影响因子。

    其他的信息:如果是通过问卷调查的方式,则尽量以单选或多选的方式,让答题者更容易理解。

    数据收集通常有如下的几种方法:

    ①询问调查(座谈会、个人访谈、电话调查等);

    ②观察实验(观察、实验);

    ③文献调查(例如年鉴)等。

3数据整理
    对数据进行整理,目的是:为了及时发现信息缺失、核对信息是否真实、是否需要进行修正。以及进行一些针对我们研究目的必要的合并或者转换。
信息缺失:查看信息是否收集完整了,如果存在有缺失值,该缺失值是否会影响到整个分析,少量缺失可以忽略,缺失过多影响到分析结果时,则考虑重新收集或者适当剔除。

    核对信息是否真实:判断是否在收集数据过程中存在笔误、或者受访者表达错误等造成的数据不实。通常我们会设置一些相关题项来检验这种情况的发生。比如设置一题为是否有糖尿病家族病史,再设置一题为你的家属亲人里是否有患有糖尿病的,等后期如果2题回答基本一致,则采用其中一题即可,如果不一致,则说明有不实,考虑重新收集或剔除部分。

    数据修正:对于错误信息,可以进行修正,如果无法修正,该数据可能按照数据缺失进行处理。

4数据分析

    数据分析包括:

    统计描述:就是用最直观的方式将数据的特征呈现出来,采用统计表、统计图、散点图等描述数据的趋势。

    统计推断:由样本信息推断总体信息。

    统计描述

    上文中提到的均值,标准差等指标,中位数、频数、占比等都是统计描述的内容。最直观的描述还要配上统计图。统计图包括直方图、饼图、散点图等等。统计图应该选择最能呈现想表达的内容的那张图。例如,想表现5组身高的差异程度,采用直方图;想表达牛奶中各个营养成分的比例,用饼图最直观;想表达数据的变化趋势或相关性,用散点图。

    统计推断:

    抽样的重要性:抽样是否能代表总体,如果存在较强的特异性,就不能代表总体。这个就要求样本本身的随机性和独立性。
仔细分析个体间差异的来源,除了研究因素会带来个体差异外,是否还有其他因素。

    推断的结果要也要符合一定的逻辑性,饮酒越多越不容易患酒精肝,如果有这个结论,可能是因素没有控制好。

    要注意统计推断工具的应用条件,例如使用T检验要方差齐性。

    今天的课程就到这里,我们会每天更新更多医学和生物统计课程,敬请关注【医学和生物统计】微信公众号哦!



谦瑞数据www.databbs.net

为您提供一站式数据分析服务。

详询客服QQ(微信同号)370666643

关注谦瑞数据、杏花开医学统计微信公众号,赠送一大波数据分析实战视频教程哦!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册  

x

当他人从你分享的链接访问本页面时,你将获得奖励

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

悬赏提问(必答)

搜索

快速提问

悬赏提问(必答)

 
 
在线咨询
提供一站式
数据分析服务
客服QQ/微信号
370666643
微信扫一扫添加客服
快速回复 返回顶部 返回列表