筛斗数据：数据提取的数据类型

348 阅读 0 评论 1 点赞

数据提取是从符合纳入要求的文献中摘录用于系统评价的数据信息，所提取信息必须是可靠、有效、无偏的。一般提取的信息有：研究编号，发表年限，纳入研究者的一般信息，样本量，设计方法，干预/暴露因素，研究类型，研究结局等。

当然了，在提取数据之前，我们首先要了解数据都有哪些类型。

数据的分类：二分类数据、连续型数据、有序数据、计数数据、时间事件数据。不同类型的数据是需要分别提取，分别整合。

数据的提取类型

1）二分类数据：Meta分析中，二分类变量汇总的是发生率、死亡率、有效率这些数据。

所以，对于二分类变量，除了提取研究编号，发表年限，纳入研究者的一般信息外我们还需要收集到:试验组事件数、试验组样本量;对照组事件数和对照组样本量。分别对应试验组的分子和分母;对照组的分子和分母。然后，汇总两组分子和分母，进行分析。

2）连续型数据：如身高、体重、血压、血糖、血脂等，描述这样的数据，需要3个元素:均值、标准差和样本量。所以，对于连续型变量，我们至少需要收集到:试验组的均值、标准差和样本量;对照组的均值、标准差和样本量。然后，汇总两组的均值，进行分析。

3）计数变量：如抛硬币正面朝上的次数，一个患者的心梗次数，一个患者的牙齿脱落次数。

在同一个体上，某事件的重复发生“次数”，这种变量，是计数变量。可以分为两种:罕见事件(心梗)和常见事件(牙齿脱落)

常见事件:发生频繁，可视作连续型数据进行合并。比如在抛硬币实验中，“正面朝上”发生次数，这种变量发生频繁，可以将其视为连续型变量，用“平均数”来进行计算。

罕见事件:发生很少，可视作二分类数据进行合并。比如在糖尿病人群中“心梗”的发生次数，这种计数变量发生较少，可以作为“率”来进行分析。

4）等级变量：等级变量如:轻、中、重；高、中、低；无效、有效、显效等。直接合并这种变量在方法学上还很难实现。所以，当等级少的时候，可将其转化为二分类变量;当等级多的时候，将其视作连续型变量来进行合并。

5）时间事件数据。有事件发生时间的一类数据，如:死亡时间、疾病进展时间，此类数据，可以用logHR及其标准误，合并效应量来计算。

多数情况下，不同类型的数据最终都需要转化为二分类变量或连续型变量进行Meta分析。

点赞(1) 打赏