数据提取是从符合纳入要求的文献中摘录用于系统评价的数据信息,所提取信息必须是可靠、有效、无偏的。一般提取的信息有:研究编号,发表年限,纳入研究者的一般信息,样本量,设计方法,干预/暴露因素,研究类型,研究结局等。
当然了,在提取数据之前,我们首先要了解数据都有哪些类型。
数据的分类:二分类数据、连续型数据、有序数据、计数数据、时间事件数据。不同类型的数据是需要分别提取,分别整合。
数据的提取类型
1)二分类数据:Meta分析中,二分类变量汇总的是发生率、死亡率、有效率这些数据。
所以,对于二分类变量,除了提取研究编号,发表年限,纳入研究者的一般信息外我们还需要收集到:试验组事件数、试验组样本量;对照组事件数和对照组样本量。分别对应试验组的分子和分母;对照组的分子和分母。然后,汇总两组分子和分母,进行分析。
2)连续型数据:如身高、体重、血压、血糖、血脂等,描述这样的数据,需要3个元素:均值、标准差和样本量。所以,对于连续型变量,我们至少需要收集到:试验组的均值、标准差和样本量;对照组的均值、标准差和样本量。然后,汇总两组的均值,进行分析。
3)计数变量:如抛硬币正面朝上的次数,一个患者的心梗次数,一个患者的牙齿脱落次数。
在同一个体上,某事件的重复发生“次数”,这种变量,是计数变量。可以分为两种:罕见事件(心梗)和常见事件(牙齿脱落)
常见事件:发生频繁,可视作连续型数据进行合并。比如在抛硬币实验中,“正面朝上”发生次数,这种变量发生频繁,可以将其视为连续型变量,用“平均数”来进行计算。
罕见事件:发生很少,可视作二分类数据进行合并。比如在糖尿病人群中“心梗”的发生次数,这种计数变量发生较少,可以作为“率”来进行分析。
4)等级变量:等级变量如:轻、中、重;高、中、低;无效、有效、显效等。直接合并这种变量在方法学上还很难实现。所以,当等级少的时候,可将其转化为二分类变量;当等级多的时候,将其视作连续型变量来进行合并。
5)时间事件数据。有事件发生时间的一类数据,如:死亡时间、疾病进展时间,此类数据,可以用logHR及其标准误,合并效应量来计算。
多数情况下,不同类型的数据最终都需要转化为二分类变量或连续型变量进行Meta分析。