辅助生殖临床数据特点:每个研究对象可能有多个周期。
例如研究首次取卵时的年龄和活产的关系研究设计:队列
数据结构(1)每个人(ID)有多个周期(cycle),重复测量了多个周期
()每个人周期数可以不同
()同一个人的基线指标相同:例如不孕类型
()允许缺失(记录为NA或空白)
ID=1的人做了个周期,首次取卵时年龄为8,第二个周期有活产。
“纵向数据”好处是更灵活:更符合临床实际情况:患者周期数不同、各指标在变化。就像记流水账一样,客观记录每个周期的情况即可。
数据分析方法常规方法:只纳入第一次周期的数据进行分析,简单,损失数据信息,可能导致选择偏性。或者纳入多个周期,进行最佳和保守估计,看两种极端情况下结果是否一致。考虑重复测量的方法:将所有周期都纳入,好处是减少只纳入第一次周期可能带来的选择偏性。Mayreducebiasoverfirst-cycleonlyapproaches。多个周期(重复测量)推荐使用的统计方法:
广义相加混合模型(Generalizedadditivemixedmodel,GAMM)
广义估计方程(Generalizedestimatingequation,GEE)
通常GAMM和GEE的分析结果是一致的,然而数据分布会影响不同统计方法的结果,建议结合研究假设和数据特征进行选择。
软件操作下载练习数据CYC.xls.链接: