首页 > 编程知识 正文

混合线性模型实例,处理效应模型stata实例

时间:2023-05-06 20:00:41 阅读:58344 作者:2808

原文链接: http://tecdat.cn/p=23050原文来源:拓端数据部落公众号

本文用r语言对数据进行线性混合效应模型拟合,使你的结果可视化。

线性混合效应模型用于具有随机效应的情况,随机效应发生在多次测量随机采样单位的情况下。 来自同一自然组的测量结果本身不是独立的随机样本。 因此,假设这些单位或组是从一个组的“人口”中随机提取的。 例如,可能存在以下情况

分割mgdhf,对各部分进行单独实验时(随机组)。 mgdhf的采样设计是嵌套的,例如横截面内的四分仪; 林地横断面; 区域内林地(横断面、林地、区域均为随机组)。 mgdhf测定相关个体时(家庭为随机组)。 mgdhf在反复测量受试者的情况下(受试者为随机组)。 混合效应的线性模型通过r命令lme4和lmerTest软件包实现。 另一个选择是使用nmle包中的lme方法。 在lme4中计算近似自由度的方法比nmle分组的方法更准确,尤其是在样本量较小时。

第一个测量斑块长度的数据集是从Griffith和Sheldon(2001年,《动物行为学》 61:987-993 )的论文中提取的,是瑞典哥特兰岛30只雄性领袖鹞鹰的白色这个斑块对吸引配偶很重要,但其大小每年都有变化。 我在这里的目标是估计斑块的长度(毫米)。

读取数据和从检查文件读取数据。 查看数据的前几行,查看是否正确加载。 在两年的研究中绘制显示一只鸟和一只鸟的测量图。 请尝试创建位图。 有证据表明不同年份有测量变异吗?

建立线性混合效应模型对数据进行线性混合效应模型,将单一鸟类视为随机组。 注:每只鸟的两次测定均在研究连续年份进行。 为了简单起见,模型不包括年份。 用r转换为字符或系数,避免将其视为数字变量。 如以下步骤(2)和(3)中说明的那样,使用该模型重新计算再现性。 重复性的解释会有什么变化? 从保存的lmer对象中提取参数估计值(系数)。 检查随机效果的输出。 随机变异的两个来源是什么? 固定效果是什么? 输出检查随机效果的标准偏差。 标准偏差应该有两个。 一个是“(截距)”,另一个是“残差”。 这是因为混合效应模型有两个随机变异的来源:鸟类内部重复测量的差异和鸟类间额斑长度的真正差异。 这两个源中哪个对应于“(截距)”,哪个对应于“残差”? 同时检查固定效果结果的输出。 模型表达式的唯一固定效果是所有长度测量的平均值。 这叫“切片”,但不要和随机效应的切片混淆。 固定效果输出到你的平均值估计值和该估计值的标准误差中。 请注意固定效果输出如何提供平均值估计,而随机效果输出提供方差(或标准偏差)估计。 从拟合模型中提取方差分量,估计各年斑块长度的再现性*。 说明前一步获得的重复测量结果。 重复性小于1.0时,体内测量结果之间的变化来源是什么? 只有测量误差吗? 生成残差和拟合值的图表。 你注意到有什么问题吗? 似乎有一点积极的倾向。 这不是错误,而是最佳线性无偏振预测器(BLUPs )“收缩”的结果。

分析步骤

读取并检查数据。

头(syd qz ) )。

#位图chart (路径到bird ) )。

#但是,显示配对数据的更好方法是在配对交互图中显示plot(RES=patch,x=year )

#优化版本plot(y=patch,x=factor(year ),theme_classic () ) ) ) ) ) ) )。

拟合线性混合效应模型。 摘要) )的输出显示两个随机变异的来源:单一鸟类之间的变异(鸟类切片)和对同一鸟类重复测量之间的变异(残差)。 每个源都有估计的方差和标准差。 固定效应只是所有鸟类平均值的另一个“切片”。

# 1.混合效应模型# 2.参数估计摘要(z )

# 5.分散成分varcorr(z ) )

#再现性1.11504^2/(1.11504^20.59833^2) ## [1] 0.7764342 # 7.残差与拟合值的关系图plot(z ) ) ) ) )。

金鱼的视觉

Cronly-Dillon和muntz(1965; J. Exp. Biol 42: 481-493 )用视运动反应测定金鱼色觉。 在此拟合数据,包括测试的所有波长。 五条鱼中的每条鱼都按随机顺序在所有波长下进行了测试。 灵敏度值大,表明鱼能检测出较低的光强度。 视运动反应的一个重要特征是鱼不熟悉,一个波长下视觉灵敏度的测量不易影响后来另一个波长下的测量。

读取并检查数据读取文件中的数据,并查看前几行以确保正确读取。 为了比较个体鱼在不同光波长实验中的反应,使用了相互作用图。 你用什么类型的实验设计? *这决定了匹配数据时使用的线性混合模型。

建立线性混合效应模型,并对数据拟合线性混合效应模型。 可以用lmer ()实现。 找到“畸形拟合”,然后选择“边界(单一)拟合: see? isSingular

"绘制拟合(预测)值

**。每条鱼的预测值和观察值之间的差异代表残差。你在(1)中做了什么假设?创建一个残差与拟合值的图,以检查这些假设之一。从保存的lmer对象中提取参数估计值。检查固定效应的结果。给出的系数与使用lm分析的分类变量的解释相同。检查随机效应的输出。我们的混合效应模型中再次出现了两个随机误差的来源。它们是什么?其中哪个对应于输出中的"(截距)",哪个对应于 "残差"?注意,在这个数据集中,其中一个变化源的估计标准差非常小。这就是畸形拟合信息背后的原因。鱼类之间的方差不太可能真的为零,但是这个数据集非常小,由于抽样误差,可能会出现低方差估计。生成基于模型的每个波长的平均敏感度的估计。各个波长之间的差异是否显著?生成lmer对象的方差分析表。这里测试的是什么效应,随机效应还是固定效应?解释方差分析结果。

*这是一个 "按实验对象 "的重复测量设计,因为每条鱼在每个实验下被测量一次。它本质上与随机完全区块设计相同(把每条鱼看作是 "区块")。

*可视化是首选,因为数据和拟合值都被绘制出来。请注意鱼与鱼之间的预测值是多么的相似。这表明在这项研究中,个体鱼之间的估计差异非常小。

***一般来说,在方差分析表中只测试固定效应。使用测试随机效应中没有方差的无效假设是可能的。

分析步骤

读取并检查数据。

x <- read.csv("fish.csv", stringsAsFactors = FALSE)head(x)

拟合一个线性混合效应模型。

该模型假设所有拟合值的残差为正态分布,方差相等。该方法还假设个体鱼之间的随机截距为正态分布。该方法还假设组(鱼)的随机抽样,对同一鱼的测量之间没有影响。

# # 1. 拟合混合效应模型。 ## boundary (singular) fit: see ?isSingular

# 2. 这就为每条鱼分别绘制了拟合值。vis(z)

 

# 3.测试假设plot(z)

# 4. 提取参数估计值summary(z)

# 6. 基于模型的平均敏感度估计 means(z)

# 7. ANOVA方差分析

蓍草酚类物质的浓度

项目实验性地调查了国家公园的北方森林生态系统中施肥和食草的影响(Krebs, C.J., Boutin, S. & Boonstra, R., eds (2001a) Ecosystem dynamics of the Boreal Forest.Kluane项目. 牛津大学出版社,纽约)) ,目前的数据来自于一项关于植物资源和食草动物对底层植物物种防御性化学的影响的研究。

16个5x5米的小区中的每一个都被随机分配到四个实验之一。1)用栅栏围起来排除食草动物;2)用N-P-K肥料施肥;3)用栅栏和施肥;4)未实验的对照。然后,16块地中的每一块被分成两块。每块地的一侧(随机选择)在20年的研究中持续接受实验。每块地的另一半在头十年接受实验,之后让它恢复到未实验的状态。这里要分析的数据记录了欧蓍草(Achillea millefolium)中酚类物质的浓度(对植物防御化合物的粗略测量),欧蓍草是地块中常见的草本植物。测量单位是每克干重毫克丹宁酸当量。

可视化数据 从文件中读取数据。检查前几行的数据。实验是作为一个有四个层次的单一变量给出的(而不是作为两个变量,围墙和肥料,用2x2因子设计的模型)。持续时间表示半块土地是否接受了整整20年的实验,或者是否在10年后停止实验。变量 "ch "是蓍草中酚类物质的浓度。画一张图来说明不同实验和持续时间类别中蓍草中的酚类物质的浓度。在每个实验和持续时间水平的组合中没有很多数据点,所以按组画条形图可能比按组画箱形图更好。添加线段来连接成对的点。

拟合一个线性混合效应模型 使用的是什么类型的实验设计?*这将决定对数据的线性混合模型的拟合。在没有实验和持续时间之间的交互作用的情况下,对数据进行线性混合模型拟合。使用酚类物质的对数作为因变量,因为对数转换改善了数据与线性模型假设的拟合。可视化模型对数据的拟合。按持续时间(如果xvar是实验)或实验(如果xvar是持续时间)分开面板。visreg()不会保留配对,但会允许你检查残差。现在重复模型拟合,但这次包括实验和持续时间之间的相互作用。将模型与数据的拟合情况可视化。两个模型拟合之间最明显的区别是什么,一个有交互作用,另一个没有?描述包括交互项的模型 "允许 "什么,而没有交互项的模型则不允许。判断,哪个模型最适合数据?使用诊断图检查包括交互项的模型的线性混合模型的一个关键假设。使用拟合模型对象估计线性模型的参数(包括交互作用)。请注意,现在固定效应表中有许多系数。在上一步的输出中,你会看到 "随机效应 "标签下的 "Std.Dev "的两个数量。解释一下这些数量指的是什么。来估计所有固定效应组合的模型拟合平均值。生成固定效应的方差分析表。哪些项在统计学上是显著的?默认情况下,lmerTest将使用Type 3的平方和来测试模型项,而不是按顺序(Type 1)。用类型1来重复方差分析表。结果有什么不同吗?**

*实验采用了分块设计,即整个块被随机分配到不同的实验,然后将第二种实验(持续时间)的不同水平分配到块的一半。

*应该没有差别,因为设计是完全平衡的。

分析步骤

阅读并检查数据。

一个好的策略是对实验类别进行排序,把对照组放在前面。这将使线性模型的输出更加有用。

# 1. 读取数据# 2. 检查head(x)

# 3. 分组带状图# 首先,重新排列实验类别factor(treat,levels=c("cont","exc","fer","bo"))plot(data = x, y = log(phe), x = treat, fill = dura, color = dura)

# 4. 在多个面板上分别绘制成对的数据plot(data = x,y = log(ach, x = dur, fill = dur, col = dur)

拟合一个线性混合效应模型。固定效应是 "实验 "和 "持续时间",而 "块"是随机效应。拟合交互作用时,实验水平之间的差异大小在持续时间水平之间会有所不同。

由于随机效应也存在(块),系数表将显示两个随机变化来源的方差估计。一个是拟合模型的残差的方差。第二个是(随机)块截距之间的方差。

# 2. 拟合混合效应模型-无交互作用 # 3. 可视化vis(z)

# 4. 包括交互项和再次视觉化z.int <- lmer(log(phen.ach) ~ treatment * duration + (1|plot), data=x)vis(z.int, overlay = TRUE)

# 5. 绘制图表以检验方差齐性(以及正态性)plot(z)

# 6. 系数summary(z)

# 8. 模型拟合平均值means(z, data = x)

# 9. 方差分析表anova(z) # lmerTest中默认为3类平方和。

# 10. 改为1类anova(z, type = 1)

最受欢迎的见解

1.基于R语言的lmer混合线性回归模型

2.R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

3.R语言线性混合效应模型实战案例

4.R语言线性混合效应模型实战案例2

5.R语言线性混合效应模型实战案例

6.线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样

7.R语言LME4混合效应模型研究教师的受欢迎程度

8.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

9.使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。