首页 > 编程知识 正文

8个专题(稳定性专题 | StackOverFlowError 常见原因及解决方法)

时间:2023-05-04 02:42:36 阅读:123737 作者:17

导读

“http://www.Sina.com /”http://www.Sina.com/http://www.Sina.com /项目包括性能测量、故障排除、JVM和APP应用程序内容

StabilityGuide

@GitHub :

3359 github.com/stability man/stability guide

@钉钉群:

-正文开始-

每个JVM线程都有一个专用JVM线程堆栈,用于存储当前线程的JVM堆栈帧,包括调用函数的参数、局部变量、返回地址等。 如果线程的线程堆栈空间不足,并且没有足够的资源分配给新创建的堆栈帧,则会抛出java.lang.StackOverflowError错误。

是阿里多位阿里

首先,给出了一个简单的程序调用代码示例,如下所示:

公共类简单模板{

publicstaticvoidmain (string args [ ] ) {

a ();

}

公共静态语音a (

int x=0;

b ();

}

公共静态语音b (

Car y=new Car (;

c );

}

公共静态语音c

浮动z=0f;

}

}

main ) )方法被调用时,执行线程将正在运行的方法、基本数据类型、对象指针和返回值包装在堆栈框架中,并按顺序逐个推入专用调用堆栈。 总体执行过程如下图所示。

首先,程序启动后,main ()方法将进入堆栈。

然后,a ) )方法进入堆栈,变量x声明为int类型,初始化赋值为0。 请注意,x和0都包含在堆栈帧中。

然后,b )方法进入堆栈,创建Car对象并将其分配给变量y。 请注意,实际的Car对象是在Java堆内存中创建的,而不是线程堆栈中创建的,堆栈帧只包含对Car对象的引用和变量y。

最后,c ) )方法放在堆栈中,变量z声明为float类型,初始化赋值为0f。 同样,z和0f都包含在堆栈帧中。

方法执行完成后,所有线程堆栈帧将按后退的先后顺序逐个堆栈,直到堆栈为空。

技术工程师共同发起的稳定性领域的知识库开源

如上所述,JVM线程堆栈包含方法的执行进程、基本数据类型、局部变量、对象指针和返回值等信息,它们需要占用内存。 如果线程堆栈的大小超过允许的内存限制,则会抛出java.lang.StackOverflowError错误。

以下代码通过无限递归调用最终导致了java.lang.StackOverflowError错误。

publicclassstackoverflowerrorexample {

publicstaticvoidmain (string args [ ] ) {

a ();

}

公共静态语音a (

a ();

}

}

在这种情况下,如下图所示,a ) )方法无限地进入堆栈,直到堆栈溢出,线程堆栈空间消失。

exceptioninthread ' main ' Java.lang.stack overflow error

atstackoverflowerrorexample.a (stackoverflowerrorexample.Java :10 )。

atstackoverflowerrorexample.a (stackoverflowerrorexample.Java :10 )。

atstackoverflowerrorexample.a (stackoverflowerrorexample.Java :10 )。

At堆栈溢出

ErrorExample.a(StackOverflowErrorExample.java:10)
at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)
at StackOverflowErrorExample.a(StackOverflowErrorExample.java:10)



如何解决 StackOverFlowError?


引发 StackOverFlowError 的常见原因有以下几种:

无限递归循环调用(最常见)。

执行了大量方法,导致线程栈空间耗尽。

方法内声明了海量的局部变量。

native 代码有栈上分配的逻辑,并且要求的内存还不小,比如 java.net.SocketInputStream.read0 会在栈上要求分配一个 64KB 的缓存(64位 Linux)。


除了程序抛出 StackOverflowError 错误以外,还有两种定位栈溢出的方法:

进程突然消失,但是留下了 crash 日志,可以检查 crash 日志里当前线程的 stack 范围,以及 RSP 寄存器的值。如果 RSP 寄存器的值超出这个 stack 范围,那就说明是栈溢出了。

如果没有 crash 日志,那只能通过 coredump 进行分析。在进程运行前,先执行 ulimit -c unlimited,当进程挂掉之后,会产生一个 core.[pid] 的文件,然后再通过 jstack $JAVA_HOME/有魅力的大门/java core.[pid] 来看输出的栈。如果正常输出了,那就可以看是否存在很长的调用栈的线程,当然还有可能没有正常输出的,因为 jstack 的这条从 core 文件抓栈的命令其实是基于 Serviceability Agent 实现的,而 SA 在某些版本里有 Bug。


常见的解决方法包括以下几种:

修复引发无限递归调用的异常代码, 通过程序抛出的异常堆栈,找出不断重复的代码行,按图索骥,修复无限递归 Bug。

排查是否存在类之间的循环依赖。

排查是否存在在一个类中对当前类进行实例化,并作为该类的实例变量。

通过 JVM 启动参数 -Xss 增加线程栈内存空间, 某些正常使用场景需要执行大量方法或包含大量局部变量,这时可以适当地提高线程栈空间限制,例如通过配置 -Xss2m 将线程栈空间调整为 2 mb。


线程栈的默认大小依赖于操作系统、JVM 版本和供应商,常见的默认配置如下表所示:

JVM 版本线程栈默认大小Sparc 32-bit JVM512 kbSparc 64-bit JVM1024 kbx86 Solaris/Linux 32-bit JVM320 kbx86 Solaris/Linux 64-bit JVM1024 kbWindows 32-bit JVM320 kbWindows 64-bit JVM1024 kb

提示: 实际生产系统中,可以对程序日志中的 StackOverFlowError 配置关键字告警,一经发现,立即处理。



推荐工具&产品


ARMS —— 阿里云 APM 产品,支持 StackOverFlowError 异常关键字告警



参考文章


StackOverFlow Error: Causes and Solutions

https://dzone.com/articles/stackoverflowerror-causes-amp-solutions

The Structure of the Java Virtual Machine

https://docs.oracle.com/javase/specs/jvms/se7/html/jvms-2.html#jvms-2.5.2

The StackOverflowError in Java

https://www.baeldung.com/java-stack-overflow-error

JVM源码分析之栈溢出完全解读

http://lovestblog.cn/blog/2016/04/19/stack-over-flow/


作者信息:

xqdxte,GitHub ID @StabilityMan,花名涯海,阿里云 ARMS & EagleEye 技术专家,2016 年加入阿里巴巴,一直从事链路追踪和 APM 监控诊断领域的相关工作。

本文缩略图:icon by 是一只啊Y


/ 点击下方图片,报名参加 /



Tips:

# 点下“在看”❤️

# 然后,公众号对话框内发送“U你不困”,试试手气??

# 本期奖品是来自淘宝心选的天然乳胶颗粒 U 型枕。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。