JVM 内存结构 -Java8
JVM 内存结构 -Java8
参考《Java 虚拟机规范》
总览图:
注意蓝色部分为单个线程私有,深黄色部分为所有线程共享
很多开发人员会把 Java 内存分为堆内存(Heap)和栈内存(Stack),这种划分的流行只能说明大多数开发人员最关注、与对象内存分配关系最密切的内存区域是这两块。实际上 Java 内存区域的划分远比这要复杂。
JVM 内存与本地内存的区别
Java 虚拟机在执行的时候会把管理的内存分配成不同的区域,这些区域被称为虚拟机内存,同时,对于虚拟机没有直接管理的物理内存,也有一定的利用,这些被利用却不在虚拟机内存数据区的内存,我们称它为本地内存,这两种内存有一定的区别:
JVM 内存
- 受虚拟机内存大小的参数控制,当大小超过参数设置的大小时就会报 OOM
本地内存 - 本地内存不受虚拟机内存参数的限制,只受物理内存容量的限制
- 虽然不受参数的限制,但是如果内存的占用超出物理内存的大小,同样也会报 OOM
java 运行时数据区域(上图中的所有部分)
java 虚拟机在执行过程中会将所管理的内存划分为不同的区域,有的随着线程产生和消失,有的随着 java 进程产生和消失,根据《Java 虚拟机规范》的规定,运行时数据区分为以下几个区域:
程序计数器(Program Counter Register)
程序计数器就是当前线程所执行的字节码的行号指示器,通过改变计数器的值,来选取下一行指令,通过他来实现跳转、循环、恢复线程等功能。每个线程都有独立的程序计数器,用来在线程切换后能恢复到正确的执行位置,各条线程之间的计数器互不影响,独立存储。所以它是一个“线程私有”的内存区域。还记得线程的 wait 和 notify 吗,就是通过这个实现的。
在任何时刻,一个处理器内核只能运行一个线程,多线程是通过线程轮流切换,分配时间来完成的,这就需要有一个标志来记住每个线程执行到了哪里,这里便需要到了程序计数器。
所以,程序计数器是线程私有的,每个线程都已自己的程序计数器。
虚拟机栈(JVM Stacks)
虚拟机栈是线程私有的,随线程生灭。虚拟机栈描述的是线程中的方法的内存模型:
每个方法被执行的时候,都会在虚拟机栈中同步创建一个栈帧(stack frame)。每个栈帧的包含如下的内容:
- 局部变量表
- 局部变量表中存储着方法里的 java 基本数据类型(byte/boolean/char/int/long/double/float/short)以及对象的引用(注:这里的基本数据类型指的是方法内的局部变量)
- 操作数栈
- 动态连接
- 方法返回地址
方法被执行时入栈,执行完后出栈
虚拟机栈可能会抛出两种异常:
- 如果线程请求的栈深度大于虚拟机所规定的栈深度,通过
-Xss
控制 参考 Java最深调用栈有多大,则会抛出 StackOverFlowError 即栈溢出 - 如果虚拟机的栈容量可以动态扩展,那么当虚拟机栈申请不到内存时会抛出 OutOfMemoryError 即 OOM 内存溢出
本地方法栈(Native Method Stacks)
本地方法栈与虚拟机栈的作用是相似的,都会抛出 OutOfMemoryError 和 StackOverFlowError,都是线程私有的,主要的区别在于:
- 虚拟机栈执行的是 java 方法
- 本地方法栈执行的是 native 方法
什么是 Native 方法?
由于 java 是一门高级语言,离硬件底层比较远,有时候无法操作底层的资源,于是,java 添加了 native 关键字,被 native 关键字修饰的方法可以用其他语言重写,这样,我们就可以写一个本地方法,然后用 C 语言重写,这样来操作底层资源,不同的底层就是用不同的 native 实现。当然,这样的结果就是,native 方法用得越多,系统的可移植性就越低,这是需要注意的。虚拟机栈为虚拟机执行 Java 方法(字节码)服务,而本地方法栈就是为虚拟机使用到的 Native 方法服务的。
Java 堆(Java Heap)
java 堆是 JVM 内存中最大的一块,由所有线程共享,是由垃圾收集器管理的内存区域,主要存放对象实例,当然由于 java 虚拟机的发展,堆中也多了许多东西,现在主要有:
- 对象实例
- 类初始化生成的对象
- 基本数据类型的数组也是对象实例
- 字符串常量池
- 字符串常量池原本存放于方法区,jdk7 开始放置于堆中。
- 字符串常量池存储的是 string 对象的直接引用,而不是直接存放的对象,是一张 string table
- 静态变量
- 静态变量是有 static 修饰的变量,jdk7 时从方法区迁移至堆中
- 线程分配缓冲区(Thread Local Allocation Buffer)
- 线程私有,但是不影响 java 堆的共性
- 增加线程分配缓冲区是为了提升对象分配时的效率
java 堆既可以是固定大小的,也可以是可扩展的(通过参数-Xmx
和-Xms
设定),如果堆无法扩展或者无法分配内存时也会报 OOM。
堆内存的详细划分看 JVM-GC过程
方法区 (Method Area)
方法区绝对是网上所有关于 java 内存结构文章争论的焦点,因为方法区的实现在 java8 做了一次大革新,现在我们来讨论一下:
方法区是所有线程共享的内存,在 java8 以前是放在 JVM 内存中的,由永久代实现,受 JVM 内存大小参数的限制,在 java8 中移除了永久代的内容,方法区由元空间 (Meta Space) 实现,并直接放到了本地内存中,不受 JVM 参数的限制(当然,如果物理内存被占满了,方法区也会报 OOM),并且将原来放在方法区的字符串常量池和静态变量都转移到了 Java 堆中,方法区与其他区域不同的地方在于,方法区在编译期间和类加载完成后的内容有少许不同,不过总的来说分为这两部分:
- 类元信息(Klass)
- 类元信息在类编译期间放入方法区,里面放置了类的基本信息,包括类的版本、字段、方法、接口以及常量池表(Constant Pool Table)
- 常量池表(Constant Pool Table)存储了类在编译期间生成的字面量、符号引用 (什么是字面量?什么是符号引用?JVM内存结构-Java8#什么是字面量?什么是符号引用?),这些信息在类加载完后会被解析到运行时常量池中
- 运行时常量池(Runtime Constant Pool)
- 运行时常量池主要存放在类加载后被解析的字面量与符号引用,但不止这些
- 运行时常量池具备动态性,可以添加数据,比较多的使用就是 String 类的 intern() 方法
直接内存
直接内存位于本地内存,不属于 JVM 内存,但是也会在物理内存耗尽的时候报 OOM,所以也讲一下。
在 jdk1.4 中加入了 NIO(New Input/Output)类,引入了一种基于通道(channel)与缓冲区(buffer)的新 IO 方式,它可以使用 native 函数直接分配堆外内存,然后通过存储在 java 堆中的 DirectByteBuffer 对象作为这块内存的引用进行操作,这样可以在一些场景下大大提高 IO 性能,避免了在 java 堆和 native 堆来回复制数据。
关于 NIO,请看 Java的NIO
变量的存放位置
类变量/静态变量
类变量是用 static 修饰符修饰,定义在方法外的变量,随着 java 进程产生和销毁,在 java8 之前把静态变量存放于方法区,在 java8 时存放在堆中。
成员变量
成员变量是定义在类中,但是没有 static 修饰符修饰的变量,随着类的实例产生和销毁,是类实例的一部分,由于是实例的一部分,在类初始化的时候,从运行时常量池取出直接引用或者值,与初始化的对象一起放入堆中。
局部变量
局部变量是定义在类的方法中的变量,在所在方法被调用时放入虚拟机栈的栈帧中,方法执行结束后从虚拟机栈中弹出,所以存放在虚拟机栈中
final 修饰的常量
final 关键字并不影响在内存中的位置,具体位置请参考上一问题。
常见的几个常量池的关系
类常量池与运行时常量池都存储在方法区,而字符串常量池在 jdk7 时就已经从方法区迁移到了 java 堆中。(注意类常量池和类变量不是同一个概念,类常量池存放的是编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入运行时常量池中存放,看 5 小节)
在类编译过程中,会把类元信息放到方法区,类元信息的其中一部分便是类常量池,主要存放字面量和符号引用,而字面量的一部分便是文本字符,在类加载时将字面量和符号引用解析为直接引用存储在运行时常量池;(汇总起来,供所有线程使用)
对于文本字符来说,它们会在解析时查找字符串常量池,查出这个文本字符对应的字符串对象的直接引用,将直接引用存储在运行时常量池;字符串常量池存储的是字符串对象的引用,而不是字符串本身。
什么是字面量?什么是符号引用?
字面量
字面量就是在编译时对于数据的一种表示:
int a=1;//这个 1 便是字面量
String b="iloveu";//iloveu 便是字面量
符号引用
由于在编译过程中并不知道每个类的地址,因为可能这个类还没有加载,所以 java 代码在编译过程中是无法构建引用的,如果你在一个类中引用了另一个类,那么你完全无法知道他的内存地址,那怎么办,我们只能用他的类名作为符号引用,在类加载完后用这个符号引用去获取他的内存地址。所以类信息里通常包含着对其它类的符号应用。
例子:我在 com.demo.Solution 类中引用了 com.test.Quest,那么我会把 com.test.Quest 作为符号引用存到类常量池,等类加载完后,拿着这个引用去方法区找这个类的内存地址。