并发编程之Java内存模型

Java内存模型基础，主要介绍内存模型相关基本概念
Java内存模型中的顺序一致性，主要介绍重排序与顺序一致性内存模型
同步原语，主要介绍三个同步原语(synchronized、volatile和final)的内存语义及重排序规则在处理器中的实现
Java内存模型的设计，主要介绍Java内存模型的设计原理，及其与处理器内存模型和顺序一致性内存模型的关系。

一、Java内存模型的基础

1.1 并发编程模型的两个关键问题

在并发编程中需要处理两个关键问题：线程之间如何通信及线程之间如何同步（这里的线程是指并发执行的活动实体）。

通信——线程之间以何种机制来交换信息。在命令式编程中，线程之间的通信机制有两种：共享内存和消息传递。

共享内存：线程之间共享程序的公共状态，通过读写内存中的公共转台进行隐式通信
消息传递：线程之间没有公共状态，线程之间必须通过发送消息来显式进行通信

同步——程序中用于控制不同线程键操作发生相对顺序的机制。

共享内存：同步是显式进行的，由于程序员必须显式指定某个方法或某段代码需要在线程之间互斥执行
消息传递：同步是隐式进行的，由于消息的发送必须在消息的接收之前。

总结：

Java的并发采用的是共享内存模型，Java线程之间的通信总是隐式进行，整个通信过程对程序员完全透明，如果编写多线程程序的Java程序员不理解隐式进行线程之间的通信的工作机制，很可能会遇到各种奇怪的内存可见性问题。

1.2 Java内存模型的抽象结构

Java中所有的实例域、静态域和数组元素都存储在堆内存中，堆内存在线程之间共享（文章中用“共享变量”指代）。局部变量(Local Variables)、方法定义参数(Formal Method Parameters)和异常处理器参数(Exception Handler Parameters)不会在线程之间共享，它们不会存在内存可见性问题，因此也不受内存模型的影响。
Java线程之间的通信由Java内存模型(JMM)控制，JMM决定一个线程对共享变量的写入何时对另一个线程可见。从抽象的角度来看，JMM定义了线程和主内存之间的抽象关系：线程之间的共享变量存储在主内存中，每个线程都有一个私有的本地内存(Local Memory)，本地内存中存储了该线程以读/写共享变量的副本。本地内存时JMM的一个抽象概念，并不真实存在。JMM涵盖了缓存、写缓冲区、寄存器以及其他的硬件和编译器优化。

图示：Java内存模型的抽象示意图

并发编程之Java内存模型

从上图来看，线程A和线程B之间要通信的话，必须经历下面2个步骤。

线程A把本地内存A中更新过的变量刷新到主内存中
线程B到主内存中去读取线程A之前已更新过的共享变量

图示：线程之间通信示意图

并发编程之Java内存模型

如上图所示，本地内存A和本地内存B有主内存中共享变量X的副本。假设初始时，这三个内存中的X的值都是0.线程A在执行时，把更新后的X的值（假设值为1）临时存放在自己的本地内存A中。当线程A和线程B需要通信是，线程A首先把自己本地内存中修改后的X刷新到主内存中，此时主内存中的X值变为了1.随后，线程B到主内存中去读取线程A更新后的X值，此时线程B的本地内存X的值也更新成了1。
从整体来看，这两个步骤实质上是线程A在向线程B发送消息，而且这个通信过程必须要经过主内存。JMM通过控制主内存与每个线程的本地内存之间的交互，来为Java程序员提供内存可见性保证。

1.3 从源代码到指令重排序

在执行程序时，为了提高性能，编译器和处理器常常会对指令做重排序。重排序分为三种类型：

编译器优化的重排序。编译器在不改变单线程程序语义的前提下，可以重新安排语句的执行顺序。
指令级并行的重排序。现代处理器采用了指令级并行技术(Instruction-Level Parallelism,ILP)来将对跳指令重叠执行。如果不存在数据依赖性，处理器可以改变语句对应及其指令的执行顺序。
内存系统的重排序。由于处理器使用缓存和读/写缓冲区，这使得加载和存储操作看上去可能是在乱序执行。

从Java源代码的最终实际执行的指令序列，会分别经历下面3种重排序，其中1属于编译器重排序，2和3属于处理器重排序。

源代码到最终执行的指令序列示意图：

并发编程之Java内存模型

重排序可能会导致多线程程序出现内存可见性问题，对于编译器，JMM的编译器重排序规则会禁止特定类型的编译器重排序（不是所有的编译器重排序都需要禁止）。对于处理器重排序，JMM的处理器重排序规则会要求Java编译器在生成指令序列时，插入特定类型的内存屏障（Memory Barries, Intel称之为Memory Fence）指令，通过内存屏障指令来禁止特定类型的处理器重排序。
JMM属于语言级的内存模型，它确保在不同的编译器和不同的处理器平台之上，通过禁止特定类型的编译器重排序和处理器重排序，为程序员提供一致的内存可见性保障。

1.4 写缓冲区和内存屏障

1.4.1 写缓冲区

现代处理器都会使用写缓冲区临时保存向内存中写入的数据。写缓冲区的主要作用：

可以保证指令流水线持续运行，可以避免由于处理器停顿下来等待向内存写入数据而产生的延迟。
它以批处理的方式方式刷新写缓冲区，以及合并写缓冲区中对统一地址的多次写，减少对内存总线的占用。

常见处理器允许的重排序类型（Y-表示允许两个操作重排序，N-表示处理器不允许两个操作重排序）

处理器 \规则	Load-Load	Load-Store	Store-Store	Store-Load	数据依赖性
SPARC-TSO	N	N	N	Y	N
x86	N	N	N	Y	N
IA64	Y	Y	Y	Y	N
PowerPC	Y	Y	Y	Y	N

说明：常见处理器都允许Store-Load重排序；常见的处理器都不允许对存在数据依赖性的操作做重排序。N多的表示处理器拥有相对较强的处理器内存模型。

由于写缓冲器仅仅只对它所在的处理器可见，这个特性会对内存操作的执行顺序产生非常重要的影响：处理器对内存的读/写操作的执行顺序，不一定与内存实际发生的读/写操作顺序一致。

举例说明：

示例项目 \处理器	Processor A	Processor B
伪代码	a=1; //A1x=b;//A2	b=2;//B1y=a;//B2
可能运行结果	初始状态：a=b=0;处理器允许执行后得到结果：x=y=0;

假设处理器A和处理器B按程序的顺序并行执行内存访问，最终可能得到x=y=0的结果，具体原因如下：

处理器和内存交互：

并发编程之Java内存模型

说明：处理器A和处理器B可以同时把共享变量写入自己的写缓冲区（A1、B1），然后从内存中读取另一个共享变量（A2、B2），最后才把自己写缓冲区中保存的脏数据刷新到内存中（A3、B3）。当以这种时序执行时，程序就可以得到x=y=0结果。

1.4.2 内存屏障

为了保证内存可见性，Java编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。

JMM把内存屏障指令分为4类：

屏障类型	指令示例	说明
LoadLoad Barriers	Load1;LoadLoad;Load2	确保Load1数据的装载先于Load2及所有后续装载指令的装载
StoreStore Barriers	Store1;StoreStore;Store2	确保Store1数据对其他处理器可见（刷新到主内存）先于Store2及所有后续存储指令的存储
LoadStore Barriers	Load1;LoadStore;Store2	确保Load1数据装载先于Store2及后续的存储指令刷新到内存
StoreLoad Barriers****	Store1;StoreLoad;Load2	确保Store1数据对其他处理器变得可见（指刷新到主内存）先于Load2及所有后续装载指令的装载。StoreLoad Barriers会使该屏障之前的所有内存访问指令（存储和装载指令）完成之后，才执行屏障之后的内存访问指令。

StoreLoad Barriers是一个“全能型屏障”，它同时具有其它3个屏障的效果。现代大多数处理器支持该屏障（其他类型的屏障不一定被所有处理器支持）。执行该屏障开销会很昂贵，因为处理器需要把缓冲区的内容全部刷新到内存中（Buffer Fully Flush）。

1.5 happens-before 简介

从JDK1.5开始，Java使用新的JSR-133内存模型。JSR-133使用happens-before的概念来阐述操作之间的内存可见性。在JMM中，如果一个操作的结果需要对另一个操作可见，那么这两个操作之间必须存在happens-before关系。这里的两个操作可以是单线程也可以是多线程。

happens-before规则：

程序顺序规则：一个线程中的每个操作，happens-before于该线程的任意后续操作。
监视器锁规则：对于一个锁的解锁，happens-before于随后对这个锁的加锁。
volatile变量规则：对于一个volitale域的写，happens-before于任意后续对这个volatile域的读。
传递性：如果A happens-before B，且B happens-before C ，那么A happens-before C。

注意：

两个操作之间具有happens-before关系，并不意味着前一个操作必须在后一个操作之前执行！happens-before仅仅要求前一个操作（执行的结果）对后一个操作可见，且前一个操作按顺序排在第二个操作之前（the first is visiable to and ordered beofre the second）。

图示happens-before与JMM的关系：

并发编程之Java内存模型