- Java并发编程深度解析与实战
- 谭锋(Mic)
- 2871字
- 2022-05-10 18:39:18
2.6 关于CAS机制的实现原理分析
在synchronized中很多地方都用到了CAS机制,它的叫法有很多,比如CompareAndSwap、CompareAndExchange、CompareAndSet,它是一个能够进行比较和替换的方法,这个方法能够在多线程环境下保证对一个共享变量进行修改时的原子性不变。
为了更好地理解CAS机制,我们来看下面这个例子,下面这个例子演示了一个对成员变量i进行累加的过程。
在不增加synchronized同步锁的情况下,incr()方法一定不是线程安全的,也就是说它无法保证原子性,但是增加锁又会导致性能问题,有没有更好的方式呢?
这个时候我们想到了一种乐观锁机制:在线程调用i++之前,先判断i的值和之前读取的i的预期值是否相等。如果相等,则说明i的值没有被其他线程修改过,这个时候可以正常修改;否则,表示修改过,就要重新读取最新的i的值进行累加。
按照乐观锁的思想修改后,大概就变成了下面这种结构,每次调用incr()方法时,都传递一个之前读取的i的预期值expect,如果相等就进行i++操作。
但是这里存在一个问题,if语句的判断和i++指令并不是原子的,也就是说当多个线程同时执行到i==expect这个判断条件时,初始加载的expect都是0,这会导致多个线程同时满足条件,最终还是会导致原子性问题。
CAS就是解决这个问题的方法,如图2-16所示,该图表示通过CAS对变量V进行原子更新操作。CAS方法中会传递三个参数,第一个参数V表示要更新的变量,第二个参数E表示期望值,第三个参数U表示更新后的值。更新的方式是,如果V==E,表示预期值和实际值相等,则将V修改成U并返回true,否则修改失败返回false。
图2-16 CAS的工作原理
在Java中的Unsafe类中提供了CAS方法,针对int类型变量的CAS方法定义如下。
从方法定义中可以看到,它有四个参数:
• o,表示当前的实例对象。
• offset,表示实例变量的内存地址偏移量。
• expect,表示预期值。
• update,表示要更新的值。
expect和update比较好理解,offset表示目标变量X在实例对象o中内存地址的偏移量。简单来说,在预期值expect要和目标变量X进行比较是否相等的判断中,目标变量X的值就是通过该偏移量从内存中获得的。
2.6.1 CAS在AtomicInteger中的应用
为了更好地理解CAS,我们以AtomicInteger为例来进行说明,AtomicInteger是一个能够保证原子性的Integer对象,也就是说,对于i++类的操作,可以使用AtomicInteger来保证原子性,使用方法如下。
getAndIncrement()是用来实现原子累加的方法,每调用一次会在原来值的基础上+1,这个过程采用了CAS机制来保证原子性。
下面来看一下getAndIncrement()方法的定义。
其中,valueOffset表示AtomicInteger中的成员变量value在内存中的偏移量,后续会用它直接从内存中读取value属性当前的值,valueOffset的初始化方法如下。
valueOffset用到了unsafe.objectFieldOffset()方法,获取value字段在AtomicInteger.class中的偏移量。
结合这段代码的分析,对前面提到的o和offset这两个字段的含义就不难理解了。在CAS中,我们需要通过expect去和某个字段的值进行比较,而expect比较的目标值就是通过offset找到某个字段在内存中的实际值(在AtomicInteger中是指value字段),如果相等,就修改成update并返回true,否则返回false。
下面来看一下unsafe.getAndAddInt的定义代码。
代码实现逻辑分析如下:
• “v = this.getIntVolatile(o, offset); ”表示根据value在对象o的偏移量来获得当前的值v。
• 使用compareAndSwapInt()方法实现比较和替换,如果value当前的值和v相等,说明数据没有被其他线程修改过,则把value修改成v+n。
• 这里采用了循环来实现,原因想必大家能猜测到。如果compareAndSwapInt()方法执行失败,则说明存在线程竞争,但是当前的方法是进行原子累加,所以必须要保证成功,为了达到这个目的,就只能不断地循环重试,直到修改成功后返回。
整体来说,CAS就是一种基于乐观锁机制来保证多线程环境下共享变量修改的原子性的解决方案。前面分析的案例虽然是在Java中的应用场景,但是它本质上和synchronized同步锁中用到的CAS是相同的,我们来看一下Unsafe类中CAS的定义。
compareAndSwapInt()是一个native方法,该方法是在JVM中定义和实现的。
2.6.2 CAS实现自旋锁
在本章中很多地方都会提到自旋锁,那么什么是自旋锁呢?
我们知道,在synchronized同步锁中,没有竞争到锁的线程必须要等待,直到获得锁资源的线程释放锁,才会唤醒处于锁等待的线程,而这个过程会涉及从用户态到内核态的切换带来的性能开销。在存在竞争的情况下,我们能否通过固定次数的重试,在线程进入锁等待状态之前占用锁资源呢?基于这个原因就产生了自旋锁。
所谓自旋锁就是当一个线程在抢占锁资源时,如果锁已经被其他线程获取,那么该线程将会循环不断地判断及尝试抢占锁资源,在这个过程中该线程一直保持运行状态,不会造成上下文切换带来的性能损耗。但是自旋锁也有缺点,如果获得锁资源的线程一直没有释放,那么当前线程就会一直重试从而造成CPU资源的浪费。因此,在synchronized中会用到固定次数的自旋和自适应自旋。
实现自旋锁的方式比较简单,需要满足如下两个条件。
• 通过for(;;)循环不断循环重试。
• 通过一个线程安全的操作去尝试抢占资源,而CAS就是很好的方法,CAS是一个满足原子操作的方法,它的返回值true/false可以很好地判断当前线程竞争的结果。
AtomicInteger中的getAndAddInt()方法其实就是一种自旋,通过一个do...while循环不断对value进行累加,直到累加成功便返回。
在JVM的synchronized的重量级锁实现中,它的自旋实现采用的是for(;;)循环,然后在该循环中通过Atomic::cmpxchg_ptr进行CAS来抢占锁资源。
2.6.3 CAS在JVM中的实现原理分析
读者应该对CAS如何解决原子性的问题还存在比较多的疑惑。
举个例子,如果多个线程调用CAS,并且多个线程都去执行预期值与实际值的判断,那么应该还存在原子性问题才对。除非当线程在执行offset偏移量的值和expect进行比较时加锁,保证在同一时刻只允许一个线程来判断。
带着这个疑惑,我们从源码层面做一个分析,由于源码是JVM层面的C++代码实现,所以笔者会对核心逻辑做一个说明,以帮助读者理解。
基于compareAndSwapInt()方法,在JVM源码中的unsafe.cpp文件中找到该方法的定义如下。
代码解读如下。
• “oop p = JNIHandles::resolve(obj);”,这个方法是把Java对象引用转化为JVM中的对象实例。
• “jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);”,根据偏移量offset计算value的地址。
• “(Atomic::cmpxchg(x, addr, e))”,比较addr和e是否相等,如果相等就把x赋值到目标字段,该方法会返回修改之前的目标字段的值。
Atomic::cmpxchg()方法的定义在atomic.cpp文件中,代码如下。
该方法并没有定义具体的实现。其实,对于CAS操作,不同的操作系统和CPU架构,其保证原子性的方法可能会不一样,而JVM本身是跨平台的语言,它需要在任何平台和CPU架构下都保证一致性。因此,Atomic::cmpxchg()方法会根据不同的操作系统类型和CPU架构,在预编译阶段确定调用哪个平台下的重载,图2-17展示的是JVM源码中定义的多个平台的重载。
图2-17 JVM源码中定义的多个平台的重载
以Linux系统为例,当定位到atomic_linux_x86.inline.hpp文件时,Atomic::cmpxchg的具体实现方法如下。
代码说明如下。
• mp(multi-processor),os::is_MP()用于判断是否是多核CPU。
• __asm__表示内嵌汇编代码。
○ volatile用于通知编译器对访问该变量的代码不再进行优化。
○ LOCK_IF_MP(%4)表示如果CPU是多核的,则需要为compxchgl指令增加一条Lock指令。
• 具体的执行过程是,先判断寄存器中的compare_value变量值是否和dest地址所存储的值相等,如果相等,就把exchange_value的值写入dest指向的地址。
总的来说,上面代码的功能是基于汇编指令cmpxchgl从主内存中执行比较及替换的操作来实现数据的变更。但是,在多核心CPU的情况下,这种方式仍然不是原子的,所以为了保证多核CPU下执行该指令时的原子性,会增加一个Lock指令。Lock翻译成中文就是锁的意思,按照前面的猜想,CAS底层必然用到了锁的机制,否则无法实现原子性,因此这个猜想被证实是对的。
Lock的作用有两个:
• 保证指令执行的原子性。
• 禁止该指令与其前后的读和写指令重排序。
关于Lock的实现原理,在第3章中还会详细分析,这里不做过多展开。