java中ConcurrentHashMap的读操作为什么不需要加锁

三叶草 发表于 2021-10-8 11:30:54

ConcurrentHashMap完全允许多个读操作并发进行，读操作并不需要加锁。所以下面这篇文章主要给大家介绍了关于java中ConcurrentHashMap的读操作为什么不需要加锁的相关资料，需要的朋友可以参考下
前言
concurrenthashmap是java 5中支持高并发、高吞吐量的线程安全hashmap实现。
我们知道，concurrenthashmap(1.8)这个并发集合框架是线程安全的，当你看到源码的get操作时，会发现get操作全程是没有加任何锁的，这也是这篇博文讨论的问题——为什么它不需要加锁呢？
下面话不多说了，来一起看看详细的介绍吧
concurrenthashmap的简介
我想有基础的同学知道在jdk1.7中是采用segment + hashentry + reentrantlock的方式进行实现的，而1.8中放弃了segment臃肿的设计，取而代之的是采用node + cas + synchronized来保证并发安全进行实现。

[*]jdk1.8的实现降低锁的粒度，jdk1.7版本锁的粒度是基于segment的，包含多个hashentry，而jdk1.8锁的粒度就是hashentry（首节点）
[*]jdk1.8版本的数据结构变得更加简单，使得操作也更加清晰流畅，因为已经使用synchronized来进行同步，所以不需要分段锁的概念，也就不需要segment这种数据结构了，由于粒度的降低，实现的复杂度也增加了
[*]jdk1.8使用红黑树来优化链表，基于长度很长的链表的遍历是一个很漫长的过程，而红黑树的遍历效率是很快的，代替一定阈值的链表，这样形成一个最佳拍档

get操作源码

[*]首先计算hash值，定位到该table索引位置，如果是首节点符合就返回
[*]如果遇到扩容的时候，会调用标志正在扩容节点forwardingnode的find方法，查找该节点，匹配就返回
[*]以上都不符合的话，就往下遍历节点，匹配就返回，否则最后就返回null

//会发现源码中没有一处加了锁
public v get(object key) {
node<k,v>[] tab; node<k,v> e, p; int n, eh; k ek;
int h = spread(key.hashcode()); //计算hash
if ((tab = table) != null && (n = tab.length) > 0 &&
(e = tabat(tab, (n - 1) & h)) != null) {//读取首节点的node元素
if ((eh = e.hash) == h) { //如果该节点就是首节点就返回
if ((ek = e.key) == key || (ek != null && key.equals(ek)))
return e.val;
}
//hash值为负值表示正在扩容，这个时候查的是forwardingnode的find方法来定位到nexttable来
//eh=-1，说明该节点是一个forwardingnode，正在迁移，此时调用forwardingnode的find方法去nexttable里找。
//eh=-2，说明该节点是一个treebin，此时调用treebin的find方法遍历红黑树，由于红黑树有可能正在旋转变色，所以find里会有读写锁。
//eh>=0，说明该节点下挂的是一个链表，直接遍历该链表即可。
else if (eh < 0)
return (p = e.find(h, key)) != null ? p.val : null;
while ((e = e.next) != null) {//既不是首节点也不是forwardingnode，那就往下遍历
if (e.hash == h &&
((ek = e.key) == key || (ek != null && key.equals(ek))))
return e.val;
}
}
return null;
}
get没有加锁的话，concurrenthashmap是如何保证读到的数据不是脏数据的呢？
volatile登场
对于可见性，java提供了volatile关键字来保证可见性、有序性。但不保证原子性。
普通的共享变量不能保证可见性，因为普通共享变量被修改之后，什么时候被写入主存是不确定的，当其他线程去读取时，此时内存中可能还是原来的旧值，因此无法保证可见性。

[*]volatile关键字对于基本类型的修改可以在随后对多个线程的读保持一致，但是对于引用类型如数组，实体bean，仅仅保证引用的可见性，但并不保证引用内容的可见性。。
[*]禁止进行指令重排序。
背景：为了提高处理速度，处理器不直接和内存进行通信，而是先将系统内存的数据读到内部缓存（l1，l2或其他）后再进行操作，但操作完不知道何时会写到内存。

[*]如果对声明了volatile的变量进行写操作，jvm就会向处理器发送一条指令，将这个变量所在缓存行的数据写回到系统内存。但是，就算写回到内存，如果其他处理器缓存的值还是旧的，再执行计算操作就会有问题。
[*]在多处理器下，为了保证各个处理器的缓存是一致的，就会实现缓存一致性协议，当某个cpu在写数据时，如果发现操作的变量是共享变量，则会通知其他cpu告知该变量的缓存行是无效的，因此其他cpu在读取该变量时，发现其无效会重新从主存中加载数据。

总结下来：

[*]第一：使用volatile关键字会强制将修改的值立即写入主存；
[*]第二：使用volatile关键字的话，当线程2进行修改时，会导致线程1的工作内存中缓存变量的缓存行无效（反映到硬件层的话，就是cpu的l1或者l2缓存中对应的缓存行无效）；
[*]第三：由于线程1的工作内存中缓存变量的缓存行无效，所以线程1再次读取变量的值时会去主存读取。
是加在数组上的volatile吗?

/**
* the array of bins. lazily initialized upon first insertion.
* size is always a power of two. accessed directly by iterators.
*/
transient volatile node<k,v>[] table;
我们知道volatile可以修饰数组的，只是意思和它表面上看起来的样子不同。举个栗子，volatile int array是指array的地址是volatile的而不是数组元素的值是volatile的.
用volatile修饰的node
get操作可以无锁是由于node的元素val和指针next是用volatile修饰的，在多线程环境下线程a修改因为hash冲突修改结点的val或者新增节点的时候是对线程b可见的。

static class node<k,v> implements map.entry<k,v> {
final int hash;
final k key;
//可以看到这些都用了volatile修饰
volatile v val;
volatile node<k,v> next;

node(int hash, k key, v val, node<k,v> next) {
this.hash = hash;
this.key = key;
this.val = val;
this.next = next;
}

public final k getkey(){ return key; }
public final v getvalue(){ return val; }
public final int hashcode() { return key.hashcode() ^ val.hashcode(); }
public final string tostring(){ return key + "=" + val; }
public final v setvalue(v value) {
throw new unsupportedoperationexception();
}

public final boolean equals(object o) {
object k, v, u; map.entry<?,?> e;
return ((o instanceof map.entry) &&
(k = (e = (map.entry<?,?>)o).getkey()) != null &&
(v = e.getvalue()) != null &&
(k == key || k.equals(key)) &&
(v == (u = val) || v.equals(u)));
}

/**
* virtualized support for map.get(); overridden in subclasses.
*/
node<k,v> find(int h, object k) {
node<k,v> e = this;
if (k != null) {
do {
k ek;
if (e.hash == h &&
((ek = e.key) == k || (ek != null && k.equals(ek))))
return e;
} while ((e = e.next) != null);
}
return null;
}
}
既然volatile修饰数组对get操作没有效果那加在数组上的volatile的目的是什么呢？
其实就是为了使得node数组在扩容的时候对其他线程具有可见性而加的volatile
总结
在1.8中concurrenthashmap的get操作全程不需要加锁，这也是它比其他并发集合比如hashtable、用collections.synchronizedmap()包装的hashmap;安全效率高的原因之一。
get操作全程不需要加锁是因为node的成员val是用volatile修饰的和数组用volatile修饰没有关系。
数组用volatile修饰主要是保证在数组扩容的时候保证可见性。
好了，以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对CodeAE代码之家的支持。
原文链接：https://www.cnblogs.com/keeya/p/9632958.html

http://www.zzvips.com/article/168584.html

页: [1]

CodeAE代码之家-专为程序员打造的技术家园！-网站地图

java中ConcurrentHashMap的读操作为什么不需要加锁