深入分析ConcurrentHashMap

作者 chauncy 日期 2016-12-09
深入分析ConcurrentHashMap

再多线程的情况下,如果使用HashMap,就会导致死循环,导致cpu利用率接近100%,所以如果是并发的情况不要使用HashMap
导致死循环主要是这段代码,当在多线程的情况由于没有同步导致,着段代码在扩容的时候会执行

do {
Entry<K,V> next = e.next; //假设线程一执行到这里就被调度挂起了,当再次获得执行的时候,数据结构已经改变了,而线程却不知道
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);

线程安全的HashTable 容器

HashTable安全是安全,但是代价太大,该容器采用synchronized来保证线程安全,在多线程同时对它进行操作,竞争激烈的情况下效率非常的底下。因为当一个线程访问的时候,其他线程在轮询或阻塞的状态。如线程1使用put进行添加元素,线程2不但不能使用put方法添加元素,并且也不能使用get方法来获取元素,所以竞争越激烈效率越低。

并发集合容器ConcurrentHashMap

ConcurrentHashMap 里面的table 是实现 Map.Entry接口的一个数组,在对ConcurrentHashMap,进行put操作的时候,如果里面没有
键值对,则进行添加。

else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
               if (casTabAt(tab, i, null,
                            new Node<K,V>(hash, key, value, null)))
                   break;                   // no lock when adding to empty bin
           }

这里的casTabAt,以及tabAt本质使用的是sun.misc.Unsafe这里类里面的方法,该方法是在不加锁的情况下通过CAS实现线程安全
如果里面有存在想通过的key,那么就对其进行更新,在更新的代码块中,使用synchronized 来进行同步

synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                              .....
                            }
                        }
                        ....
                    }
                }

刚才我们说HashMap 在重新分配空间的时候会导致死循环,那么ConcurrentHashMap是如何解决这个问题的了?结果跟我们上面分析的put
操作如出一辙

else if ((f = tabAt(tab, i)) == null)
               advance = casTabAt(tab, i, null, fwd);
           else if ((fh = f.hash) == MOVED)
               advance = true; // already processed
           else {
               synchronized (f) {
                   ...

               }

使用了CAS,synchronized进行同步,这样就保证了线程的安全

说完put,那么get 操作又是如何保证同步的了?

if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tabAt(tab, (n - 1) & h)) != null) {
            if ((eh = e.hash) == h) {
                if ((ek = e.key) == key || (ek != null && key.equals(ek)))
                    return e.val;
            }
            else if (eh < 0)
                return (p = e.find(h, key)) != null ? p.val : null;
            while ((e = e.next) != null) {
                if (e.hash == h &&
                    ((ek = e.key) == key || (ek != null && key.equals(ek))))
                    return e.val;
            }
        }

get的实现相对于来说简单了,先经过一次再哈希,然后使用这个哈希值通过哈希运算定位到table,从代码上面看到就是使用一个 tabAt操作而并没有使用synchronized来对代码块进行同步,是因为在存储
value 的时候使用了volatile
static class Node implements Map.Entry {
final int hash;
final K key;
volatile V val;
….

定义成volatile的变量,能够在线程之间保持可见性,能够被多线程同时读,并且保证不会读到过期的值但是只能被单线程写(有一种情况可以被多线程写,就是写入的值不依赖于原值)之所以不会读到过期的值,是根据java内存模型的happen before原则,对volatile字段的写入操作先于读操作,即使两个线程同时修改和获取volatile变量,get操作也能拿到最新的值,这是用volatile替换锁的经典应用场景。

参考资料:

1.JDK1.8源代码。

2.《Java并发编程实践》

3.聊聊并发