再多线程的情况下,如果使用HashMap,就会导致死循环,导致cpu利用率接近100%,所以如果是并发的情况不要使用HashMap
导致死循环主要是这段代码,当在多线程的情况由于没有同步导致,着段代码在扩容的时候会执行
do {
Entry<K,V> next = e.next; //假设线程一执行到这里就被调度挂起了,当再次获得执行的时候,数据结构已经改变了,而线程却不知道
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);
线程安全的HashTable 容器
HashTable安全是安全,但是代价太大,该容器采用synchronized来保证线程安全,在多线程同时对它进行操作,竞争激烈的情况下效率非常的底下。因为当一个线程访问的时候,其他线程在轮询或阻塞的状态。如线程1使用put进行添加元素,线程2不但不能使用put方法添加元素,并且也不能使用get方法来获取元素,所以竞争越激烈效率越低。
并发集合容器ConcurrentHashMap
ConcurrentHashMap 里面的table 是实现 Map.Entry接口的一个数组,在对ConcurrentHashMap,进行put操作的时候,如果里面没有
键值对,则进行添加。
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
这里的casTabAt,以及tabAt本质使用的是sun.misc.Unsafe这里类里面的方法,该方法是在不加锁的情况下通过CAS实现线程安全
如果里面有存在想通过的key,那么就对其进行更新,在更新的代码块中,使用synchronized 来进行同步
synchronized (f) {
if (tabAt(tab, i) == f) {
if (fh >= 0) {
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {
K ek;
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
.....
}
}
....
}
}
刚才我们说HashMap 在重新分配空间的时候会导致死循环,那么ConcurrentHashMap是如何解决这个问题的了?结果跟我们上面分析的put
操作如出一辙
else if ((f = tabAt(tab, i)) == null)
advance = casTabAt(tab, i, null, fwd);
else if ((fh = f.hash) == MOVED)
advance = true; // already processed
else {
synchronized (f) {
...
}
使用了CAS,synchronized进行同步,这样就保证了线程的安全
说完put,那么get 操作又是如何保证同步的了?
if ((tab = table) != null && (n = tab.length) > 0 &&
(e = tabAt(tab, (n - 1) & h)) != null) {
if ((eh = e.hash) == h) {
if ((ek = e.key) == key || (ek != null && key.equals(ek)))
return e.val;
}
else if (eh < 0)
return (p = e.find(h, key)) != null ? p.val : null;
while ((e = e.next) != null) {
if (e.hash == h &&
((ek = e.key) == key || (ek != null && key.equals(ek))))
return e.val;
}
}
get的实现相对于来说简单了,先经过一次再哈希,然后使用这个哈希值通过哈希运算定位到table,从代码上面看到就是使用一个 tabAt操作而并没有使用synchronized来对代码块进行同步,是因为在存储
value 的时候使用了volatile
static class Node
final int hash;
final K key;
volatile V val;
….
}
定义成volatile的变量,能够在线程之间保持可见性,能够被多线程同时读,并且保证不会读到过期的值但是只能被单线程写(有一种情况可以被多线程写,就是写入的值不依赖于原值)之所以不会读到过期的值,是根据java内存模型的happen before原则,对volatile字段的写入操作先于读操作,即使两个线程同时修改和获取volatile变量,get操作也能拿到最新的值,这是用volatile替换锁的经典应用场景。
参考资料:
1.JDK1.8源代码。
2.《Java并发编程实践》
3.聊聊并发