解析源码，彻底弄懂HashMap（持续更新中）

时间:2020-03-25 NullUsera 人气:1

　　为啥突然想着看HashMap源码了？

　　无意间看到有人说HashMap能考验Java程序员的基本功，之前我作为面试官帮公司招人的时候偶尔问起HashMap，大部分人回答基本都会用，且多数仅停留在put，get使用上面，实际上HashMap涉及的知识远远不止put和get那么简单。HashMap涉及线程、内存模型、Hash计算、链表结构、二进制运算等问题，可以说HashMap能考验一个Java程序员的技术功底。作为具备一定工作经验的技术人员，我们必须回头去恶补基础，凡是技术点都要努力去搞清楚是什么，为什么，怎么用。

　　 HashMap基本概念及原理：

　　如果我们想要很快的查询一个数据，最好将其用数组存储，因为数组查询速度快，但是数组的长度不可以修改，所以它添加元素很麻烦，需要创建一个更大的数组，然后把老数组的元素按顺序拷贝到新数组中，而我们想要添加元素，最好使用链表去存储，因为链表是离散的，所以在添加或者删除的时候，只会修改局部的内容，也正是因为链表是离散的，它的位置在内存中不是一直固定的（指的是不连续），每次要查找下一个元素的时候，都需要读取其位置信息，所以链表的查询很慢。那有没有一种数据结构，它的查询很快，添加和删除速度也很快呢？答案是肯定的，结合数组和链表的优点，哈希表诞生了。

　　HashMap基于哈希表的Map接口实现，是以key-value的存储形式存在，即主要用来存放键值对。HashMap的实现不是同步的，这意味着它不是线程安全的。数组是HashMap的主体，链表则是为了解决hash冲突而存在的，所谓hash冲突就是两个对象调用hashCode()方法计算的hash值相同导致计算的数组索引也相同。

　　JDK1.8之后在解决Hash冲突时有了较大的变化，当链表长度大于边界值(默认为8)且当前数组长度大于64时，此时此索引位置上的所有数据改为使用红黑树存储。另外需要注意的是，当链表长度大于8但是数组长度小于64，此时也并不会将链表变成红黑树，而是选择扩容。这样做的目的是提高性能和较少搜索时间，具体可参照treeifyBin()方法。说了这么多，那HashMap的基本原理是怎样的呢？简单粗暴概括一下：

　　1、首先判断key是否为Null，如果为null，直接查找Enrty[0]，如果不是Null，先计算Key的HashCode，得到Hash值，Hash值是一个int值。

　　2、根据Hash值，要找到对应的数组，所以对Entry[]的长度length取模（类似求余的算法，后面详细介绍），得到的就是Entry数组的index。

　　3、找到对应的数组就找到了所在的链表，然后按照链表的操作对Value进行插入、删除和查询操作。

　　HashMap底层数据结构及存储过程（以上纯属扯淡，下面重点来了）：

　　JDK1.8之前HashMap底层由数组+链表实现

　　JDK1.8之后为了提高效率，底层由数组+链表+红黑树实现

　　在创建HashMap集合对象的时候，在JDK1.8之前是在构造方法中创建一个长度为16的Entry[] table来存储键值对，在JDK1.8之后不在构造方法中创建数组了，而是在第一次调用put()方法时创建数组Node[] table 用来存储键值对。

　　假设向哈希表中存储键值对key为zhangsan，value为28，根据zhangsan.hashCode()方法计算出hash值，然后结合数组长度采用取模的算法计算出zhangsan在Node数组中的索引值，如果计算出的索引没有值，则直接将28存储到数组中。那么，取模算法到底是怎样的呢？看下图。

　　红色框出来的代码告诉我们，采用的是按位与运算计算出索引值，其实就是我们熟知的取余法，但是为什么没有直接使用hash%length直接取余呢，是因为与运算效率更高，与运算规则：相同的二进制数位上都是1时结果为1，否则为0。在某种条件下hash%length等于n-1&hash，什么条件呢？那就是HashMap要求的数组长度length必须为2的n次幂，HashMap的构造函数允许我们自定义数组长度，但是它会检测然后自动帮我们把设置的长度往上转成最近的2的n次幂，比如我们初始化一个HashMap对象，设置数组长度为10，显然10不是2的某次幂，这时候会自动向上转成最近的2的某次幂，也就是16。

HashMap<String,String> hashMap = new HashMap<>(10);

加载全部内容