HashMap
Map实现类之一:HashMap
- 所有的key构成的集合是Set:无序的、不可重复的。所以,key所在的类要重写:equals()和hashCode()
- 所有的value构成的集合是Collection:无序的、可以重复的。所以,value所在的类要重写:equals()
- 一个key-value构成一个entry
- 所有的entry构成的集合是Set:无序的、不可重复的
- HashMap 判断两个 key 相等的标准是:两个 key 通过 equals() 方法返回 true,hashCode 值也相等。
- HashMap 判断两个 value相等的标准是:两个 value 通过 equals() 方法返回 true。
HashMap的存储结构
数组+链表 (jdk7及之前)
数组+链表+红黑树 (jdk 8)
HashMap添加元素的过程
HashMap map=new HashMap();
实例化后底层创建了长度是16的一维数组Entry[] table。这个长度在哈希表中被称为容量(Capacity),在这个数组中可以存放元素的位置我们称之为“桶”(bucket),每个bucket都有自己的索引,系统可以根据索引快速的查找bucket中的元素。
每个bucket中存储一个元素,即一个Entry对象,但每一个Entry对象可以带一个引用变量,用于指向下一个元素,因此,在一个桶中,就有可能生成一个Entry链。而且新添加的元素作为链表的head。
...可能已经多次put...
map.put(key1,value1):
调用key1所在类的HashCode()方法计算key1的哈希值
此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置
1).如果此位置上的数据为空,此时的key1-value1(即entyr1)添加成功。 ---->情况1
2).如果此位置已存在一个或多个数据(以链表形式存在),比较key1和已存在数据的哈希值
- key1的哈希值与已存在数据的哈希值都不相同,添加成功。 ---->情况2
- key1的哈希值与key2的哈希值相同,调用key1所在类的equals()方法
- equals()返回false:此时key1-value1添加成功。 --->情况3
- equals()返回true:value1替换value2
对于情况2、3添加成功的元素a与已存在的元素以链表形式存储—7上8下
img
HashMap的扩容
jdk7及以前
DEFAULT_INITIAL_CAPACITY : HashMap的默认容量,16
DEFAULT_LOAD_FACTOR:HashMap的默认加载因子:0.75
threshold:扩容的临界值,=容量*填充因子:16 * 0.75 => 12
TREEIFY_THRESHOLD:Bucket中链表长度大于该默认值,转化为红黑树:8
MIN_TREEIFY_CAPACITY:桶中的Node被树化时最小的hash表容量:64
当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数size)loadFactor 时 , 就 会 进 行 数 组 扩 容 , loadFactor 的默认值 (DEFAULT_LOAD_FACTOR)为0.75,这是一个折中的取值。也就是说,默认情况下,数组大小(DEFAULT_INITIAL_CAPACITY)为16,那么当HashMap中元素个数超过\(16*0.75 = 12\)(这个值就是代码中的threshold值,也叫做临界值)的时候,就把数组的大小扩展为 \(2*16=32\),即扩大一倍,然后重新计算每个元素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能。
jdk8
相较于jdk7在底层实现方面的不同:
new HashMap():底层没有创建一个长度为16的数组
jdk 8底层的数组是:Node[],而非Entry[]
首次调用put()方法时,底层创建长度为16的数组
jdk7底层结构只有:数组+链表。jdk8中底层结构:数组+链表+红黑树。
4.1 形成链表时,七上八下(jdk7:新的元素指向旧的元素。jdk8:旧的元素指向新的元素) 4.2 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时,此时此索引位置上的所数据改为使用红黑树存储。