
标题: 关于Hash表的rehashing问题 [打印本页]

作者: 第一印象    时间: 2013-8-29 18:17
标题: 关于Hash表的rehashing问题
本帖最后由 第一印象 于 2013-9-3 08:26 编辑

1.对于HashSet,Hashtable,HashMap这三个集合,他们存储元素的时候,都是根据hash算法来确定元素的位置的,当我 new HashMap()的时候,hash表有一个初始容量和默认的加载因子,对于HashMap,API中说默认初始容量是16,默认加载因子是0.75,也就是3/4,当hash表的3/4被填满时,hash表就会发生rehashing操作,那是不是可以说当我调用put方法往我的hashmap集合中添加了第十三条数据的时候(为什么是十三条的时候呢?因为12刚好16*0.75),这个hash表就发生rehashing操作了?就会对我已经存储到hashMap里面的所有值进行位置的重新分配?如果是的话,如果我在创建hashMap的时候,这么创建:
HashMap m = new HashMap(17);


作者: 黄文伯    时间: 2013-8-29 20:48
作者: 神之梦    时间: 2013-8-29 22:28
作者: straw    时间: 2013-8-29 22:45
作者: 第一印象    时间: 2013-8-29 22:48
straw 发表于 2013-8-29 22:45


作者: straw    时间: 2013-8-29 23:00
第一印象 发表于 2013-8-29 22:48
呵呵,看了老毕的视频,再结合了李刚老师疯狂java的书籍细读了一下,还是觉得有疑问,所以希望在这里能够 ...


作者: 第一印象    时间: 2013-8-29 23:17
straw 发表于 2013-8-29 23:00
为什么不是12而是13?我想只是当初设计这个集合的人的一句话的问题,他想在12这个位置触发rehashing动作也 ...


作者: sergio    时间: 2013-9-3 00:44
  1. /**
  2.      * Rehashes the contents of this map into a new array with a
  3.      * larger capacity.  This method is called automatically when the
  4.      * number of keys in this map reaches its threshold.
  5.      *
  6.      * If current capacity is MAXIMUM_CAPACITY, this method does not
  7.      * resize the map, but sets threshold to Integer.MAX_VALUE.
  8.      * This has the effect of preventing future calls.
  9.      *
  10.      * @param newCapacity the new capacity, MUST be a power of two;
  11.      *        must be greater than current capacity unless current
  12.      *        capacity is MAXIMUM_CAPACITY (in which case value
  13.      *        is irrelevant).
  14.      */
  15.     void resize(int newCapacity) {
  16.         Entry[] oldTable = table;
  17.         int oldCapacity = oldTable.length;
  18.         if (oldCapacity == MAXIMUM_CAPACITY) {
  19.             threshold = Integer.MAX_VALUE;
  20.             return;
  21.         }

  22.         Entry[] newTable = new Entry[newCapacity];
  23.         boolean oldAltHashing = useAltHashing;
  24.         useAltHashing |= sun.misc.VM.isBooted() &&
  25.                 (newCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD);
  26.         boolean rehash = oldAltHashing ^ useAltHashing;
  27.         transfer(newTable, rehash);
  28.         table = newTable;
  29.         threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  30.     }
threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
  1. /**
  2.      * Adds a new entry with the specified key, value and hash code to
  3.      * the specified bucket.  It is the responsibility of this
  4.      * method to resize the table if appropriate.
  5.      *
  6.      * Subclass overrides this to alter the behavior of put method.
  7.      */
  8.     void addEntry(int hash, K key, V value, int bucketIndex) {
  9.         if ((size >= threshold) && (null != table[bucketIndex])) {
  10.             resize(2 * table.length);
  11.             hash = (null != key) ? hash(key) : 0;
  12.             bucketIndex = indexFor(hash, table.length);
  13.         }

  14.         createEntry(hash, key, value, bucketIndex);
  15.     }
还有这个方法,resize(2 * table.length);数组扩大为原来的2倍。会比较消耗性能,由于是数组方面的增加容量的一个方法,所有性能跟内存消耗会有点大,最好是有个大概值来设定好初始值会比较好。
作者: 第一印象    时间: 2013-9-3 08:25
sergio 发表于 2013-9-3 00:44
可以看源码中怎么设计的。threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);


欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2