8/28/2010

Hashtable

简介

packagejava.util;

importjava.io.*;

publicclass Hashtable<K,V>

    extends Dictionary<K,V>

implements Map<K,V>, Cloneable,java.io.Serializable

Hashtable属于包java.util,实现中使用到了包java.io中的某些类。

它继承自Dictionary类,实现了Map接口,Cloneable接口,Serializable接口

Dictionary没有继承任何类(publicabstract class Dictionary<K,V>);

变量

privatetransient Entry[] table;

privatetransient int count;

privateint threshold;

privatefloat loadFactor;

privatetransient int modCount = 0;

privatestatic final long serialVersionUID = 1421746759512286392L;

table用于实际的存储key与value对.

默认值 & 构建方法

放在了构建方法里,没用声明静态常量;这一点就没有HashMap好。

由以下的构建方法可知,默认大小为11,装载因子为0.75;

和HashMap一样有四种构建方法;

    public Hashtable() {

       this(11, 0.75f);

}

    public Hashtable(int initialCapacity) {

       this(initialCapacity, 0.75f);

}

    public Hashtable(int initialCapacity, floatloadFactor) {

       if (initialCapacity < 0)

          throw new IllegalArgumentException("Illegal Capacity: "+

                                              initialCapacity);

        if (loadFactor <= 0 || Float.isNaN(loadFactor))

            throw newIllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)

            initialCapacity = 1;

       this.loadFactor = loadFactor;

       table = new Entry[initialCapacity];

       threshold = (int)(initialCapacity *loadFactor);

    }

    public Hashtable(Map<? extends K, ?extends V> t) {

       this(Math.max(2*t.size(), 11), 0.75f);

       putAll(t);

    }

同步 & 线程安全:

Hashtable里的很多方法都是synchronized的,所以它是线程安全的。

Hash值与索引的实现:

以put为例:

publicsynchronized V put(K key, V value) {

       // Make sure the value is not null

       if (value == null) {

          throw new NullPointerException();

       }

       // Makes sure the key is not already inthe hashtable.

       Entry tab[] = table;

       int hash = key.hashCode();

       int index = (hash & 0x7FFFFFFF) %tab.length;

       for (Entry<K,V> e = tab[index] ; e!= null ; e = e.next) {

          if ((e.hash == hash) && e.key.equals(key)) {

              V old = e.value;

              e.value = value;

              return old;

          }

       }

       modCount++;

       if (count >= threshold) {

          // Rehash the table if the threshold is exceeded

          rehash();

            tab = table;

            index = (hash & 0x7FFFFFFF) %tab.length;

       }

--------------------end-----------------------

       int hash = key.hashCode();

       int index = (hash & 0x7FFFFFFF) %tab.length;

hash值就是利用这两行代码来实现的,只是取了hash数的后31位并对数组长度求余.

比HashMap的实现还粗糙.

Hash冲突的处理:

和HashMap类似,利用一种拉链法的方式来处理,HashMap的实现原理:

“计算hash值=> 找hash值在table中对应的索引=> 判断该索引是否为null:

为null,直接添加;

不为null,判断hash值和key值是否相同(即使不同的hash值得到的索引i也可能相同),相同直接更新V,不相同则继续e = e.next();直到找到具有完全相同hash值和key值的e(Entry),或e == null;

如果最终e == null; 而且未找到完全相同的Entry,则运行addEntry(hash, key, value, i);

void addEntry(int hash, K key, V value,int bucketIndex) {

Entry<K,V> e =table[bucketIndex];

table[bucketIndex] = newEntry<K,V>(hash, key, value, e);

if (size++ >= threshold)

resize(2 * table.length);    //增长方式:*2;

}

利用一个单链的方式处理hash冲突:

假如本来table[i]为A,且A.next() == null;

这时候put方法获取了一个hash值与A的相同,但key值与A的不同的参数,则利用获得的两个参数key和value以及hash值与索引i值组合生成一个Entry B, 则将B放入table[i],将B.next 指向A;

同理,put了一个C,则将C放入table[i],C.next指向B;”

只是这里的实现略有不同,它并不是将添加新的Entry封装为一个方法,而是直接生成一个Entry对象,在put()代码中去实现添加。

Null值的处理:

Hashtable中不允许任何形式的null值!

Value为null时:

put()中的

       if (value == null) {

          throw new NullPointerException();

       }

Key为null时;

因为无论是在put()还是get()里;

都是没有进行判断key是否为null而直接使用

       int hash = key.hashCode();

所以当key为null时就会抛出异常:

 Exception in thread "main"java.lang.NullPointerException

所以说Hashtable不允许任何形式的null值。

增长方式:

方法为rehash(),该方法只会在put()方法中被直接调用到:

    protected void rehash() {

       int oldCapacity = table.length;

       Entry[] oldMap = table;

       int newCapacity = oldCapacity * 2 + 1;

       Entry[] newMap = new Entry[newCapacity];

       modCount++;

       threshold = (int)(newCapacity *loadFactor);

       table = newMap;

       for (int i = oldCapacity ; i-- > 0 ;){

          for (Entry<K,V> old = oldMap[i] ; old != null ; ) {

              Entry<K,V> e = old;

              old = old.next;

              int index = (e.hash &0x7FFFFFFF) % newCapacity;

              e.next = newMap[index];

              newMap[index] = e;

          }

       }

}

由这行代码:int newCapacity = oldCapacity * 2 + 1;

可知Hashtable的增长方式为 *2 + 1;

遍历方式:

遍历Entry, Set<Map.Entry<K,V>>;
  public Set<Map.Entry<K,V>>entrySet();

遍历value, Enumeration<V> || Collection<V>

  public synchronized Enumeration<V>elements();   //与HashMap不同

public Collection<V>values();

遍历key, Enumeration<K> || Set<K>;

  public synchronized Enumeration<K>keys();   //与HashMap的实现不同

  public Set<K> keySet();

造成Hashtable和HashMap有关遍历方法的共性与差异的原因在于:共性是由于它们都实现了Map接口;差异在于Hashtable继承自Dictionary类而HashMap没有。

对于这些方法的记忆也很简单:

首先记Map接口的方法,因为Map的特性决定了key值和Entry值不能重复,而value值可以重复。所以Map接口对于key和Entry都返回set型,即keySet()和entrySet(),而value则为Collection型,即values();

Dictionary没有考虑这么多,key值直接通过Enumeration形式的keys()获得,value值通过Enumeration形式的elements()获得。

OK~

No comments:

Post a Comment