这是我之前搜集和整理的
Vector 和 ArrayList 的区别
Vector 和 ArrayList 在使用上非常相似,都可用来表示一组数量可变的对象应用的集合,并且可以随机地访问其中的元素。Vector 的方法都是同步的 (Synchronized), 是线程安全的 (thread-safe) ,而 ArrayList 的方法不 是,由于线程的同步必然要影响性能,因此 ,ArrayList 的性能比 Vector 好。
当 Vector 或 ArrayList 中的元素超过它的初始大小时 ,Vector 会将它的容量翻倍 , 而 ArrayList
只增加 50% 的大小,这样 ,ArrayList 就有利于节约内存空间。
Hashtable 和 HashMap 区别
Hashtable 和 HashMap 它们的性能方面的比较类似 Vector 和 ArrayList ,比如 Hashtable的方
法是同步的 , 而 HashMap 的不是。
ArrayList 和 LinkedList 区别
对于处理一列数据项 ,Java 提供了两个类 ArrayList 和 LinkedList,ArrayList 的内部实现是基于内部数组 Object[], 所 以从概念上讲 , 它更象数组,但 LinkedList 的内部实现是基于一组连接的记录 , 所以 , 它更象一个链表结构,所以 , 它们在性能上有很大的差别。从上面的分析可知 , 在 ArrayList 的前面或中间插入数据时 , 你必须将其后的所有数据相应的后移 , 这样必然要花费较多时间,所以 , 当你的操作是在一列 数据的后面添加数据而不是在 前面或中间 , 并且需要随机地访问其中的元素时 , 使用 ArrayList 会提供比较好的性能而访问链表中的某个元素时 , 就必须从链表的一端开始沿着连接方向一个一个元素地去查找 ,直到找到所需的元素为止,所以 , 当你的操作是在一列数据的前面或中间添加或删除数据 , 并且按照顺序访问其中的元素时 , 就应该使用 LinkedList 了。如果在编程中 ,1 , 2 两种情形交替出现 , 这时 , 你可以考虑使用 List 这样的通用接口 , 而不用关心具体的实现,在具体的情形下 , 它的性能由具体的实现来保证。
在 Java 集合框架中的大部分类的大小是可以随着元素个数的增加而相应的增加的,我们似乎不用关心它的初始大小 , 但如果我们考虑类的性能问题时 , 就一定要考虑尽可能地设置好集合对象的初始大小 , 这将大大提高代码的性能。比如 ,Hashtable 缺省的初始大小为 101, 载入因子为 0.75, 即如果其中的元素个数超过 75 个 , 它就必须增加大小并重新组织元素,所以 , 如果你 知道在创建一个新的 Hashtable 对象时就知道元素的确切数目如为 110, 那么 , 就应将其初始大小设为 110/0.75=148, 这样 , 就可以避免重 新组织内存并增加大小。线性表,链表,哈希表是常用的数据结构,在进行 Java 开发时, JDK 已经为我们提供了一
系列相应的类来实现基本的数据结构。这些类均在 java.ut il 包中。本文试图通过简单的描 述 ,
向读者阐述各个类的作用以及如何正确使用这些类。
Collection
├ List
│├ LinkedList
│├ ArrayList
│└ Vector
│ └ Stack
└ Set
Map
├ Hashtable
├ HashMap
└ WeakHashMap
Collection 接口
Collection 是最基本的集合接口,一个 Collection 代表一组 Object ,即 Collection 的元素(Elements )。一些 Collection 允许相同的元素而另一些不行。一些能排序而另一些不行。
Java SDK 不提供直接继承自 Collection 的类, Java SDK 提供的类都是继承自 Collection 的 “ 子接
口 ” 如 List 和 Set 。所有实现 Collection 接口的类都必须提供两个标准的构造函数:无参数的构造函数用于创建一个空的 Collection ,有一个 Collection 参数的构造函数用于创建一个新的 Collection ,
这个新的 Collection 与传入的 Collection 有相同的元素。后 一个构造函数允许用户复制一 个
Collection 。如何遍历 Collection 中的每一个元素?不论 Collection 的实际类型如何,它都支持一个
iterator() 的方法,该方法返回一个迭代子,使用该迭代子即可逐一访问 Collection 中每一个
元素。典型的用法如下:
Iterator it = collection.iterator(); // 获得一个迭代子
while(it.hasNext()) {
Object obj = it.next(); // 得到下一个元素
}
由 Collection 接口派生的两个接口是 List 和 Set 。
List 接口
List 是有序的 Collection ,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在 List 中的位置,类似于数组下标)来访问 List 中的元素,这类似于 Java的数组。和下面要提到的 Set 不同, List 允许有相同的元素。除了具有 Collection 接口必备的 iterator() 方法外, List 还提供一个 listIterator() 方法,返回一个 ListIterator 接口,和标准的 Iterator 接口相比, ListIterator 多了一些 add() 之类的方 法 ,允许添加,删除,设定元素, 还能向前或向后遍历。实现 List 接口的常用类有 LinkedList ,ArrayList , Vector 和 Stack 。
Vector 类
Vector 非常类似 ArrayList ,但是 Vector 是同步的。由 Vector 创建的 Iterator ,虽然和ArrayList 创建的 Iterator 是同一接口,但是,因为 Vector 是同步的,当一个 Iterator 被创建而且正在被使用,另一个线程改变了 Vector 的状态(例 如,添加或删除了一些元素),这时调用 Iterator 的方法时将抛出ConcurrentModif icationException ,因此必须捕获该 异常。
Stack 类
Stack 继承自 Vector ,实现一个后进先出的堆栈。 Stack 提供 5 个额外的方法使得 Vector
得以被当作堆栈使用。基本的 push 和 pop 方法,还有 peek 方法得到栈顶的元素, empty 方
法测试堆栈是否为空, search 方法检测一个元素在堆栈中的位置。 Stack 刚创建后是空栈。
Set 接口
Set 是一种不包含重复的元素的 Collection ,即任意的两个元素 e1 和 e2 都有 e1.equals(e2)=false , Set 最多有一个 null 元素。很明显, Set 的构造函数有一个约束条件,传入的 Collection 参数不能包含重复的元素 。请注意:必须小心操作可变对象( Mutable Object )。如果一个 Set 中的可变元素改变了
自身状态导致 Object.equals(Object)=true 将导致一些问题。
Map 接口
请注意, Map 没有继承 Collection 接口, Map 提供 key 到 value 的映射。一个 Map 中不
能包含相同的 key ,每个 key 只能映射一个 value 。 Map 接口提供 3 种集合的视图, Map 的 内
容可以被当作一组 key 集合,一组 value 集合,或者一组 key-value 映射。
Hashtable 类
Hashtable 继承 Map 接口,实现一个 key-value 映射的哈希表。任何非空( non-null )的
对象都可作为 key 或者 value 。添加数据使用 put(key, value) ,取出数据使用 get(key) ,这两个基本操作的时间开销为常数。Hashtable 通过 init ial capacity 和 load factor 两个参数调整性能。通常缺省的 load factor 0.75较好地实现了时间和空间的均衡。增大 load factor 可以节省空间但相应的查找时间将增大,这会影响像 get 和 put 这样的操作。使用 Hashtable 的简单示例如下,将 1 , 2 , 3 放到 Hashtable 中,他们的 key 分别是
” one ” , ” two ” , ” three ” :
Hashtable numbers = new Hashtable();
numbers.put( “ one ” , new Integer(1));
numbers.put( “ two ” , new Integer(2));
numbers.put( “ three ” , new Integer(3));
要取出一个数,比如 2 ,用相应的 key :
Integer n = (Integer)numbers.get( “ two ” );
System.out.println( “ two = ” + n);
由于作为 key 的对象将通过计算其散列函数来确定与之对应的 value 的位置,因此任 何
作为 key 的对象都必须实现 hashCode 和 equals 方 法。 hashCode 和 equals 方法继承自根类
Object ,如果你用自定义的类当作 key 的话,要相当小心,按照散列函数的定义,如果两 个
对象相 同,即 obj1.equals(obj2)=true ,则它们的 hashCode 必须相同,但如果两个对象不同,
则它们的 hashCode 不一定不同,如 果两个不同对象的 hashCode 相同,这种现象称为冲突 ,
冲突会导致操作哈希 表的时间开销增大,所以尽量定义好的 hashCode() 方法,能加快哈希 表
的操作。如果相同的对象有不同的 hashCode ,对哈希表的操作会出现意想不到的结果(期待的 get
方法返回 null ),要避免这种问题,只需要牢记一条:要同时复写 equals 方法和 hashCode 方
法,而不要只写其中一个。Hashtable 是同步的。
HashMap 类
HashMap 和 Hashtable 类似,不同之处在于 HashMap 是非同步的,并且允许 null ,即 null
value 和 null key 。,但是将 HashMap 视为 Collection 时( values() 方法可返回 Collection ), 其
迭代子操作时间开销和 HashMap 的容量成比例。因此,如果迭代操作的性能相当重要的 话 ,
不要将 HashMap 的初始化容量设得过高,或者 load factor 过低。
|