亲宝软件园·资讯

展开

Java集合与原理

青年痴呆 人气:0

Java 最初版本只为常用的数据结构提供了很少的一组类:Vector、Stack、Hashtable、BitSet 与 Enumeration 接口

迭代器

public interface Collection<E>
{
    boolean add(E element);
    Iterator<E> iterator();
    ...
}
// ITerator 接口包含4个方法
public interface Iterator<E>
{
    E next();
    boolean hasNext();
    void remove();
    default void forEachRemainint(Consumer<? super E> action);
}

通过反复调用 next 方法,可以朱哥访问集合中的每个元素。但是,如果到达了集合的末尾,next 方法将抛出一个 NoSuchElementException。因此,需要在调用 next 之前调用 hasNext 方法。

Collection<String> c = ...;
// 普通循环
Iterator<String> iter = c.iterator();
while(iter.hasNext())
{
    String element = iter.next();
    // do something with element
}
// 此外,使用 for-each 循环可以更简练的表示同样的操作。编译器简单地将其转换为带有迭代器的循环
for(String element : c)
{
    // do something with element
}
// 也可以不写循环,而是调用方法并提供一个Lambda表达式
Iterator<String> iter = c.iterator();
iterator.forEachRemaining(element -> /* do something with it */ );

Java 集合类库中的迭代器查找操作与位置变更更紧密耦合,查找元素的唯一方法是调用 next,而在执行查找操作的同时,迭代器的位置就会随之向前移动。
因此,可以认为 Java迭代器位于两个元素之间。当调用 next 时,迭代器就越过下一个元素,并返回刚刚越过的那个元素的引用。

Iterator 接口的 remove 方法会删除上次调用 next 方法时返回的元素。 next 方法和 remove 方法调用之间存在依赖性。如果调用 remove 之前没有调用 next,将会抛出一个 IllegalStateException 异常。

// 如果想删除两个相邻的元素,不能直接这样调用
it.remove();
it.remove(); // ERROR
// 实际上,需要先next越过将要删除的元素
it.remove();
it.next();
it.remove(); // OK

集合框架中的接口

集合有两个基本接口: Collection 和 Map

集合框架中的接口

List 是一个有序集合。可以采用两种方式访问元素:迭代器访问,或者使用一个整数索引来访问。后面这种方法称为随机访问,因此这样可以按任意顺序访问元素。与之不同,使用迭代器访问时,必须顺序地访问元素。

**纰漏**:集合框架在这个地方设计得不好。实际上有两种有序集合,其性能开销有很大差异。
1. 数组支持的有序集合,可以快速地随机访问,因此适合使用List方法并提供一个整数索引访问
2. 链表尽管也是有序的,但是随机访问**很慢**,所以最好使用迭代器进行遍历、

为了避免对链表完成随机访问操作, Java 1.4 引入了一个*标记接口*`RandomAccess`,这个接口不包含任何方法,不过可以用来测试一个特定的集合是否支持高效的随机访问:
`  if(c instanceof RandomAccess) { /* use random access algorithm */ }`
`  else { /* use qequential access algorithm */ }`

Set 接口等同于 Collection 接口,不过其方法的行为有更严谨的定义。

具体集合

集合类型描述
ArrayList可以动态增长和缩减的一个索引序列
LinkedList可以在任何位置高效插入和删除的一个有序序列
ArrayDeque实现为循环数组的一个双端队列
HashSet没有重复元素的一个无需集合
TreeSet一个有序集
EnumSet一个包含枚举类型值得集
LinkedHashSet一个可以记住元素插入次序的集
PriorityQueue允许高校删除最小元素的一个集合
HashMap存储键/值关联的一个数据结构
TreeMap键有序的一个映射
EnumMap键属于枚举类型的一个映射
LinkedHashMap可以记住键/值项添加次序的一个映射
WeakHashMap值不会再别出使用时就可以被垃圾回收的一个映射
IdentityHashMap==而不是equal比较键的一个映射

散列码

散列码可以用于快速第查找对象

在 Java 中,散列表用链表数组实现。每个列表被称为桶。 在 Java 8 中,桶满时会从链表变为平衡二叉树,以提高性能。标准类库使用的桶数是 2 的幂,默认值为 16(为表大小提供的任何值都将自动地转换为 2 的下一个幂值)。

如果散列表太满,就需要再散列。此时,就需要创建一个桶数更多的表,并将所有的元素插入到这个新表中,然后丢弃原来的表。装填因子(默认0.75)可以确定何时对散列表进行散列,新表的桶数是原来的两倍。

树集

树集是一个有序集合,可以以任意顺序将元素插入到集合中。

每次将一个元素添加到树中,都会将其放置在正确的排序位置上。因此,迭代器总是以有序的顺序访问每个元素。
将一个元素添加到树中要比添加到散列表中慢。但是,检查数组或链表中的重复元素时,树会快很多。

注: 要使用树集,必须能够比较元素。这些元素必须实现 Comparable 接口,或者构造集时必须提供一个 Comparator。

队列

队列允许高校地在尾部添加元素,并在头部删除元素。不支持在队列中间添加元素

Java 6 中引入了 Deque 接口,ArrayDeque 和 LinkedList 类实现了这个接口。

优先队列

优先队列中的元素可以按照任意的顺序插入,但会按照有序的顺序进行检索。

无论何时调用 remove 方法,总会获得当前优先队列中最小的元素。优先队列并没有对所有元素进行排序,而是使用了一个高效地数据结构——堆。堆是一个可以自组织的二叉树,其添加与删除操作可以让最小的元素移动到根,而无需花费时间对元素进行排序。

映射

映射数据结构用于存放键/值对,知道某些关键信息,可以查找与之关联的元素。

基本映射

Java类库我映射提供了两个通用的实现:HashMapTreeMap

映射视图

集合框架不认为映射本身是一个集合。(其他数据结构框架认为映射是一个键/值对集合,或者是按键索引的值集合)。不过,可以得到视图——实现了 Collection 接口或某个子接口的对象。

keySet()values()entrySet()

注: keySet 不是 HashSet 或 TreeSet,而是实现了 Set 接口的另外某个类的对象。

可以在集视图中删除元素,它们将从该映射中删除,但是不能添加任何元素

弱散列映射

WeakHashMap类使用弱引用保存键。WeakReference 对象将包含另一个对象的引用,在这里,就是一个散列表键。正常情况下,如果垃圾回收器发现某个特定的对象已经没有他人引用,就会将其回收。
然而,如果某个对象只能由 WeakReference 引用,垃圾回收器也会将其回收,但会将这个对象的弱引用放进一个队列。WeakHashMap 将周期性地检查队列,以便找出新添加的弱引用。一个若引用进入队列意味着这个键不再被他人使用,并且已经回收。于是,WeakHashMap 将删除相关联的映射。

链接散列集合映射

LinkedHashMapLinkedHashSet会记住插入元素项的顺序。

枚举集与映射

EnumSet是一个枚举类型元素集的高效实现。内部用位序列实现。

EnumMap是一个键类型为枚举类型的映射

标识散列映射

IdentityHashMap类有特殊用途。该类中,键的散列值由 System.identityHashCode 计算,是根据对象的内存地址计算散列码所使用的方法。因此在比较对象时采用==,不同的键对象即使内容相同,也被视为不同的对象。

在实现对象遍历算法(如对象串行化)时,这个类十分有用,可以用来跟踪哪些对象已经遍历过。

加载全部内容

相关教程
猜你喜欢
用户评论