java常用容器简要性能分析(List。Map。Set)

时间:2020-03-29 意必固我人气:0

嗯，实习的时候看到这个，感觉蛮好，这里摘录学习，生活加油：

我曾经害怕别人嘲笑的目光，后来，发现他们的目光不会在我身上停留太久，人们更愿意把目光放在自己身上。知乎上看到，讲给自己。

List

List和Set都属于Collection的子接口，List集合中的元素是按照插入顺序进行排列的，允许出现重复元素，

List接口下的常用实现类有ArrayList和LinkedList，对于List来讲，

元素只能是通过set更新，不能通过add更新，通过add只能在指定索引位置添加元素，不会实现元素的覆盖，通过remove移除

接口继承关系：

ArrayList ：

// 查找指定位置元素的下标
public int indexOf(Object o);
// 查找指定元素最后一次出现的位置
public int lastIndexOf(Object o) ；
// 清空集合元素
public void clear()；
// 等等......

ArrayList的特点: **

ArrayList内部是使用数组来存储数据，并且是一个"动态"的数组，在添加元素时，如果发现容量不够时，会进行扩容。
ArrayList支持随机访问元素，随机访问元素的效率是O（1）
ArrayList在尾部添加元素的效率为O（1），add方法默认在尾部进行添加，在使用的时候最好在尾部添加元素效率更佳
ArrayList在进行删除元素或者在中间、头部插入元素时会导致数组内部移动，进行数组拷贝，平均时间复杂度为O（n）

ArrayList的迭代方式:

1、下标迭代

// 使用下标对List进行外部迭代
for (int i = 0; i < list.size(); i++) { System.out.println(list.get(i));}

2、可以使用增强for进行迭代

// 采用增强for的迭代方式其实底层是使用迭代器进行迭代，在迭代的过程中不允许对元素进行修改
for (String s : list) { System.out.println(s);}

3、采用内部迭代的方式

// 内部迭代forEach,在迭代的过程中仍然不允许对元素进行修改过删除操作
list.forEach(item -> System.out.println(item));
// 内部迭代还支持并行方式对元素进行迭代 如果数据量非常大的时候可以采用该方式（一般不采用）迭代出来的元素可能无序
list.parallelStream().forEach(System.out::println);

list.stream().forEach(System.out::print);

4、内部迭代底层实现

public void forEach(Consumer<? super E> action) { Objects.requireNonNull(action);
final int expectedModCount = modCount; @SuppressWarnings("unchecked")
final E[] elementData = (E[]) this.elementData; final int size = this.size;
for (int i=0; modCount == expectedModCount && i < size; i++) { action.accept(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}

5、使用迭代器进行迭代

// 直接使用迭代器进行迭代 这种迭代方式允许在迭代中对元素进行修改和删除操作
Iterator<Long> iterator = list.iterator(); while (iterator.hasNext()){
System.out.println(iterator.next());
}

几种迭代方式的性能比较
在数据规模为一千万的情况下内部迭代表现较好，尽管在千万级的数据量并行迭代依然速度不快，因为在线程的频换切换和销毁等因素造成了一定的开销。

在百万数据规模的情况下，增强for的性能较好，可以根据数据量来对元素进行迭代，fori方式和增强for性能差异不是很大。

LinkedList:

LinkedList继承自AbstractSequentialList可以知道LinkedList的元素是顺序访问的，随机访问元素需要对链表进行遍历，同样实现了克隆和序列化接口LinkedList还实现了Deque相关的方法，可以当做一个队列来使用
LinkedList的类继承关系

LinkedList的特点:

LinkedList的内部数据结构是一个双向链表，有一个头结点和一个尾部节点，在头部和尾部插入的效率非常高O（1）
LinkedList的平均查找效率为O（n）
LinkedList的删除和修改都需要先定位元素的位置，但是对于删除操作本身只需要O（1）的时间复杂度LinkedList因为采用了链表结构，所以理论空间是没有限制的，不需要扩容
LinkedList在使用下标访问元素的时候使用了折半查找，但是在数据量大的情况下，查找效率依然很慢便于用作LRU

LinkedList的迭代方式

LinkedList的迭代方式其实和ArrayList大同小异，但是ArrayList在进行get（index）的操作只需要O（1）的时间复杂度

所以我们在使用LinkedList的时候不采用fori形式的遍历

增强for方式进行遍历，其实相当于使用迭代器进行访问，增强for反编译以后其实就是iterator
使用迭代器对链表进行迭代，Linked的迭代器内部就是从头节点开始依次向下寻找节点
使用内部迭代forEach方式

几种迭代方式的比较:

LinkedList使用增强for方式进行遍历速度较快，使用该fori进行遍历时候，在百万级数据量程序直接卡死，所以LinkedList严禁使用fori遍历　　
在千万级别数据量的情况下，速度和ArrayList差不多，但ArrayList较快，因为ArrayList数据空间是连续的

ArrayList和LinkedList的区别

是否保证线程安全： ArrayList 和 LinkedList 都是不同步的，也就是不保证线程安全；
底层数据结构： Arraylist 底层使用的是Object数组；LinkedList 底层使用的是双向链表数据结构（JDK1.6之前为循环链表，JDK1.7取消了循环。注意双向链表和双向循环链表的区别，下面有介绍到！）
插入和删除是否受元素位置的影响：
- ① ArrayList 采用数组存储，所以插入和删除元素的时间复杂度受元素位置的影响。比如：执行add(E e)方法的时候， ArrayList 会默认在将指定的元素追加到此列表的末尾，这种情况时间复杂度就是O(1)。但是如果要在指定位置 i 插入和删除元素的话（add(int index, E element)）时间复杂度就为 O(n-i)。因为在进行上述操作的时候集合中第 i 和第 i 个元素之后的(n-i)个元素都要执行向后位/向前移一位的操作。
- ② LinkedList 采用链表存储，所以插入，删除元素时间复杂度不受元素位置的影响，都是近似 O（1）而数组为近似 O（n）。
是否支持快速随机访问： LinkedList 不支持高效的随机元素访问，而 ArrayList 支持。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)方法)。
内存空间占用： ArrayList的空间浪费主要体现在在list列表的结尾会预留一定的容量空间，而LinkedList的空间花费则体现在它的每一个元素都需要消耗比ArrayList更多的空间（因为要存放直接后继和直接前驱以及数据）

Map:

Map是双列集合，即存储元素的时候是键值对的形式在Map中存储的，一个Entry<K,V>结构的键值对映射，一个键对应一个值，不允许出现重复的键，

HashMap

HashMap的类继承关系:

HashMap继承自AbstractMap同样一个抽象类的出现是为了实现一些子类通用的方法，一些个性化的方法还需要子类去实现
HashMap内部是使用了散列表+红黑树进行存储数据的，即数组+链表+红黑树

HashMap的特点

HashMap使用位运算将HashMap中数组的大小一定是2的N次方，保证了在取出元素时候通过与运算能更高效和更精确的定位数组下标
- 　　
即使两个不一样的元素也可能会出现同样的hashCode，HashMap使用拉链法设计解决了Hash冲突问题,同一个散列槽（在我们这里就是数组的每一个槽）中的所有元素放到一个链表中
HashMap在某一个槽上的链表长度大于等于8的时候并且HashMap中数组的长度大于等于64会进行树化，将链表转换成红黑树以提升查询效率
在增删改查元素的时候平均时间复杂度为O（1）非常高效
HashMap在插入的时候允许空键空值
HashMap是非同步的，多线程同时操作的时候会发生并发修改异常

HashMap的迭代方式

通过keySet||valueSet进行遍历

// 获取到所有的key然后依次进行获取
Set<Integer> keySet = map.keySet(); Integer val = 0;
for (Integer key : keySet) { val = map.get(key);
System.out.print("");
}

通过entrySet对map进行遍历

Set<Map.Entry<Integer, Integer>> entrySet = map.entrySet();
for (Map.Entry<Integer, Integer> entry : entrySet) {
System.out.print("");
}

使用内部迭代

Map<Object,Object> objectObjectMap = new HashMap<>();
objectObjectMap.forEach( (o1, o2) ->System.out.println(o1.toString()+o2));
// 内部迭代底层依然是使用entrySet进行迭代，效率不如直接使用外部迭代
default void forEach(BiConsumer<? super K, ? super V> action) { Objects.requireNonNull(action);
for (Map.Entry<K, V> entry : entrySet()) { K k;
V v; try {
k = entry.getKey();
v = entry.getValue();
} catch(IllegalStateException ise) {
// this usually means the entry is no longer in the map. throw new ConcurrentModificationException(ise);
}
action.accept(k, v);
}
}

几种迭代方式的性能差异

LinkedHashMap:

LinkedHashMap是HashMap的一个子类，内部维护了一个双向链表保证了元素插入的顺序

HashMap的类继承关系

LinkedHashMap的数据结构

LinkedHashMap的特点

LinkedHashMap是HashMap的子类，其增删改查的平均时间复杂度依然是O（1）
LinkedHashMap的节点占用了更多的空间，包括指向前一个节点的指针before和指向后一个节点的after指针
LinkedHashMap默认使用插入顺序进行遍历，也可以使用访问顺序，将accessOrder置为true即可

LinkedHashMap的迭代方式

使用keySet进行遍历，keySet返回的是一个LinkedKeySet，LinkedKeySet的遍历方式是按照插入时候的顺序
使用entrySet进行遍历，返回LinkedEntrySet
使用内部迭代forEach

public void forEach(BiConsumer<? super K, ? super V> action) { if (action == null)
throw new NullPointerException(); int mc = modCount;
for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after) action.accept(e.key, e.value);
if (modCount != mc)
throw new ConcurrentModificationException();
}

TreeMap

TreeMap中的元素默认按照keys的自然排序排列。（对Integer来说，其自然排序就是数字的升序；对String来说，其自然排序就是按照字母表排序）

TreeMap的定义如下：

public class TreeMap<K,V>
extends AbstractMap<K,V>
implements NavigableMap<K,V>, Cloneable, java.io.Serializable

TreeMap继承AbstractMap，实现NavigableMap、Cloneable、Serializable三个接口。其中AbstractMap表明TreeMap为一个Map即支持key-value的集合， NavigableMap（更多）则意味着它支持一系列的导航方法，具备针对给定搜索目标返回最接近匹配项的导航方法。

TreeMap中同时也包含了如下几个重要的属性：

//比较器，因为TreeMap是有序的，通过comparator接口我们可以对TreeMap的内部排序进行精密的控制
private final Comparator<? super K> comparator;
//TreeMap红-黑节点，为TreeMap的内部类
private transient Entry<K,V> root = null;
//容器大小
private transient int size = 0;
//TreeMap修改次数
private transient int modCount = 0;
//红黑树的节点颜色--红色
private static final boolean RED = false;
//红黑树的节点颜色--黑色
private static final boolean BLACK = true;

对于叶子节点Entry是TreeMap的内部类，它有几个重要的属性：

//键
K key;
//值
V value;
//左孩子
Entry<K,V> left = null;
//右孩子
Entry<K,V> right = null;
//父亲
Entry<K,V> parent;
//颜色
boolean color = BLACK;

数据结构：基于红黑树的一种实现，红黑树是自平横的二叉搜索树。二叉搜索树是排序好的二叉树。

Set

Set集合存储元素的特点就是，set存储元素都是无序并且不可重复的，比较常用的两种有HashSet和TreeSet
HashSet：

HashSet的类继承关系

Hashset的顶级接口是Collection接口，属于单列集合，即每次存储一个元素
HashSet的数据结构

private transient HashMap<E,Object> map;// 内部维护了一个map，其底层实现靠的就是HashMap，键用于存放值

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();// 这个空的Object对象作为所有的默认Value

/**
*Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
*default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap<>();
}

// add方法其实就是调用了map的put，并传入一个空的value 
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}

因为Set的元素和HashMap中的键是有相同的特征的，HashSet充分利用了HashMap的功能

HashSet的特点:

存储元素时会去重，即集合中的元素都是不可重复的
HashSet没有get方法，其实道理也很显而易见，因为元素是无序的所以不能根据下标来访问元素
HashSet的本质就是HashMap

HashSet的迭代方式:

使用迭代器进行迭代，其实本质上返回的就是HashMap的keySet

public Iterator<E> iterator() { return map.keySet().iterator();
}

使用forEach进行内部迭代，性能不如直接使用迭代器

set.forEach(k->System.out.println(k));

TreeSet

TreeSet是基于TreeMap实现的，TreeSet的元素支持2种排序方式：自然排序或者根据提供的Comparator进行排序。

继承关系：

TreeSet的特点

TreeSet中存储的元素是有序且不可重复的，所谓有序就是按照元素自身的排序顺序，或者使用者自定义比较方式
和HashSet类似TreeSet的底层实现就是TreeMap

public TreeSet() {
this(new TreeMap<E,Object>());
}

加载全部内容