Java(十)集合


概述

对比数组

数组在内存存储方面的特点:(所以安全)

  1. 数组初始化以后,长度就确定了。

  2. 数组声明的类型,就决定了进行元素初始化时的类型

数组在存储数据方面的弊端:

  1. 数组初始化以后,长度就不可变了,不便于扩展

  2. 数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。

  3. 同时无法直接获取存储元素的个数

  4. 数组存储的数据是有序的、可以重复的。—->存储数据的特点单一

Java 集合类可以用于存储数量不等的多个对象,还可用于保存具有映射关系的关联数组。

接口

Java 集合可分为Collection 和Map 两种体系

Collection接口:单列数据,定义了存取一组对象的方法的集合

List:元素有序、可重复的集合

Set:元素无序、不可重复的集合

Map接口:双列数据,保存具有映射关系“key-value对”的集合

接口树

Collection接口

  1. Collection 接口是List、Set 和Queue 接口的父接口

  2. JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List) 实现。

  3. 在Java5 之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都当成Object 类型处理;

  4. 从JDK 5.0 增加了泛型以后,Java 集合可以记住容器中对象的数据类型。

方法:

  1. 添加
add(Object obj)

addAll(Collection coll)
  1. 获取有效元素的个数
int size()
  1. 清空集合
void clear()
  1. 是否是空集合
boolean isEmpty()
  1. 是否包含某个元素
boolean contains(Object obj):是通过元素的equals方法来判断是否是同一个对象

boolean containsAll(Collection c):调用元素的equals方法来。拿两个集合的元素挨个比较。
  1. 删除
boolean remove(Object obj) :通过元素的equals方法判断是否是要删除的那个元素。```

只会删除找到的第一个元素
```java
boolean removeAll(Collection coll):取当前集合的差集
  1. 取两个集合的交集
boolean retainAll(Collection c):把交集的结果存在当前集合中,不影响c
  1. 集合是否相等
boolean equals(Object obj)
  1. 转成对象数组
Object[] toArray()
  1. 获取集合对象的哈希值
hashCode()
  1. 遍历
iterator():返回迭代器对象,用于集合遍历

Iterator迭代器接口

Iterator接口

  1. Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素。

  2. Collection接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象。

  3. Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建Iterator 对象,则必须有一个被迭代的集合。

  4. 集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。

遍历集合元素

在调用xxxxx.next()方法之前必须要调用xxxxx.hasNext()进行检测。若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常。

remove()方法

注意:

Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方法,不是集合对象的remove方法。

如果还未调用next()或在上一次调用next 方法之后已经调用了remove 方法,再调用remove都会报IllegalStateException。

foreach 循环遍历集合元素

Collection —— List

鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组

List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。

List容器中的元素可以根据序号存取容器中的元素。

JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。

List接口方法

除了从Collection集合继承的方法外,List 集合里添加了根据索引来操作集合元素的方法。

  1. void add(int index, Object ele):在index位置插入ele元素

  2. boolean addAll(int index, Collection eles):从index位置开始将eles中的所有元素添加进来

  3. Object get(int index):获取指定index位置的元素

  4. int indexOf(Object obj):返回obj在集合中首次出现的位置

  5. int lastIndexOf(Object obj):返回obj在当前集合中末次出现的位置

  6. Object remove(int index):移除指定index位置的元素,并返回此元素

  7. Object set(int index, Object ele):设置指定index位置的元素为ele

  8. List subList(int fromIndex, int toIndex):返回从fromIndex到toIndex位置的子集合

实现类1:ArrayList

ArrayList 是 List 接口的典型实现类、主要实现类

本质上,ArrayList是对象引用的一个”变长”数组

ArrayList的JDK1.8之前与之后的实现区别?

JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组

JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元素时 再创建一个始容量为10的数组

删除的是对应的下角标

改为:list.remove(new Integer(2)) 装箱删除的是对象

Java List 的 remove 方法有两个重载,一个接收 int 型参数(通过下标删除),一个接收 Object 型参数(通过元素删除)。对于List,如果传入一个整型字面值,会删除对应下标处的元素

实现类2:LinkedList

对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高

新增方法:

void addFirst(Object obj)

void addLast(Object obj)

Object getFirst()

Object getLast()

Object removeFirst()

Object removeLast()

LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的first和last,用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。Node除了保存数据,还定义了两个变量:

prev变量记录前一个元素的位置

next变量记录下一个元素的位置

实现类3:Vector

Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。

在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。

list总结

Collection —— Set

Set接口是Collection的子接口,set接口没有提供额外的方法

Set 集合不允许包含相同的元素,如果两个相同的元素加入同个Set 集合,则添加操作失败

Set 判断两个对象是否相同不是使用== 运算符,而是根据equals() 方法

实现类1:HashSet

HashSet 是Set 接口的典型实现,大多数时候使用Set 集合时都使用这个实现类。

HashSet 按Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除性能。

HashSet 具有以下特点:

不能保证元素的排列顺序

HashSet 不是线程安全的

集合元素可以是null

HashSet 集合判断两个元素相等的标准:两个对象通过hashCode() 方法比较相等,并且两个对象的equals() 方法返回值也相等。

对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等规则。即:“相等的对象必须具有相等的散列码”。

向HashSet中添加元素的过程:

当向HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法来得到该对象的 hashCode 值,然后根据 hashCode 值,通过某种散列函数决定该对象在 HashSet 底层数组中的存储位置。(这个散列函数会与底层数组的长度相计算得到在数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,该散列函数设计的越好)
如果两个元素的hashCode()值相等,会再继续调用equals方法,如果equals方法结果为true,添加失败;如果为false,那么会保存该元素,但是该数组的位置已经有元素了,那么会通过链表的方式继续链接。如果两个元素的equals() 方法返回true,但它们的hashCode() 返回值不相等,hashSet 将会把它们存储在不同的位置,但依然可以添加成功。

重写hashCode() 方法的基本原则

  1. 在程序运行时,同一个对象多次调用hashCode() 方法应该返回相同的值。

  2. 当两个对象的equals() 方法比较返回true 时,这两个对象的hashCode()方法的返回值也应相等。

  3. 对象中用作equals() 方法比较的Field,都应该用来计算hashCode 值。

重写equals() 方法的基本原则

以自定义的Customer类为例,何时需要重写equals()?

  1. 当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。

  2. 因此,违反了“相等的对象必须具有相等的散列码”。

  3. 结论:复写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。

实现类2:LinkedHashSet

LinkedHashSet 是HashSet 的子类

LinkedHashSet 根据元素的hashCode 值来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。

LinkedHashSet插入性能略低于HashSet,但在迭代访问Set 里的全部元素时有很好的性能。

LinkedHashSet 不允许集合元素重复。

实现类3:TreeSet

TreeSet 是SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。

TreeSet底层使用红黑树结构存储数据

新增的方法如下:(了解)

Comparator comparator()

Object first()

Object last()

Object lower(Object e)

Object higher(Object e)

SortedSet subSet(fromElement, toElement)

SortedSet headSet(toElement)

SortedSet tailSet(fromElement)

TreeSet 两种排序方法:自然排序和定制排序。默认情况下,TreeSet 采用自然排序。

TreeSet和后面要讲的TreeMap采用红黑树的存储结构

特点:有序,查询速度比List快

hashmap


文章作者: Luan-bx
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Luan-bx !
  目录