北大青鸟java培训:Java中最常用的集合类框架?

Python020

北大青鸟java培训:Java中最常用的集合类框架?,第1张

一、HashMap的概述    HashMap可以说是Java中最常用的集合类框架之一,是Java语言中非常典型的数据结构。

   HashMap是基于哈希表的Map接口实现的,此实现提供所有可选的映射操作。

甘肃电脑培训http://www.kmbdqn.cn/发现存储的是对的映射,允许多个null值和一个null键。

但此类不保证映射的顺序,特别是它不保证该顺序恒久不变。

 除了HashMap是非同步以及允许使用null外,HashMap类与Hashtable大致相同。

此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get和put)提供稳定的性能。

迭代collection视图所需的时间与HashMap实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。

所以,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。

HashMap的实例有两个参数影响其性能:初始容量和加载因子。

容量是哈希表中桶的数量,初始容量只是哈希表在创建时的容量。

加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度。

当哈希表中的条目数超出了加载因子与当前容量的乘积时,则要对该哈希表进行rehash操作(即重建内部数据结构),从而哈希表将具有大约两倍的桶数。

    通常,默认加载因子(0.75)在时间和空间成本上寻求一种折衷。

加载因子过高虽然减少了空间开销,但同时也增加了查询成本(在大多数HashMap类的操作中,包括get和put操作,都反映了这一点)。

在设置初始容量时应该考虑到映射中所需的条目数及其加载因子,以便最大限度地减少rehash操作次数。

如果初始容量大于最大条目数除以加载因子,则不会发生rehash操作。

注意,此实现不是同步的。

如果多个线程同时访问一个HashMap实例,而其中至少一个线程从结构上修改了列表,那么它必须保持外部同步。

这通常是通过同步那些用来封装列表的对象来实现的。

但如果没有这样的对象存在,则应该使用{@linkCollections#synchronizedMapCollections.synchronizedMap}来进行“包装”,该方法最好是在创建时完成,为了避免对映射进行意外的非同步操作。

Mapm=Collections.synchronizedMap(newHashMap(...))  二、构造函数HashMap提供了三个构造函数:HashMap():构造一个具有默认初始容量(16)和默认加载因子(0.75)的空HashMap。

HashMap(intinitialCapacity):构造一个带指定初始容量和默认加载因子(0.75)的空HashMap。

HashMap(intinitialCapacity,floatloadFactor):构造一个带指定初始容量和加载因子的空HashMap。

这里提到了两个参数:初始容量,加载因子。

这两个参数是影响HashMap性能的重要参数,其中容量表示哈希表中桶的数量,初始容量是创建哈希表时的容量,加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度,它衡量的是一个散列表的空间的使用程度,负载因子越大表示散列表的装填程度越高,反之愈小。

对于使用链表法的散列表来说,查找一个元素的平均时间是O(1+a),因此如果负载因子越大,对空间的利用更充分,然而后果是查找效率的降低;如果负载因子太小,那么散列表的数据将过于稀疏,对空间造成严重浪费。

系统默认负载因子为0.75,一般情况下我们是无需修改的。

HashMap是一种支持快速存取的数据结构,要了解它的性能必须要了解它的数据结构。

java集合里面的函数

java集合里面的函数_java集合【1】——— 从集合接口框架说起

百里方欣

原创

关注

0点赞·155人阅读

(一) java集合分类

之前大概分为三种,Set,List,Map三种,JDK5之后,增加Queue.主要由Collection和Map两个接口衍生出来,同时Collection接口继承Iterable接口,所以我们也可以说java里面的集合类主要是由Iterable和Map两个接口以及他们的子接口或者其实现类组成。我们可以认为Collection接口定义了单列集合的规范,每次只能存储一个元素,而Map接口定义了双列集合的规范,每次能存储一对元素。

Iterable接口:主要是实现遍历功能

Collection接口: 允许重复

Set接口:无序,元素不可重复,访问元素只能通过元素本身来访问。

List接口:有序且可重复,可以根据元素的索引来访问集合中的元素。

Queue接口:队列集合

Map接口:映射关系,简单理解为键值对,Key不可重复,与Collection接口关系不大,只是个别函数使用到。

整个接口框架关系如下(来自百度百科):

(1) Iterable接口

1. 内部定义的方法

java集合最源头的接口,实现这个接口的作用主要是集合对象可以通过迭代器去遍历每一个元素。

源码如下:

// 返回一个内部元素为T类型的迭代器(JDK1.5只有这个接口)

Iterator iterator()

// 遍历内部元素,action意思为动作,指可以对每个元素进行操作(JDK1.8添加)

default void forEach(Consumer super T>action) {}

// 创建并返回一个可分割迭代器(JDK1.8添加),分割的迭代器主要是提供可以并行遍历元素的迭代器,可以适应现在cpu多核的能力,加快速度。

default Spliterator spliterator() {

return Spliterators.spliteratorUnknownSize(iterator(), 0)

}

从上面可以看出,foreach迭代以及可分割迭代,都加了default关键字,这个是Java 8 新的关键字,以前接口的所有接口,具体子类都必须实现,而对于deafult关键字标识的方法,其子类可以不用实现,这也是接口规范发生变化的一点。

下面我们分别展示三个接口的调用:

1.1 iterator方法

public static void iteratorHasNext(){

List list=new ArrayList()

list.add("Jam")

list.add("Jane")

list.add("Sam")

// 返回迭代器

Iterator iterator=list.iterator()

// hashNext可以判断是否还有元素

while(iterator.hasNext()){

//next()作用是返回当前指针指向的元素,之后将指针移向下个元素

System.out.println(iterator.next())

}

}

当然也可以使用for-each loop方式遍历

for (String item : list) {

System.out.println(item)

}

但是实际上,这种写法在class文件中也是会转成迭代器形式,这只是一个语法糖。class文件如下:

public class IterableTest {

public IterableTest() { }

public static void main(String[] args) {

iteratorHasNext()

}

public static void iteratorHasNext() {

List list = new ArrayList()

list.add("Jam")

list.add("Jane")

list.add("Sam")

Iterator iterator = list.iterator()

Iterator var2 = list.iterator()

while(var2.hasNext()) {

String item = (String)var2.next()

System.out.println(item)

}

}

}

需要注意的一点是,迭代遍历的时候,如果删除或者添加元素,都会抛出修改异常,这是由于快速失败【fast-fail】机制。

public static void iteratorHasNext(){

List list=new ArrayList()

list.add("Jam")

list.add("Jane")

list.add("Sam")

for (String item : list) {

if(item.equals("Jam")){

list.remove(item)

}

System.out.println(item)

}

}

从下面的错误我们可以看出,第一个元素是有被打印出来的,也就是remove操作是成功的,只是遍历到第二个元素的时候,迭代器检查,发现被改变了,所以抛出了异常。

Jam

Exception in thread "main" java.util.ConcurrentModificationException

at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:909)

at java.util.ArrayList$Itr.next(ArrayList.java:859)

at IterableTest.iteratorHasNext(IterableTest.java:15)

at IterableTest.main(IterableTest.java:7)

1.2 forEach方法

其实就是把对每一个元素的操作当成了一个对象传递进来,对每一个元素进行处理。

default void forEach(Consumer super T>action) {

Objects.requireNonNull(action)

for (T t : this) {

action.accept(t)

}

}

```java

当然像ArrayList自然也是有自己的实现的,那我们就可以使用这样的写法,简洁优雅。forEach方法在java8中参数是`java.util.function.Consumer`,可以称为**消费行为**或者说**动作**类型。

```java

list.forEach(x ->System.out.print(x))

同时,我们只要实现Consumer接口,就可以自定义动作,如果不自定义,默认迭代顺序是按照元素的顺序。

public class ConsumerTest {

public static void main(String[] args) {

List list=new ArrayList()

list.add("Jam")

list.add("Jane")

list.add("Sam")

MyConsumer myConsumer = new MyConsumer()

Iterator it = list.iterator()

list.forEach(myConsumer)

}

static class MyConsumer implements Consumer {

@Override

public void accept(Object t) {

System.out.println("自定义打印:" + t)

}

}

}

输出的结果:

自定义打印:Jam

自定义打印:Jane

自定义打印:Sam

1.3 spliterator方法

这是一个为了并行遍历数据元素而设计的迭代方法,返回的是Spliterator,是专门并行遍历的迭代器。以发挥多核时代的处理器性能,java默认在集合框架中提供了一个默认的Spliterator实现,底层也就是Stream.isParallel()实现的,我们可以看一下源码:

// stream使用的就是spliterator

default Stream stream() {

return StreamSupport.stream(spliterator(), false)

}

default Spliterator spliterator() {

return Spliterators.spliterator(this, 0)

}

public static Stream stream(Spliterator spliterator, boolean parallel) {

Objects.requireNonNull(spliterator)

return new ReferencePipeline.Head<>(spliterator,

StreamOpFlag.fromCharacteristics(spliterator),

parallel)

}

使用的方法如下:

public static void spliterator(){

List list = Arrays.asList("1", "2", "3","4","5","6","7","8","9","10")

// 获取可迭代器

Spliterator spliterator = list.spliterator()

// 一个一个遍历

System.out.println("tryAdvance: ")

spliterator.tryAdvance(item->System.out.print(item+" "))

spliterator.tryAdvance(item->System.out.print(item+" "))

System.out.println("\n-------------------------------------------")

// 依次遍历剩下的

System.out.println("forEachRemaining: ")

spliterator.forEachRemaining(item->System.out.print(item+" "))

System.out.println("\n------------------------------------------")

// spliterator1:0~10

Spliterator spliterator1 = list.spliterator()

// spliterator1:6~10 spliterator2:0~5

Spliterator spliterator2 = spliterator1.trySplit()

// spliterator1:8~10 spliterator3:6~7

Spliterator spliterator3 = spliterator1.trySplit()

System.out.println("spliterator1: ")

spliterator1.forEachRemaining(item->System.out.print(item+" "))

System.out.println("\n------------------------------------------")

System.out.println("spliterator2: ")

spliterator2.forEachRemaining(item->System.out.print(item+" "))

System.out.println("\n------------------------------------------")

System.out.println("spliterator3: ")

spliterator3.forEachRemaining(item->System.out.print(item+" "))

}

tryAdvance() 一个一个元素进行遍历

forEachRemaining() 顺序地分块遍历

trySplit()进行分区形成另外的 Spliterator,使用在并行操作中,分出来的是前面一半,就是不断把前面一部分分出来

结果如下:

tryAdvance:

1 2

-------------------------------------------

forEachRemaining:

3 4 5 6 7 8 9 10

------------------------------------------

spliterator1:

8 9 10

------------------------------------------

spliterator2:

1 2 3 4 5

------------------------------------------

spliterator3:

6 7

还有一些其他的用法在这里就不列举了,主要是trySplit()之后,可以用于多线程遍历。理想的时候,可以平均分成两半,有利于并行计算,但是不是一定平分的。

2. Collection接口 extend Iterable

Collection接口可以算是集合类的一个根接口之一,一般不能够直接使用,只是定义了一个规范,定义了添加,删除等管理数据的方法。继承Collection接口的有List,Set,Queue,不过Queue定义了自己的一些接口,相对来说和其他的差异比较大。

2.1 内部定义的方法

源码如下:

boolean add(Object o) //添加元素

boolean remove(Object o) //移除元素

boolean addAll(Collection c) //批量添加

boolean removeAll(Collection c) //批量移除

void retainAll(Collection c) // 移除在c中不存在的元素

void clear() //清空集合

int size() //集合大小

boolean isEmpty() //是否为空

boolean contains(Object o) //是否包含在集合中

boolean containsAll(Collection c) //是否包含所有的元素

Iterator iterator() // 获取迭代器

Object[] toArray() // 转成数组

default boolean removeIf(Predicate super E>filter) {} // 删除集合中复合条件的元素,删除成功返回true

boolean equals(Object o)

int hashCode()

default Spliterator spliterator() {} //获取可分割迭代器

default Stream stream() {} //获取流

default Stream parallelStream() {} //获取并行流

里面获取并行流的方法parallelStream(),其实就是通过默认的ForkJoinPool(主要用来使用分治法(Divide-and-Conquer Algorithm)来解决问题),提高多线程任务的速度。我们可以使用ArrayList来演示一下平行处理能力。例如下面的例子,输出的顺序就不一定是1,2,3...,可能是乱序的,这是因为任务会被分成多个小任务,任务执行是没有特定的顺序的。

List list = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9)

list.parallelStream()

.forEach(out::println)

2.2 继承Collection的主要接口

graph LR

Collection -->List-有顺序,可重复

List-有顺序,可重复 -->LinkedList-使用链表实现,线程不安全

List-有顺序,可重复 -->ArrayList-数组实现,线程不安全

List-有顺序,可重复 -->Vector-数组实现,线程安全

Vector-数组实现,线程安全 -->Stack-堆栈,先进后出

Collection-->Set-不可重复,内部排序

Set-不可重复,内部排序-->HashSet-hash表存储

HashSet-hash表存储-->LinkHashSet-链表维护插入顺序

Set-不可重复,内部排序-->TreeSet-二叉树实现,排序

Collection-->Queue-队列,先进先出

2.2.1 List extend Collection

继承于Collection接口,有顺序,取出的顺序与存入的顺序一致,有索引,可以根据索引获取数据,允许存储重复的元素,可以放入为null的元素。

最常见的三个实现类就是ArrayList,Vector,LinkedList,ArrayList和Vector都是内部封装了对数组的操作,唯一不同的是,Vector是线程安全的,而ArrayList不是,理论上ArrayList操作的效率会比Vector好一些。

里面是接口定义的方法:

int size()//获取大小

boolean isEmpty()//判断是否为空

boolean contains(Object o)//是否包含某个元素

Iterator iterator()//获取迭代器

Object[] toArray()// 转化成为数组(对象)

T[] toArray(T[] a)// 转化为数组(特定位某个类)

boolean add(E e)//添加

boolean remove(Object o)//移除元素

boolean containsAll(Collection>c)// 是否包含所有的元素

boolean addAll(Collection extends E>c)//批量添加

boolean addAll(int index, Collection extends E>c)//批量添加,指定开始的索引

boolean removeAll(Collection>c)//批量移除

boolean retainAll(Collection>c)//将c中不包含的元素移除

default void replaceAll(UnaryOperator operator) {}//替换

default void sort(Comparator super E>c) {}// 排序

void clear()//清除所有的元素

boolean equals(Object o)//是否相等

int hashCode()//计算获取hash值

E get(int index)//通过索引获取元素

E set(int index, E element)//修改元素

void add(int index, E element)//在指定位置插入元素

E remove(int index)//根据索引移除某个元素

int indexOf(Object o)//根据对象获取索引

int lastIndexOf(Object o)//获取对象元素的最后一个元素

ListIterator listIterator()// 获取List迭代器

ListIterator listIterator(int index)// 根据索引获取当前的位置的迭代器

List subList(int fromIndex, int toIndex)//截取某一段数据

default Spliterator spliterator(){} //获取可切分迭代器

上面的方法都比较简单,值得一提的是里面出现了ListIterator,这是一个功能更加强大的迭代器,继承于Iterator,只能用于List类型的访问,拓展功能例如:通过调用listIterator()方法获得一个指向List开头的ListIterator,也可以调用listIterator(n)获取一个指定索引为n的元素的ListIterator,这是一个可以双向移动的迭代器。

操作数组索引的时候需要注意,由于List的实现类底层很多都是数组,所以索引越界会报错IndexOutOfBoundsException。

说起List的实现子类:

ArrayList:底层存储结构是数组结构,增加删除比较慢,查找比较快,是最常用的List集合。线程不安全。

LinkedList:底层是链表结构,增加删除比较快,但是查找比较慢。线程不安全。

Vector:和ArrayList差不多,但是是线程安全的,即同步。

2.2.2 Set extend Collection

Set接口,不允许放入重复的元素,也就是如果相同,则只存储其中一个。

下面是源码方法:

int size()//获取大小

boolean isEmpty()//是否为空

boolean contains(Object o)//是否包含某个元素

Iterator iterator()//获取迭代器

Object[] toArray()//转化成为数组

T[] toArray(T[] a)//转化为特定类的数组

boolean add(E e)//添加元素

boolean remove(Object o)//移除元素

boolean containsAll(Collection>c)//是否包含所有的元素

boolean addAll(Collection extends E>c)//批量添加

boolean retainAll(Collection>c)//移除所有不存在于c集合中的元素

boolean removeAll(Collection>c)//移除所有在c集合中存在的元素

void clear()//清空集合

boolean equals(Object o)//是否相等

int hashCode()//计算hashcode

default Spliterator spliterator() {} //获取可分割迭代器

主要的子类:

HashSet

允许空值

通过HashCode方法计算获取hash值,确定存储位置,无序。

LinkedHashSet

HashSet的子类

有顺序

TreeSet

如果无参数构建Set,则需要实现Comparable方法。

亦可以创建时传入比较方法,用于排序。

2.2.3 Queue extend Collection

队列接口,在Collection接口的接触上添加了增删改查接口定义,一般默认是先进先出,即FIFO,除了优先队列和栈,优先队列是自己定义了排序的优先顺序,队列中不允许放入null元素。

下面是源码:

boolean add(E e)//插入一个元素到队列,失败时返回IllegalStateException (如果队列容量不够)

boolean offer(E e)//插入一个元素到队列,失败时返回false

E remove()//移除队列头的元素并移除

E poll()//返回并移除队列的头部元素,队列为空时返回null

E element()//返回队列头元素

E peek()//返回队列头部的元素,队列为空时返回null

主要的子接口以及实现类有:

Deque(接口):Queue的子接口,双向队列,可以从两边存取

ArrayDeque:Deque的实现类,底层用数组实现,数据存贮在数组中

AbstractQueue:Queue的子接口,仅实现了add、remove和element三个方法

PriorityQueue:按照默认或者自己定义的顺序来排序元素,底层使用堆(完全二叉树)实现,使用动态数组实现,

BlockingQueue: 在java.util.concurrent包中,阻塞队列,满足当前无法处理的操作。

(2) Map接口

定义双列集合的规范Map,每次存储一对元素,即key和value。

key的类型可以和value的类型相同,也可以不同,任意的引用类型都可以。

key是不允许重复的,但是value是可以重复的,所谓重复是指计算的hash值系统。

下面的源码的方法:

V put(K key, V value)// 添加元素

V remove(Object key)// 删除元素

void putAll(Map extends K, ? extends V>m)// 批量添加

void clear() // 移除所有元素

V get(Object key)// 通过key查询元素

int size()// 查询集合大小

boolean isEmpty()// 集合是否为空

boolean containsKey(Object key)// 是否包含某个key

boolean containsValue(Object value)// 是否包含某个value

Set keySet()// 获取所有key的set集合

Collection values()// 获取所有的value的set集合

Set>entrySet()// 返回键值对的set,每一个键值对是一个entry对象

boolean equals(Object o)// 用于比较的函数

int hashCode()// 计算hashcode

default V getOrDefault(Object key, V defaultValue) // 获取key对应的Value,没有则返回默认值()

default void forEach(BiConsumer super K, ? super V>action) {} // 遍历

default void replaceAll(BiFunction super K, ? super V, ? extends V>function) {} // 批量替换

// 缺少这个key的时候才会添加进去

// 返回值是是key对应的value值,如果不存在,则返回的是刚刚放进去的value

default V putIfAbsent(K key, V value) {}

default boolean remove(Object key, Object value) {} // 移除元素

default boolean replace(K key, V oldValue, V newValue) {} // 替换

default V replace(K key, V value) {} //替换

// 和putIfAbsent有点像,只不过传进去的mappingFunction是映射函数,也就是如果不存在key对应的value,将会执行函数,函数返回值会被当成value添加进去,同时返回新的value值

default V computeIfAbsent(K key,Function super K, ? extends V>mappingFunction) {}

// 和computeIfAbsent方法相反,只有key存在的时候,才会执行函数,并且返回

default V computeIfPresent(K key,BiFunction super K, ? super V, ? extends V>remappingFunction) {}

// 不管如何都会执行映射函数,返回value

default V compute(K key,BiFunction super K, ? super V, ? extends V>remappingFunction) {}

default V merge(K key, V value,BiFunction super V, ? super V, ? extends V>remappingFunction) {}

值得注意的是,Map里面定义了一个Entry类,其实就是定义了一个存储数据的类型,一个entry就是一个.

Map的常用的实现子类:

HashMap:由数组和链表组成,线程不安全,无序。

LinkedHashMap:如果我们需要是有序的,那么就需要它,时间和空间效率没有HashMap那么高,底层是维护一条双向链表,保证了插入的顺序。

ConcurrentHashMap:线程安全,1.7JDK使用锁分离,每一段Segment都有自己的独立锁,相对来说效率也比较高。JDK1.8抛弃了Segment,使用Node数组+链表和红黑树实现,在线程安全控制上使用Synchronize和CAS,可以认为是优化的线程安全的HashMap。

HashTable:对比与HashMap主要是使用关键字synchronize,加上同步锁,线程安全。

(二)总结

这些集合原始接口到底是什么?为什么需要?

我想,这些接口其实都是一种规则/规范的定义,如果不这么做也可以,所有的子类自己实现,但是从迭代以及维护的角度来说,这就是一种抽象或者分类,比如定义了Iterator接口,某一些类就可以去继承或者实现,那就得遵守这个规范/契约。可以有所拓展,每个子类的拓展不一样,所以每个类就各有所长,但是都有一个中心,就是原始的集合接口。比如实现Map接口的所有类的中心思想都不变,只是各有所长,各分千秋,形成了大千集合世界。

【作者简介】:

秦怀,公众号【秦怀杂货店】作者,技术之路不在一时,山高水长,纵使缓慢,驰而不息。个人写作方向:Java源码解析,JDBC,Mybatis,Spring,redis,分布式,剑指Offer,LeetCode等,认真写好每一篇文章,不喜欢标题党,不喜欢花里胡哨,大多写系列文章,不能保证我写的都完全正确,但是我保证所写的均经过实践或者查找资料。遗漏或者错误之处,还望指正。

平日时间宝贵,只能使用晚上以及周末时间学习写作,关注我,我们一起成长吧~

说明:先从整体介绍了Java集合框架包含的接口和类,然后河北IT培训http://www.kmbdqn.cn/总结了集合框架中的一些基本知识和关键点,并结合实例进行简单分析。

1、综述    所有集合类都位于java.util包下。

集合中只能保存对象(保存对象的引用变量)。

(数组既可以保存基本类型的数据也可以保存对象)。

    当我们把一个对象放入集合中后,系统会把所有集合元素都当成Object类的实例进行处理。

从JDK1.5以后,这种状态得到了改进:可以使用泛型来限制集合里元素的类型,并让集合记住所有集合元素的类型(参见具体泛型的内容)。

  Java的集合类主要由两个接口派生而出:Collection和Map,Collection和Map是Java集合框架的根接口,这两个接口又包含了一些接口或实现类。

Set、List和Map可以看做集合的三大类。

   List集合是有序集合,集合中的元素可以重复,访问集合中的元素可以根据元素的索引来访问。

   Set集合是无序集合,集合中的元素不可以重复,访问集合中的元素只能根据元素本身来访问(也是不能集合里元素不允许重复的原因)。

   Map集合中保存Key-value对形式的元素,访问时只能根据每项元素的key来访问其value。

对于Set、List和Map三种集合,最常用的实现类分别是HashSet、ArrayList和HashMap三个实现类。

(并发控制的集合类,以后有空研究下)。

2、Collection接口   Collection接口是List、Set和Queue接口的父接口,同时可以操作这三个接口。

Collection接口定义操作集合元素的具体方法大家可以参考API文档,这里通过一个例子来说明Collection的添加元素、删除元素、返回集合中元素的个数以及清空集合元素的方法。

3、两种遍历集合的方法Iterator接口和foreach循环  1、Iterator接口Iterator也是Java集合框架的成员,主要用于遍历(即迭代访问)Collection集合中的元素,也称为迭代器。