java集合详解以及底层实现_java数据结构与算法

java集合详解以及底层实现_java数据结构与算法Java集合学习Collection接口和常用方法Collection接口遍历元素的方式1-使用Iterator(迭代器)Iterator对象成为迭代器,主要用于遍历Collection集合中的元素.所有实现了Coll

Java集合学习

image-20210516165428176

Collection接口和常用方法

  • Collection接口遍历元素的方式1 – 使用Iterator(迭代器)
    1. Iterator对象成为迭代器,主要用于遍历Collection集合中的元素.
    2. 所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象,即可以返回一个迭代器
    3. Iterator仅用于遍历集合,Iterator本身并不存放对象

image-20210516172325404

迭代器的执行原理

Iterator Iterator = coll.iterator(); //得到一个集合的迭代器

hasNext()判断是否还有下一个元素

while(Iterator.hasNext()){ 
    //next() 作用1. 下移 2.将下移以后的集合位置上的元素返回 System.out.println(iterator.next()); } 

测试:

image-20210516174606996

增强for循环(for each) 底层用的也是迭代器

相当于简化版的迭代器

List

image-20210520193200712

List接口和常用方法

  • List接口是Collection接口的子接口

    1. List集合类中元素有序(即添加和取出的顺序一致)、且可重复

    2. List集合中的每个元素都有其对应的顺序索引,即支持索引(索引是从0开始)

    3. List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素

      indexOf(Object obj) 返回元素首次在集合中出现时的位置 lastIndexOf(Object obj) 返回元素最后在集合中出现的位置 add 添加元素 remove 删除元素 set(int index, Object obj) 设置指定index位置的元素为obj,相当于替换 subList(int fromIndex,int toIndex) 返回从fromIndex到toIndex位置的子集合 返回的集合是前闭后开区间[) 

例: 根据图书价格进行排序

image-20210517094223264

使用冒泡排序

image-20210517094329536

ArrayList注意事项
  • ArrayList是线程不安全的在多线程的情况下不建议使用
    • 看源码可知 方法没有 synchronized修饰
  • Vector 是线程安全的 基本等同于ArrayList

ArrayList底层结构和源码分析

注意:

image-20210517193249136

ArrayList底层是数组

结论:

  • ArrayList中维护了一个Object类型的数组elementData

    transient Object[] elementData transient表示瞬间的,短暂的.表示该属性不会被序列化

  • 当创建ArrayList对象时,如果使用的是无参构造器,则初始elementData容量为0,第一次添加,则扩容elementData数组为10,如需要再次扩容,则扩容为原来的1.5倍

  • 如果使用的是指定大小的构造器,则初始化elementData容量为指定大小,如果需要直接扩容elementData为1.5倍

源码解析:

①当走无参构造时

image-20210517152910715

②当走有参构造时

image-20210517152930170

image-20210517152954757

image-20210517153030047

image-20210517153104397

Vector底层结构和源码解析

Vector的基本介绍

  • Vector底层也是一个对象数组, Protected Object[] elementData
  • Vector是线程同步的,即线程安全的,Vector类的操作方法带有Synchronized
  • 在开发中,需要线程同步安全时,考虑使用Vector
ArrayList和Vector的比较

image-20210517195746782

源码分析
1. //调用无参默认为10个 public Vector(){ 
    this(10) } //补充: 如果是 Vector vector = new Vector(9); // 走有参构造 走的方法是: //public Vector(int initialCapacity){ 
    // this.(initialCapacity,0); //} 2.//该方法添加数据到Vector集合 public synchronized boolean add(E e) { 
    modCount++; ensureCapacityHelper(elementCount + 1); elementData[elementCount++] = e; return true; } 3.// 确定是否需要扩容 条件: minCapacity - elementData.length > 0 private void ensureCapacityHelper(int minCapacity) { 
    // overflow-conscious code if (minCapacity - elementData.length > 0) grow(minCapacity); } 4.//如果需要的数组大小不够用,就扩容, 扩容的算法 (就是扩容两倍) private void grow(int minCapacity) { 
    // overflow-conscious code int oldCapacity = elementData.length; int newCapacity = oldCapacity + ((capacityIncrement > 0) ? capacityIncrement : oldCapacity); if (newCapacity - minCapacity < 0) newCapacity = minCapacity; if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); elementData = Arrays.copyOf(elementData, newCapacity); } 

image-20210517203417419

LinkedList底层结构

image-20210518103529182

  • LinkedList实现了双向链表和双端队列特点

  • 可以添加任意元素(元素可以重复),包括null

  • 线程不安全,没有实现同步

  • LinkedList的底层操作机制

    1. LinkedList底层维护了一个双向链表
    2. LinkedList中维护了两个属性first和last分别指向首节点和尾结点
    3. 每个节点(Node对象),里面又维护了prev、next、item三个属性,其中通过prev指向前一个,通过next指向后一个节点。最终实现双向链表。
    4. 所以LinkedList的元素删除和添加,不是通过数组完成的,相对于效率较高
    5. 模拟一个简单的双向链表

例:

public static void main(String[] args) { 
    Node ahui = new Node("阿灰"); Node zhang = new Node("小张"); Node tian = new Node("小田"); //连接三个结点,形成双向链表 ahui.next = zhang; zhang.next = tian; tian.pre = zhang; zhang.pre = ahui; Node first = ahui; //让first引用指向ahui,就是双向链表的头节点 Node last = tian; //让last引用指向tian, 就是双向链表的尾结点 //从头到尾遍历 // while (true){ 
    // if (first == null){ 
    // break; // } // System.err.println(first); // first = first.next; // } //链表的添加对象 //要求,在ahui后zhang前加入onlulmf Node onlylmf = new Node("Onlylmf"); ahui.next = onlylmf; zhang.pre = onlylmf; onlylmf.next = zhang; onlylmf.pre = ahui; //从头到尾遍历 while (true){ 
    if (first == null){ 
    break; } System.err.println(first); first = first.next; } } //定义一个双向链表 static class Node{ 
    public Object item; public Node next; //指向下一个节点 public Node pre; //指向上一个节点 public Node(Object name) { 
    this.item = name; } @Override public String toString() { 
    return "Node name=" + item; } } 
LinkedList源码解读

CRUD解读

增加节点流程:

1. LinkedList linkedList = new LinkedList(); 调用了无参构造初始化 2. 此时LinkedList属性 first = null last = null 3. 执行 添加 public boolean add(E e) { 
    linkLast(e); return true; } 4. 将新节点,加入到双向链表最后 void linkLast(E e) { 
    final Node<E> l = last; final Node<E> newNode = new Node<>(l, e, null); last = newNode; if (l == null) first = newNode; else l.next = newNode; size++; modCount++; } 

删除第一个节点流程:

1. 执行removeFirst public E remove() { 
    return removeFirst(); } 2.执行如下代码 public E removeFirst() { 
    final Node<E> f = first; if (f == null) throw new NoSuchElementException(); return unlinkFirst(f); } 3. 执行unlinkFirst 将f指向的双向链表的第一个节点拿掉 等地GC回收 private E unlinkFirst(Node<E> f) { 
    // assert f == first && f != null; final E element = f.item; final Node<E> next = f.next; f.item = null; f.next = null; // help GC first = next; if (next == null) last = null; else next.prev = null; size--; modCount++; return element; } 

ArrayList和LinkedList的比较

image-20210518103635836

如何选择ArrayList和LinkedList:

  1. 如果我们改查的操作多,选择ArrayList
  2. 如果我们增删多,选择LinkedList
  3. 一般来说,在程序中, 80%-90%都是查询,因此大部分情况下选择ArrayList
  4. 在一个项目中,根据业务灵活选取

Set

Set接口的基本介绍

  • 无序(添加和取出的顺序不一致), 没有索引

  • 不允许重复元素,所以最多包含一个null

  • JDK API中的Set接口的实现类有:

    AbstractSet,ConcurrentSkipListSet,CopyOrWriteArraySet,EnumSet,HashSet,JobStateReasons,LinkedHashSet,TreeSet

Set接口和重用方法

  • Set接口的常用方法

    和List一样,Set接口也是Collection的子接口,因此,常用方法和Collection接口一样

  • Set接口的遍历方式

    同Collection的遍历方式一样,因为Set接口是Collection接口的子接口

    1. 可以使用迭代器
    2. 增强For
    3. 不能使用索引 方式来获取

特点:

  • set接口的实现类的对象(Set接口对象), 不能存放重复的元素,可以添加一个null
  • set接口对象存放数据是无序的(即添加的顺序和取出的顺序不一致)
  • 注意: 取出的顺序的顺序虽然不是添加的顺序,但是他是固定的

HashSet详解

  1. HashSet实现类Set接口

  2. HashSet底层实际上是HashMap

    public HashSet(){ 
          map = new HashMap<>(); } 
  3. 可以存放null值,但是只能有一个null

  4. HashSet不保证元素是有序的,取决于hash后,在确定索引的结果(即, 不保证存放元素的顺序和取出时顺序一致)

  5. 不能有重复的元素/对象

HashSet底层是HashMap, HashMap底层是(数组 + 链表 + 红黑树)

数组+ 链表模拟
public static void main(String[] args) { 
    //模拟一个HashSet的底层(HashMap的底层结构) //1. 创建一个数组,数组类型是Node[] //2. 有些人,直接把 Node[] 数组成为表 Node[] table = new Node[16]; System.err.println("table=" + table); //3. 创建节点 Node john = new Node("john",null); table[2] = john; Node jack = new Node("jack",null); john.next = jack; //将结点jack挂载到john Node rose = new Node("rose",null); jack.next = rose; //将结点rose挂载到jack Node lucy = new Node("lucy", null); table[3] = lucy; System.err.println("table=" + table); } //存放数据的节点 static class Node{ 
    //结点,存储数据, 可以指向下一个结点,从而形成链表 Object item; //存放数据 Node next; //指向下一个结点 public Node(Object item, Node next) { 
    this.item = item; this.next = next; } } 

存放数据后的

image-20210518162219598

🐼 HashSet的扩容机制
  • HashSet底层是HashMap
  • 添加一个元素时,先得到hash值 会转成索引值
  • 找到存储数据表table, 看到这个索引位置是否已经存放的有元素
  • 如果没有,直接加入
  • 如果有,调用equals比较,如果相同,就放弃添加,如果不相同,则添加到最后
  • 在Java8中,如果一条链表的元素个数到达TREEIFY_THRESHOLD(默认是8),并且table的大小>=MIN_TREEIFY_CAPACITY(默认64),就会进行树化(红黑树)

image-20210519114451372

🐼 HashSet源码解读

1. HashSet底层是HashMap,第一次添加时,table数组扩容到16,临界值(threshold)是16*加载因子(loadFactor)是0.75 = 12

2. 如果table数组使用到了临界值12,就会扩容到162=32,新的临界值就是320.75 = 24,依次类推

例如这个临界值12,无论是数据是加在table中还是其中的链表后,数据打到12就会进行扩增

3. 在Java8中,如果一条链表的元素个数到达 TREEIFY_THRESHOLD(默认是8),并且table的大小>=MIN_TREEIFY_CAPACITY(默认64),就会进行树化(红黑树),否则仍然采用数组扩容机制

  1. 调用无参构造
public HashSet() { 
    map = new HashMap<>(); } 
  1. 执行add()方法
//PRESENT就是private static final Object PRESENT = new Object();主要是起到占位作用 public boolean add(E e) { 
    return map.put(e, PRESENT)==null; } 
  1. 执行put()方法, 该方法会执行 hash(key) 得到key对应的hash值
//算是h = key.hashCode() ^ (h >>> 16) 右移16位是防止hash冲突 public V put(K key, V value) { 
    return putVal(hash(key), key, value, false, true); } 
  1. 执行putVal方法**(重点)**
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { 
    Node<K,V>[] tab; Node<K,V> p; int n, i; //定义了辅助变量 //table就是HashMap 的一个数组, 类型是Node[] //if语句表示如果当前table是null 或者 大小=0 //就是第一次扩容, 到16个空间 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //(1)根据key, 得到hash 去计算该key应该存放到table表的哪个索引位置 //并把这个位置的对象,赋给p //(2)判断p是否为null, //(2.1)如果p为null, 表示还没有存放过元素,就创建一个Node (key="传的值", value=PRESENT) //(2.2)就放在该位置 tab[i] = newNode(hash, key, value, null); if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { 
    Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { 
    for (int binCount = 0; ; ++binCount) { 
    if ((e = p.next) == null) { 
    p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { 
    // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; } 

当添加重复元素时,分析源码

4. 执行putVal方法(重点) final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { 
    Node<K,V>[] tab; Node<K,V> p; int n, i; //定义了辅助变量 //table就是HashMap 的一个数组, 类型是Node[] //if语句表示如果当前table是null 或者 大小=0 //就是第一次扩容, 到16个空间 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //(1)根据key, 得到hash 去计算该key应该存放到table表的哪个索引位置 //并把这个位置的对象,赋给p //(2)判断p是否为null, //(2.1)如果p为null, 表示还没有存放过元素,就创建一个Node (key="传的值", value=PRESENT) //(2.2)就放在该位置 tab[i] = newNode(hash, key, value, null); if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { 
    //一个开发技巧: 在需要局部变量(辅助变量)的时候,在创建 Node<K,V> e; K k; //辅助变量 //如果当前索引位置对应的链表的第一个元素和准备添加的key的hash值一样 //并且满足下面连个条件之一: // (1) 准备加入的key和p指向的Node节点的key是同一个对象 // (2) p指向的Node结点的key 的eques()和准备加入的key比较后相同 // 就不能加入 if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; //在判断 p 是不是一颗红黑树 //如果是一颗红黑树, 就调用putTreeVal, 来进行添加 else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { 
    //如果table对应索引位置, 已经是一个链表, 就使用for循环比较 // (1) 依次和该链表的每一个元素比较后,都不相同, 则加入到该链表的最后 // 注意: 在把元素添加到链表后, 立即判断 该链表是否已经达到8个节点 // 如果到了, 就调用treeifyBin() 对当前链表进行树化(转成红黑树) // 注意: 在转成红黑树时,进行判断 if(tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY) resize(); // 如果上面代码成立,先table扩容 (判断table表长度是否大于64) // 只有上面条件不成立时,在进行树化(转换成红黑树) // (2) 依次和该链表的每一个元素比较过程中, 如果有相同的情况,就直接break for (int binCount = 0; ; ++binCount) { 
    if ((e = p.next) == null) { 
    p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { 
    // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; } 

练习题:

定义一个Employee类,该类包含: private成员属性name,age 要求: 创建3个Employee 对象放入HashSet中,当name和age的值相同时,认为是相同的员工,不能添加到HashSet集合中

public static void main(String[] args) { 
    HashSet hashSet = new HashSet(); hashSet.add(new Employee("ahui",21)); hashSet.add(new Employee("ahui1",21)); hashSet.add(new Employee("ahui",21)); System.err.println(hashSet); } static class Employee{ 
    private String name; private Integer age; public Employee(String name, Integer age) { 
    this.name = name; this.age = age; } @Override public String toString() { 
    return "Employee{" + "name='" + name + '\'' + ", age=" + age + '}'; } //重写equals()方法 alt+insert @Override public boolean equals(Object o) { 
    if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Employee employee = (Employee) o; return Objects.equals(name, employee.name) && Objects.equals(age, employee.age); } @Override public int hashCode() { 
    return Objects.hash(name, age); } } 

重写eques()方法为判断name和age相同时获取相同的hashCode

image-20210519163225946

image-20210519163440439

练习题

已知: Person类按照id和name重写了hashCode和equals方法,问下面代码输出了什么?

public static void main(String[] args) { 
    HashSet set = new HashSet(); Person p1 = new Person(1001, "AA"); Person p2 = new Person(1002, "BB"); set.add(p1); set.add(p2); p1.name = "CC"; set.remove(p1); System.err.println(set); set.add(new Person(1001,"CC")); System.err.println(set); set.add(new Person(1001,"AA")); System.err.println(set); } static class Person{ 
    private Integer id; private String name; public Person(Integer id, String name) { 
    this.id = id; this.name = name; } @Override public String toString() { 
    return "Person{" + "id=" + id + ", name='" + name + '\'' + '}'; } @Override public boolean equals(Object o) { 
    if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Person person = (Person) o; return Objects.equals(id, person.id) && Objects.equals(name, person.name); } @Override public int hashCode() { 
    return Objects.hash(id, name); } } 

image-20210521142628323

解析: 由于重写了hashCode方法 第一次将p1.name = “CC”改变了p1的hashCode所以使用remove方法删除不掉p1 ,紧接着创建对象1001,“CC” 即不会和第一次的重复所以添加成功,最后因为开始已经将1001,”AA”改为”CC”所以会挂在AA后面 即输出4个元素

LinkedHashSet

  • LinkedHashSet是HashSet的子类
  • LinkedHashSet底层是一个LinkedHashMap,底层维护了一个 数组+双向链表
  • LinkedHashSet根据元素的hashCode值来决定元素的存储位置,同时使用链表维护元素的次序,这使得元素看起来是以插入顺序保存
  • LinkedHashSet 不允许添加重复元素

img

说明:

  1. 在LinkedHastSet 中维护了一个hash表和双向斑表(LinkedHashSet有head和tail )
  2. 每一个节点有before和after属性,这样可以形成双向链表
  3. 在添加一个元素时,先求hash值,再求索引.确定该元素在table的位置,然后将添加的元素加入到双向链表(如果已经存在,不添加[原则和hashset一样])
  4. 这样的话,我们遍历LinkedHashSet也能确保插入顺序和遍历顺序一致
1. LinkedHashSet 加入顺序和取出元素/数据的顺序一致 2. LinkedHashSet 底层维护的是一个LinkedHashSet(是HashMap的子类) 3. LinkedHashSet 底层结构(数组table + 双向链表) 4. 添加第一次时, 直接将数组table 扩容到16, 存放的节点类型是LinkedHashMap$Entry 5. 数组是 HashMap$Node[] 存放的元素/数据是 LinkedHashMap$Entry类型 static class Entry<K,V> extends HashMap.Node<K,V>{ 
    Entry<K,V> before,after; Entry(int hash,K key,V value,Node<K,V> next){ 
    super(hash,key,value,next) } } 

TreeSet

  • TreeSet 是一个有序的集合,它的作用是提供有序的Set集合。它继承于AbstractSet抽象类,实现了NavigableSet, Cloneable, java.io.Serializable接口。
  • TreeSet 继承于AbstractSet,所以它是一个Set集合,具有Set的属性和方法。
  • TreeSet 实现了NavigableSet接口,意味着它支持一系列的导航方法。比如查找与指定目标最匹配项。
  • TreeSet 实现了Cloneable接口,意味着它能被克隆。
  • TreeSet 实现了java.io.Serializable接口,意味着它支持序列化。
  • TreeSet是基于TreeMap实现的。TreeSet中的元素支持2种排序方式:自然排序 或者 根据创建TreeSet 时提供的 Comparator 进行排序。这取决于使用的构造方法。
  • TreeSet为基本操作(add、remove 和 contains)提供受保证的 log(n) 时间开销。
    另外,TreeSet是非同步的。 它的iterator 方法返回的迭代器是fail-fast的。
public static void main(String[] args) { 
    /* 1. 当我们使用默认构造函数。使用该构造函数,TreeSet中的元素按照自然排序进行排列。 2. 如果想要使用字符串大小来排序,使用TreeSet提供的一个构造器,可以传入一个比较器 (匿名内部类) 并制定排序规则 3. 简单分析源码 ①构造器把传入的比较器对象, 赋给了TreeSet的底层的 TreeMap的属性this.comparator public TreeMap(Comparator<? super K> comparator){ this.comparator = comparator; } ②在调用 treeSet.add("ahui"),在底层会执行到 //cpr就是我们的匿名内部类(对象) if(cpr != null){ do{ parent = t; //动态绑定到我们的匿名内部类的Comparator方法 cmp = cpr.compare(key,t.key); if(cmp < 0) t = t.left; else if(cmp > 0) t = t.right; else //如果相等,即返回0,这个key就加入不了 return t.setValue(value); }while(t != null); } */ // TreeSet treeSet = new TreeSet(); TreeSet treeSet = new TreeSet(new Comparator() { 
    @Override public int compare(Object o1, Object o2) { 
    //下面调用String的 comparatorTo方法进行字符串的大小比较 return ((String)o1).compareTo((String)o2); } }); treeSet.add("a"); treeSet.add("y"); treeSet.add("z"); treeSet.add("b"); treeSet.add("c"); treeSet.forEach(System.err::println); } 

Map

image-20210520192942739

JDK1.8Map的接口特点

  • Map与Collection并列存在。用于保存具有映射关系的数据:Key-Value

  • Map中的key 和 value可以是任何引用类型的数据,会封装到HashMap$Node对象中

  • Map中的key不允许重复,原因和HashSet一样,前面分析过源码.Map 中的 value可以重复

  • Map 的key 可以为null, value也可以为null,注意key 为null, 只能有一个,value为null ,可以多个.

  • 常用String类作为Map的key

  • key 和 value之间存在单向一对一关系,即通过指定的key 总能找到对应的value

  • 遍历出来数据也是无序

Map存放数据的底层原理

Map存放数据的key-value示意图,一对k-v 是放在一个HashMap$Node中的,又因为Node实现了Entry接口,有些书上也说 一对k-v就是一个Entry

image-20210520115902996

public static void main(String[] args) { 
    /* 特点: 1. Map和Collection并列共存, 用于保存键值对 key-value 2. Map中的key和value 可以是任何类型, 会封装在HashMap$Node 对象中 3. Map中的key不允许重复,原因和HashSet一样 有相同的key,就相当于替换 4. Map中的value可以重复 5. Map的key可以为null, value也可以为null, 注意key为null,只能有一个, value为null, 可以有很多个 6. 常常用String类型作为key 7. key 和 value存在对应关系, 即通过key总能找到对应的value */ Map hashMap = new HashMap(); hashMap.put("ahui","18"); hashMap.put("ahui1","22"); // 1. k-v最后是 HashMap$Node node = newNode(hash,key,value,null) // 2. k-v为了方便程序员的遍历,还会创建EntrySet 集合,该集合存放的元素的类型Entry, // 而一个Entry对象就有k,v EntrySet<Entry<K,V>>即: transient Set<Hap.Entry<K, V>> entrySet; // 3. entrySet中,定义的类型是 Map.Entry ,但是实际上存放的还是 HashMap$Node这时因为 // static class Node<K,V> implements Map. Entry<K,V> // 4. 当把 HashHap$Node对象存放到 entrySet 就方便我们的遍历,因为 Map. Entry提供了重要方法 // K getKey(; v getValue(); Set set = hashMap.entrySet(); System.err.println(set.getClass()); //HashMap$EntrySet for (Object obj : set) { 
    // System.out.println(obj.getClass()); // HashMap$Node // 为了从HashMap$Node中取出k-v Map.Entry entry = (Map.Entry) obj; System.err.println(entry.getKey() + "-" + entry.getValue()); } } 

Map接口的常用方法

  • put: 添加
  • remove: 根据键身处映射关系
  • get: 根据键获取值
  • size: 获取元素个数
  • isEmpty: 判断个数是否为0
  • clear: 清除
  • containsKey: 查找键是否存在

Map 的几种遍历方式

  • containsKey: 朝招键是否存在
  • keySet: 获取所有的键
  • entrySet: 获取所有关系k-v
  • values: 获取所有的值
public static void main(String[] args) { 
    /** * 几种遍历方式 */ Map map = new HashMap(); map.put("ahui","18"); map.put("ahui1","22"); map.put("ahui2",null); map.put("ahui3","28"); map.put("ahui4","29"); map.put(null,"29"); //第一组: 先取出 所以的key, 通过key 取出对应的value Set keySet = map.keySet(); //①增强for System.err.println("====第一种===="); for (Object key : keySet) { 
    System.err.println(key + "-" + map.get(key)); } //②迭代器 System.err.println("====第二种===="); Iterator iterator = keySet.iterator(); while (iterator.hasNext()){ 
    Object key = iterator.next(); //取出的是key System.err.println(key + "-" + map.get(key)); } //第二组: 把所以的value取出来 Collection values = map.values(); //这可以使用所有的Collection使用的遍历方法 //①增强for System.err.println("====取出多有的value - 增强for==="); for (Object value : values) { 
    System.err.println(value); //取出的只有值 } //②迭代器 System.err.println("====取出多有的value - 迭代器==="); Iterator iterator1 = values.iterator(); while (iterator1.hasNext()){ 
    Object next = iterator1.next(); System.err.println(next); } //第三组: 通过EntrySet获取Key-Value Set entrySet = map.entrySet(); //EntrySet<Entry<K,V>> //①增强for System.err.println("====通过EntrySet - 增强for===="); for (Object entry : entrySet) { 
    //将entrySet 转成map.Entry Map.Entry m = (Map.Entry) entry; System.err.println(m.getKey() + "-" + m.getValue()); } //②迭代器 System.err.println("====通过EntrySet - 迭代器===="); Iterator iterator2 = entrySet.iterator(); while (iterator2.hasNext()){ 
    Object entry = iterator2.next(); Map.Entry m = (Map.Entry) entry; System.err.println(m.getKey() + "-" + m.getValue()); } } 

Map接口小练习

使用HashMap添加3个员工对象,要求

​ 键: 员工id

​ 值: 员工对象

并遍历显示工资>18000的员工(遍历方式最少两种)

​ 员工类: 姓名、工资、员工id

public static void main(String[] args) { 
    /** * 使用HashMap添加3个员工对象,要求 * * 键: 员工id * * 值: 员工对象 * * 并遍历显示工资>18000的员工(遍历方式最少两种) * * 员工类: 姓名、工资、员工id */ Map map = new HashMap(); map.put(1,new Staff("阿灰",80000,1)); map.put(2,new Staff("小张",,2)); map.put(3,new Staff("小田",90000,3)); map.put(4,new Staff("Lucy",1800,4)); map.put(5,new Staff("李华",2000,5)); System.err.println("===增强for===="); //取出所有key Set set = map.keySet(); for (Object key : set) { 
    Staff o = (Staff) map.get(key); if (o.pay > 18000){ 
    System.err.println(map.get(key)); } } System.err.println("===迭代器===="); Iterator iterator = set.iterator(); while (iterator.hasNext()){ 
    Object next = iterator.next(); Staff s = (Staff)map.get(next); if (s.pay > 18000){ 
    System.err.println(map.get(next)); } } System.err.println("===EntrySet===="); Set entrySet = map.entrySet(); // System.err.println(entrySet.getClass()); //HashMap$EntrySet for (Object entry : entrySet) { 
    Map.Entry m = (Map.Entry) entry; Staff o = (Staff) m.getValue(); if (o.pay > 18000){ 
    System.err.println(m.getKey() + "-" + m.getValue()); } } } static class Staff{ 
    private String name; private Integer pay; private Integer id; public Staff(String name, Integer pay, Integer id) { 
    this.name = name; this.pay = pay; this.id = id; } @Override public String toString() { 
    return "Staff{" + "name='" + name + '\'' + ", pay='" + pay + '\'' + ", id=" + id + '}'; } } 

HashMap

特点:

  • Map接口的常用实现类:HashMap、Hashtable和Properties。
  • HashMap是 Map接口使用频率最高的实现类。
  • HashMap 是以key-val对的方式来存储数据(HashMap$Node类型)
  • key不能重复,但是值可以重复,允许使用null键和null值。
  • 如果添加相同的key,则会覆盖原来的key-val ,等同于修改.(key不会替换,val会替换)
  • 与HashSet一样,不保证映射的顺序,因为底层是以hash表的方式来存储的.
  • HashMap没有实现同步,因此是线程不安全的
HashMap 的底层机制与源码解析

image-20210520154744986

  1. (k,v)是一个Node实现了Map.Entry<k,v>, 查看HashMap 的源码可以看到.
  2. jdk7.0的hashMap 底层实现是[数组+链表], jdk8.0的底层是[数组+链表+红黑树]
扩容机制
  1. HashMap底层维护了Node类型的数组table,默认为null
  2. 当创建对象时,将加载因子(loadfactor)初始化为0.75.
  3. 当添加key-val时,通过key的哈希值得到在table的索引。然后判断该索引处是否有元素,如果没有元素直接添加。如果该索引处有元素,继续判断该元素的key是否和准备加入的key是否相等,如果相等,则直接替换val;如果不相等需要判断是树结构还是链表结构,相应处理。如果添加时发现容量不够,则需要扩容。
  4. 第1次添加,则需要扩容table容量为16,临界值(threshold)为12.
  5. 以后再扩容,则需要扩容table容量为原来的2倍,临界值为原来的2倍,即24.依次类推.
  6. 在Java8中,如果一条链表的元素个数超过 TREEIFY_THRESHOLD(默认是8),并且table的大小 >= MIN_TREEIFY_CAPACITY(默认64),就会进行树化(红黑树)
/** * HashMap底层源码分析 * */ public static void main(String[] args) { 
    Map map = new HashMap(); map.put("ahui",18); map.put("ahui1",22); map.put("ahui2",null); map.put("ahui",18); System.err.println("map=>" + map); } /* 解读HashMap源码 1. 执行构造器 new HashMap(); 初始化加载因子 loadfactor = 0.75 HashMap$Node[] table = null 2. 执行put 调用 hash方法, 计算key的 hash值(h = key.hashCode()) ^ (h >>> 16) public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } 3.执行putVal final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; //辅助变量 //如果底层的table, 数组为null,或者length=0,就扩容到16 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //取出hash值对应的table的索引的Node,如果为null,就直接把加入的k-v //创建成一个Node, 加入该位置即可 if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; //如果table的索引位置的key的hash相同和新的key的hash值相同 //并且满足(table现有的节点的key和准备添加的key是同一个对象 || equals返回真) //就认为不能加入新的k-v if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; //如果当前的table的已有Node已经是红黑树,就按照红黑树的方式处理 else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { //如果找到的已有的节点 后面是链表 就循环比较 for (int binCount = 0; ; ++binCount) { //如果整个链表没有和它相同的 就添加在链表的最后 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); //加入后,判断当前链表的个数,是否已经到达8个,到8个后就调用 //treeifyBin方法进行红黑树的转换 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; } 4. 关于树化(转成红黑树) //如果table 为null 或者大小还没到64, 暂时不会树化,而是进行扩容,否则才会树化 */ 

验证树化:

示例:

  1. 创建A类 重写hashCode方法 将返回值统一
  2. 循环加入12条数据
public static void main(String[] args) { 
    HashMap hashMap = new HashMap(); for (int i = 0; i <= 12; i++) { 
    hashMap.put(new A(i),"ahui"); } } static class A{ 
    private int num; public A(int num){ 
    this.num = num; } @Override public int hashCode() { 
    return 100; } @Override public String toString() { 
    return "A{" + "num=" + num + '}'; } } 

当数据达到8个时 且table未打到64,则对table进行扩增,当链表超过8且table打到64则进行树化

image-20210520171318824

HashTable

基本介绍

  • 存放的元素是键值对: 即K-V
  • hashTable 的键和值都不能为null (报NullPointerException异常)
  • hashTable使用方法基本上和HashMap一样
  • hashTable是线程安全的,hashMap是线程不安全的

底层简单理解

HashTable底层简单理解 1. 底层有数组 HashTable$Entry[] 初始化大小为11 2. 临界值threshold 初始为8 = 11 * 0.75 3. 扩容: 按照自己的扩容机制进行扩容 
HashTable扩容机制
  1. 底层有数组 HashTable$Entry[] 初始化大小为11
  2. 临界值threshold 初始为8 = 11 * 0.75
  3. 扩容: 按照自己的扩容机制进行扩容
  4. 执行 方法 addEntry(hash, key, value, index) 添加K-V 封装到Entry
  5. 当 if(count >= threshold) (实际容量大于等于临界值) 满足时,就进行扩容
  6. 按照 int newCapacity = (oldCapacity << 1) + 1; (两倍加1)的大小扩容
HashTable和 HashMap对比

image-20210520191946278

Properties

基本介绍

  • Properties类继承自Hashtable类并且实现了Map接口,也是使用一种键值对的形式来保存数据。
  • 他的使用特点和Hashtable类似
  • Properties还可以用于从 xxx.properties文件中,加载数据到Properties类对象,并进行读取和修改
  • 说明:工作后xxox.properties文件通常作为配置文件,这个知识点在IO流举例,有兴趣可先看文章

TreeMap

  • TreeMap是一个有序的key-value集合,它内部是通过红-黑树实现的,它支持序列化.

  • TreeMap的存储结构是按照红-黑树存储的,每个key-value对也存储在一个Entry里,只不过这个Entry和前面HashMap或者HashTable中的Entry不同,TreeMap的Entry其实是红-黑树的一个节点。

  • TreeMap的遍历方式一般分为两步:

    • 先通过entrySet()或keySet()或value()方法获得相应的集合;
    • 通过Iterator迭代器遍历上面得到的集合。
public static void main(String[] args) { 
    /* ① 构造器把传入的比较器对象, 赋给了TreeSet的底层的 TreeMap的属性this.comparator public TreeMap(Comparator<? super K> comparator){ this.comparator = comparator; } ② 调用put方法 1. 第一次添加,把k-v 封装到Entry对象中,放入root Entry<K,V> t = root; if (t == null) { compare(key, key); // type (and possibly null) check root = new Entry<>(key, value, null); size = 1; modCount++; return null; } 2. 以后添加的 Comparator<? super K> cpr = comparator; if (cpr != null) { do { parent = t; cmp = cpr.compare(key, t.key); //动态绑定到我们的匿名内部类的compare方法 if (cmp < 0) t = t.left; else if (cmp > 0) t = t.right; //如果遍历过程中, 发现准备添加的key和当前已有的key相等, 就不添加 else return t.setValue(value); } while (t != null); } */ //使用默认的构造器, 创建TreeMap(String实现了comparable接口默认为升序) TreeMap treeMap = new TreeMap(new Comparator() { 
    @Override public int compare(Object o1, Object o2) { 
    //按照K(String)的大小进行排序 //return ((String)o1).compareTo((String)o2); //按照K(String)的长度进行排序 return ((String)o1).length() - ((String)o2).length(); } }); treeMap.put("jack","杰克"); treeMap.put("ahui","阿灰"); treeMap.put("onlylmf","Onlylmf"); treeMap.put("mengfei","梦飞"); System.err.println(treeMap); } 

集合小结

在开发中,选择什么集合实现类,主要取决于业务操作特点,然后根据集合实现类特性进行选择,分析如下:

  1. 先判断存储的类型(一组对象[单列]或一组键值对[双列])

  2. 先判断存储的类型(一组对象或一组键值对)

    允许重复:List

    增删多:LinkedList [底层维护了一个双向链表]

    改查多:ArrayList [底层维护 Object类型的可变数组]

    不允许重复:Set

    无序:HashSet [底层是HashMap,维护了一个哈希表即(数组+链表+红黑树)J]

    排序:TreeSet

    插入和取出顺序一致:LinkedHashSet,[底层是LinkedHashMap的底层是HashMap],维护数组+双向链表

  3. 一组键值对:Map

    键无序:HashMap [底层是:哈希表jdk7:数组+链表,jdk8:数组+链表+红黑树]

    键排序:TreeMap

    键插入和取出顺序一致:LinkedHashMap

    读取文件 Properties

问题: 试分析HashSet和TreeSet分别如何实现去重的

① HsahSet的去重机制: hashCode() + equals()方法,底层先通过存入对象,进行运算得到一个hash值,通过hash值得到对应的索引,如果发现table索引所在的位置,没有数据,就直接存放, 如果有数据,就进行equals比较[遍历比较],如果比较后,不相同就加入,否则就不加入

② TreeSet的去重机制: 如果你传入了一个Comparator匿名对象,就使用实现的compare去重,如果方法返回0,就认为是相同的元素/数据,就不添加,如果你没有传入一个Comparator匿名对象,则以拟添加的对象实现的Comparator接口的compareTo去重

Collections工具类

常用方法演示

public static void main(String[] args) { 
    //创建ArrayList用于测试 ArrayList arrayList = new ArrayList(); arrayList.add("ahui"); arrayList.add("onlylmf"); arrayList.add("mengfei"); arrayList.add("xiaozhang"); System.err.println(arrayList); //reverse(List): 反转 List 中元素的顺序 Collections.reverse(arrayList); //shuffle(List): 对List集合 进行随机排序 Collections.shuffle(arrayList); //sort(List): 根据元素的自然顺序对指定的 List 集合元素按升序排序 Collections.sort(arrayList); //sort(List, Comparator): 根据指定的Comparator产生的顺序对List集合元素进行排序 //按照我们希望的, 字符串的长度大小排序 Collections.sort(arrayList, new Comparator() { 
    @Override public int compare(Object o1, Object o2) { 
    return ((String)o1).length() - ((String)o2).length(); } }); //swap(List, int, int): 将指定的List集合中的i处于元素和j处元素进行交换 Collections.swap(arrayList,0,1); System.err.println(arrayList); } 

public static void main(String[] args) { 
    //创建ArrayList用于测试 ArrayList arrayList = new ArrayList(); arrayList.add("ahui"); arrayList.add("onlylmf"); arrayList.add("mengfei"); arrayList.add("xiaozhang"); System.err.println(arrayList); //Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素 System.err.println("集合中最大元素=>" + Collections.max(arrayList)); //Object max(Collection, Comparator):根据Comparator 指定的顺序,返回给定集合中的最小元素 System.err.println("集合中最大元素=>" + Collections.max(arrayList, new Comparator() { 
    @Override public int compare(Object o1, Object o2) { 
    return ((String)o2).length() - ((String)o1).length(); } })); //Object min(Collection) 最小元素 System.err.println(Collections.min(arrayList)); //Object min(Collection,Comparator)根据Comparator 指定的顺序(与max方法一致) //int frequency(Collection,Object):返回指定集合中指定元素的出现次数 System.err.println(Collections.frequency(arrayList,"ahui")); //void copy(List dest,List src):将src中的内容复制到dest中 ArrayList dest = new ArrayList(); //为了完成一个完整的拷贝, 我们需要先给dest赋值, 大小和arrayList.size()一样 for (int i = 0; i <arrayList.size(); i++) { 
    dest.add(""); } //拷贝 Collections.copy(dest,arrayList); System.err.println(dest); //boolean replaceAll(List list,Obiect oldVal, Object newVal):使用新值替换 List 对象的所有旧值 //如果arrayList中有"ahui"就替换为"阿灰" Collections.replaceAll(arrayList,"ahui","阿灰"); System.err.println(arrayList); } 

今天的文章
java集合详解以及底层实现_java数据结构与算法分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/59715.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注