ArrayList源码实现(一)

发布于:2024-10-09 ⋅ 阅读:(59) ⋅ 点赞:(0)

ArrayList源码实现(一)

1. ArrayList的大小是如何自动增加的?

  • 初始化
    • 在构造函数中,可以设定列表的初始值大小,如果没有的话默认使用,提供的静态数据
 public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

注意:elementData 变量是 transient 关键字修饰的。

  • 动态扩容

重点关注 ensureCapacityInternal 函数,

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
实际的扩容函数
在这里插入图片描述

在这里插入图片描述

总结:在每次添加add 新的数据时,会进行一次 数组长度大小 的判断;

  1. 如果是数组为 空 时,最小长度就是 10,否则的话,带扩容的最小长度时 size(此时保存了多少数据)+1 (*calculateCapacity*
  2. 当最小容量 大于 数组的总长度时,进行扩容(ensureExplicitCapacity
  3. 数组的最大长度就是 Integer.*MAX_VALUE*
  4. 注意:扩容是创建了一个新的数组,将 elementData 指向了新的数组(elementData = Arrays.*copyOf*(elementData, newCapacity);

2. ArrayList的增加或者删除某个对象的对象为什么效率很低?

在ArraysList中 add、addAll与remove等方法,底层主要依赖于 System.*arraycopy ,这个是一个*native 方法,在ArrayList 对外提供的方法中,大量的使用了这个API,当频繁的对列表中的元素进行 add/remove 操作是,会比较费资源。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

附录

1. transient 是什么

transient 关键字在 Java 中的作用是指定某个类的成员变量不参与序列化过程。序列化是将对象的状态转换为字节流的过程,常用于将对象保存到文件中或通过网络传输。而使用 transient 关键字修饰的变量在对象被序列化时不会被保存,这样可以防止不必要或敏感的数据被序列化。

具体作用如下:

  1. 防止序列化敏感数据:某些类的字段可能包含敏感数据(如密码、个人信息),你不希望它们被序列化并保存到磁盘或通过网络传输。在这种情况下,可以使用 transient 关键字修饰该字段,序列化时就会跳过这个字段。
  2. 节省存储空间:对于某些不需要序列化的字段(例如缓存、临时变量等),使用 transient 可以避免不必要的数据占用存储空间。
  3. 防止不合法的数据:某些字段可能在对象被反序列化之后重新计算或初始化,如果这些字段被序列化了,可能会导致不合法的状态。在这种情况下,也可以使用 transient 来避免这些字段的序列化。

2. list中定义的最大长度为什么会减8

/**
* The maximum size of array to allocate.
* Some VMs reserve some header words in an array.
* Attempts to allocate larger arrays may result in
* OutOfMemoryError: Requested array size exceeds VM limit
*/
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 的设置是为了处理 JVM 中数组分配的一些特定限制和内存管理问题。Integer.MAX_VALUE2^31 - 1,即 2147483647,是 Java 中 int 类型的最大值。但在实际中,JVM 为数组分配内存时,最大数组大小会比这个理论值略小。以下是为什么减去 8 的原因:

原因分析:

  1. JVM 的内存管理和数组头部
    • 在 JVM 中,数组对象除了存储数组的数据本身外,还需要存储一些额外的信息,比如数组的长度、类型信息等。这些信息占用了一部分内存,通常被称为数组的头部(header words)。
    • 具体需要多少字节来存储这些头部信息,依赖于 JVM 实现和对象内存布局。虽然不同 JVM 实现可能有所不同,但大多数 JVM 可能会保留几个字节(如 8 字节)用于这部分元数据。
  2. 避免 OutOfMemoryError
    • 通过减去 8,确保在数组分配时有足够的空间容纳这些头部信息,避免超出 JVM 对数组对象大小的限制。如果不进行这个调整,分配接近 Integer.MAX_VALUE 大小的数组可能会导致 OutOfMemoryError,因为 JVM 不能同时为数据和头部信息分配足够的内存。
    • 这个限制还可以避免一些边界情况下的问题,比如内存碎片或者其他 JVM 的内部管理机制的需求。
  3. 系统和实现的差异
    • 不同的 JVM 和平台可能有不同的数组大小限制。尽管理论上 Java 数组可以拥有 Integer.MAX_VALUE 个元素(即 2147483647 个),但在实际中,JVM 往往需要一些额外的空间来管理数组的结构。因此,MAX_ARRAY_SIZE 设置为 Integer.MAX_VALUE - 8 是一个安全边界,可以确保数组不会因为接近最大值而触发异常。

总结:

MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 是为了确保在 JVM 中分配接近最大容量的数组时,不会因为数组头部信息或 JVM 内存管理的限制而导致 OutOfMemoryError。减去的 8 字节主要是预留给数组的头部信息或其他内存管理开销。

3. System.arraycopy 方法

System.arraycopy(a, 0, elementData, size, numNew) 是 Java 中用于执行数组复制的代码,使用了 System.arraycopy 方法。这个方法能够快速、高效地复制数组中的元素。让我们详细解释这个调用的作用:

参数解析:


System.arraycopy(a, 0, elementData, size, numNew);

  1. a:源数组,表示要从中复制元素的数组。
  2. 0:源数组 a 中复制的起始位置,表示从 a 数组的第一个元素(索引 0)开始复制。
  3. elementData:目标数组,表示将元素复制到的数组。
  4. size:目标数组 elementData 中开始粘贴元素的位置,表示将从目标数组的 size 索引开始粘贴数据。
  5. numNew:要复制的元素数量,表示从源数组 a 中复制多少个元素到目标数组。

网站公告

今日签到

点亮在社区的每一天
去签到