Microservice Architecture

发表于 2020-02-22 更新于 2024-02-08 分类于架构， Web

Why Microservice

Heterogenious technical stack：
支持多重技术栈，由于HTTP协议被多种编程语言支持，微服务可以用多种语言实现。
Robustness：整个App mesh网络不会因为单一的微服务的奔溃而停止工作。
Extensions：可以针对单一微服务进行扩展。
Simple deployment：微服务可以进行独立部署，不需要因为单一服务升级而多次部署。
Efficiency：微服务小团队开发高效敏捷。
More client support：多种前端客户端支持，可以重复利用同一个微服务后端网络。
Migration：基于单一微服务迁移的整体升级，阻碍更小。

What is Microservice

微服务就是一些协同工作的小而自治的服务。

How to architect Microservices

微服务特点

Loose coupling松耦合
High Cohesion高内聚

上下文边界确定

业务或者职能的界限，往往也可以作为微服务架构中的服务边界。不同的业务只能之间的内部细节并不需要相互知晓。同一个事件，在不同的业务职能会有不同的体现，但是在内部细节上却没有相互交叉。

共享和隐藏模型设计

限界上下文的确立，能够帮助确立共享模块，对于处于两个上下文边界上需要共同的消息，可以确立一个共享模块，专门进行信息共享。同时，对于上下文内部的逻辑，也能进行对应的逻辑模块设计，从而完成对于整个上下文的设计。

切勿过早划分

对于一些过早划分的业务产品，警惕由于后期需求用例改变造成多个上下文之间的重叠。比较推荐的是先进行单体设计，不进行划分，在服务稳定之后再进行划分设计迁移，基于以有代码进行划分，比从头开始构建微服务简单得多。

逐步划分上下文

不断对上下文的界限进行迭代，从复杂的共享模型中慢慢抽出简单的共享模型，将嵌套的模块逐步上升到顶层模型，对其中某些紧密关联模型进行共享。当然，模型共享的粒度取决于代码是分开维护还是集中维护，如果是集中维护也未尝不可进行嵌套模型共享。

微服务的集成

微服务之间的通信机制，可以成为微服务的集成。微服务间的API相互调用设计需要注意一下几个方面：

为用户创建接口

用户上下文会触发一定特定的流程。
共享数据库

数据库是多个微服务共享的，因为每个微服务都可能对同一个数据库进行修改。
同步与异步通信模式

两种不同的通信模式中，同步模式会阻塞线程，而异步模式是基于事件响应请求的，能提降低耦合性，提高吞吐量。
编排与协同

编排和协同是两种管理流程的架构风格。（同步）编排是通过一个中心执行者将每一步的步骤执行，知道获取最终的结果。（异步)协同则是以事件为机制进行执行，执行单元会订阅事件，API调用会触发一个事件，事件订阅者则会自动执行响应的流程。后者会需要监控服务，监控结果要映射到流程中，troubleshooting难度增加，这是一个难题。ATOM是一个符合REST规范的协议可以通过它提供资源feed的发布服务，客户端可以消费该信息。
RPC与REST

远程调用允许进行本地调用，事实上是由某个远程服务器产生。RPC会有一定的技术耦合要求。protocol buffers, Thrift是比较推荐的RPC框架。REST则是RPC的一个替代方案。通过URI对客户端与服务器进行了松耦合。
Json与XML

JSON与XML都是一种有效的数据序列化格式，前者更加流行XML对超媒体控制更加好。
API重定向

API的重定向常常发生在多个API版本共存的时候，当老版本的API准备deco时，需要绞杀者模式将旧的API拦截，选择是否替换成新版本的实现。当旧版本的访问完全消失时，再删除旧的API。

拆分成微服务

寻找独立的上下文边界——接缝
拆分数据库表格的混合加载功能，放弃直接利用数据库命令访问上下文边界间的外键，改为由代码（微服务服务API）
共享的静态数据改由配置维护关联。
针对共享数据，建立合适的领域进行关联，例如代码中建立客户关系，来维护财务——客户——仓库关系。
共享表格，对于有大量列信息的表格，可以根据上下文边界将表格拆分成两个。
自数据库开始进行代码重构。
事务的边界重构，对于多表的修改操作，需要协同处理错误，或者利用分布式事务处理工具代为管理事务。
拆分后的数据库在制作报表时会出现问题，因为不再能用sql语言进行表格操作。解决方法可以是主动定期导出表格合并，或者基于修改时间订阅导出行为。

部署微服务

准备CI系统，流水线，自动化流程
Paas，Docker打包部署

测试

单元测试
服务测试(mock/打桩)
E2E测试 —— 消费者驱动的测试
上线 —— 金丝雀发布法

监控

微服务的监控难度高于单一服务器应用。微服务包含多个服务，而每个服务的实例个数不等。关联标识可以帮忙关联同一个事件服务调用的日志，采用统一标准化的格式能够更快的辅助错误定位。

监控的内容包括CPU，响应时间，以及合理的语义监控（合成事务监控）。

微服务安全

身份验证和授权

身份雅正确认了登录者的身份。授权机制能够确定登录者可以访问和进行的操作。常见的单点登录（Single Sign-On)，企业级标准为SAML和OpenID Connect，前者基于SOAP标准，后者基于OAuth2.0. 身份提供者可以是外部系统或者内部目录服务，如LDAP/AD等。

微服务的身份认证和授权部分可以依托于网关，网关可以作为认证代理，通过网管认证的所有查询和操作都可以发送到微服务集群任意一个实例中处理。微服务内部可以决定身份可以授权的操作。

服务间的身份验证和授权

服务之间的身份验证是指微服务的各个服务之间的身份验证和授权，一般来说有如下几种方式管理:

在微服务边界内允许一切
HTTP(S)基本身份验证（HTTP明文传输认证信息，如果基于SSL认证则需要管理多台服务器之间的自签发证书。）
使用SAML或OpenID Connect认证授权，可以有效的避免中间人攻击，这样每个服务也需要一个身份。
客户端证书（采用客户端X.509证书，通过TLS层协议对服务器验证进行保证。)
HMAC（Hash-based Message Authentication Code,请求主题和私有密钥一起被哈希处理后进行发送，服务器使用请求主题和自己私钥副本重建哈希值。如果匹配则接收，防止的中间人攻击。)
JWT(JSON Web Token,JWT的原则是在服务器身份验证之后，将生成一个JSON对象并将其发送回用户。当用户与服务器通信时，客户在请求中发回JSON对象。服务器仅依赖于这个JSON对象来标识用户。为了防止用户篡改数据，服务器将在生成对象时添加签名。)
API密钥(API密钥是给予某种形式的秘密令牌的名称，该秘密令牌与Web服务（或类似）请求一起提交以便识别请求的来源。密钥可以包括在请求内容的一些摘要中，以进一步验证原点并防止篡改值。)

数据加密（现存多种算法进行数据加密，密钥可以通过加盐哈希保护）
深度防御

防火墙
日志
入侵监测
网络隔离
操作系统安全
OWASP标准(Open Web Application Security Project开放式Web应用程序安全项目,https://www.owasp.org)

系统设计与组织架构

公司团队的组织架构会影响系统设计。

单地域的团队拥有更加好的灵活性和效率，因此对于异地团队最好的办法是想办法合理拆分，让不同的团队负责不同的松耦合模块。
每个团队需要负责对服务的需求，更改，构建，部署到运维，自治的团队能够很好的激励团队的效率。
小团队规模，少于10个人的团队能够对其所负责的系统整个生命周期负责，技术选择和实现上具有灵活性。当然这个对服务的高效构建部署效率很高，比如利用云服务的Infra来轻松构建CI/CD流程。

规模化微服务

允许故障无处不在，故障永远会在意想不到的时候发生，所以微服务本身需要能够允许故障出现，硬件上也不用为避免故障作特殊设计。
服务平行扩容阈值控制，需要参考一些系统参数，响应时间/延迟，可用性，数据持久性（丢包率）。
当故障出现时，适当的服务功能降级，允许应用能够在其他方面能够正确运行而不是直接返回错误界面。
微服务延迟的影响控制，通常会导致worker线程池的阻塞队列超长，最终线程池没有可用的线程而宕机。合理设置线程池的舱壁bulkhead，在舱位线程用尽后断路该服务，避免因为单个服务的延迟影响导致所有的线程都阻塞于同一个服务。
数据库扩展，当数据库需要服务于高吞吐量服务时，可以通过数据库副本，RDBMS系统，扩展写操作，独立CQRS读写分离系统，等多种方式扩展。
缓存可以优化重复请求，氛围哭护短、代理和服务器端缓存。
自动伸缩，当云管理能够强大到自动调整微服务实例个数，就可以基于当前流量进行自动调整。
CAP定理(一致性consistency、可用性availability和分区容忍性partition tolerance)是分布式系统中需要控制好的三个平衡。
服务发现，可以通过DNS服务器进行关联，负载均衡服务器将查询分发到不同的IP服务器上。
动态服务注册，新加入的微服务实例的IP应用信息需要能共享给其他服务，Zookeeper，consul和Eureka等服务可以管理配置管理和服务发现。
文档服务，为API构建合适的文档，Swagger可以很好的自动生成API文档，HAL和HAL浏览器也可以客户端逐步探索API。
自描述系统（UDDI Universal Description Discovery and Integration通用描述发现与集成服务），这个标准能帮助了解哪些服务正在运行。

Java Concurrency In Depth

发表于 2019-12-24 更新于 2025-07-07 分类于 Java

本文将从计算机底层实现的角度描述Java目前的并发工具的实现细节。

Synchronized实现细节

JVM基于进入和退出Monitor对象来实现方法同步和代码块同步。即使用monitorenter和monitorexit指令实现的。

monitorenter指令是在编译后插入到同步代码块的开始位置，而monitorexit是插入到方法结束处和异常处。
线程执行到monitorenter指令时会尝试获取对象所对应的monitor的所有权/对象锁。

Synchronized用的锁是存在与Java对象头里。Java对象头的结构于这里。

锁一共有4种状态，级别从低到高分别是：无锁状态、偏向锁状态、轻量级锁状态和重量级锁状态。

偏向锁：

1. 设置:当一个线程获取锁，对象锁从无锁状态变成偏向锁，允许该线程反复拿锁。（已经有identity hashcode的对象不会使用偏向锁）

2. 撤销：当其他线程尝试竞争偏向锁时，持有偏向锁的线程才会释放锁，撤销后变成无锁状态，膨胀成轻量级锁。（偏向对象如果需要identity hashcode则会膨胀成重量级锁）

** identity hash code：未被覆写的 java.lang.Object.hashCode() 或者 java.lang.System.identityHashCode(Object) 所返回的值。

轻量级锁：

1. 设置：JVM在当前线程栈帧中创建用于存储锁纪录的空间，并将对象头的MarkWord复制到锁纪录中。然后尝试用CAS操作将指向锁纪录指针放入MarkWord空间。如果成功，则获得锁，如果失败，则自旋来获取锁。

2. 解锁: CAS操作将Displaced MarkWord
放回到对象头，如果成功，表示没有竞争。如果失败说明存在竞争,即两个线程中解锁线程无法将MarkWord取回，因为另一个自旋线程已经尝试将MarkWord放到自己线程的锁记录中，CAS会发现MW的owner不是自己，膨胀成重量级锁。阻塞所有没拿到锁的线程。

重量级锁：

1. 设置：重量级锁会阻塞拿不到锁的所有线程，减少了自旋带来的CPU开销。一旦升级成重量级锁，将不会降级锁。

原子操作的实现原理

原子操作主要依赖的是计算机的如下几个CPU基本操作：

AtomicFundamentals

为了达到原子操作的目的，CPU会通过如下两种方式确保在某一时刻，只有一个CPU对共享内存中的数据进行写操作：

通过总线锁保证原子性：CPU会提供一个LOCK #信号，将其他处理器的内存访问请求阻塞住，从而独占共享内存。
通过缓存所定保证原子性：需要处理器支持，开销较小，CPU修改缓存行进行缓存锁定，那么另一个CPU就不能同时缓存该内存数据，这是通过处理器的缓存以执行机制来保证的。

JVM中是可以通过锁和循环CAS操作来保证该变量的赋值成功的。

其中循环CAS操作可能带来如下问题：

ABA问题，值已经变化，但CAS的旧值比较返回true，解决方法是加入变量版本号。
循环时间开销大，可以通过JVM支持CPU的pause指令提升效率。
只能保证单一共享变量的原子性，可以通过AtomicReference方式合并变量成为一个新的对象处理。

锁机制，除了偏向锁，锁本身就是通过循环CAS实现拿/释放锁。

Lock锁实现细节

对比与synchronized中采用的锁， Lock有如下不同之处:

LockSynchronized

以下是Lock的API介绍，本文将展示API的实现细节：
LockAPI

ReentrantLock的实现依赖于Java同步器框架，下面将着重讲解同步器框架的实现。对于公平锁和非公平锁的实现，AQS基本实现都一样，除了在公平锁释放节点是会调用hasQueuedPredecessors()方法判定是否队列中用等待节点，从而保证不会有线程在释放阶段竞争到锁，让线程串行化拿锁。

队列同步器AQS框架实现细节

http://www.cnblogs.com/waterystone/p/4920797.html

类如其名，抽象的队列式的同步器，AQS定义了一套多线程访问共享资源的同步器框架，许多同步类实现都依赖于它，如常用的ReentrantLock/Semaphore/CountDownLatch。

实现细节在另一篇文章已讲述。

同步器本身是一个抽象类，实现了同步器的类可以完成线程同步，包括：同步队列，独占式同步状态获取与释放，共享式同步状态获取与释放及超时获取同步状态。队列同步器使用了一个int成员变量表示同步状态，通过内置的FIFO队列来完成资源获取线程的排队工作。

abstract class AbstractQueueSynchronizer {

    // 标记锁状态， 0是无锁状态，非0则是同步队列有被阻塞节点/线程。
    private volatile int state;
    //同步状态相关方法
    protected final in getState(); // 获取当前的同步状态
    protected final void setState(int newState); //设置当前的同步状态
    protected final boolean compareAndSetState(int expect, int update); //使用CAS设置当前状态，能够保证状态设置的原子性

    //支持重写的方法
    protected boolean tryAcquire(int arg);
    protected boolean tryRelease(int arg);
    protected int tryAcquireShared(int arg);
    protected boolean tryReleaseShared(int arg);
    protected boolean isHeldExclusive();

    //模板方法
    public final void acquire(int arg);
    public void acquireInterruptibly(int arg);
    public boolean tryAcquireNanos(int arg, long nanos);
    public void acquireShared(int arg);
    public void acquireSharedInterruptibly(int arg);
    public boolean tryAcquireSharedNanos(int arg, long nanos);
    public boolean release(int arg);
    public boolean releaseShared(int arg);
    public Collection<Thread> getQueuedThreads();
}

支持重写方法的不同重写可以实现不同的锁，具体如下：
AQSoverride

在实现重写方法可以调用模板方法，具体如下：
AQStemplate

下文将分类别讲述模板方法的实现:

同步队列

同步器内部有一个同步队列（FIFO双向队列）进行同步状态管理。当前线程获取同步状态失败时，同步器会将当前线程及等待状态等信息构造成为一个节点并将其加入同步队列，同时会阻塞当前线程，当同步状态释放时，会把节点中的线程唤醒，使其再次尝试获取同步状态。

AQSQueue

compareAndSetTail(…)方法基于CAS设置尾节点，保证队列更新的线程安全。
而头节点的更新是由获得锁的线程更新的，因此不需要作同步处理，是线程安全的。

public class Node {
    private int waitStatus;
    private Node prev;
    private Node next;
    private Node nextWaiter;
    private Thread thread;
}

具体描述如下图所示：

Node

当首节点的线程成功地获取了同步状态/锁，该线程会将首节点设置为后继节点，并且将本节点的next引用断开即可。然后线程执行任务，任务完成后唤醒后继节点。具体的节点处理实现由锁的类型(独占/共享)的模板方法Release/ReleaseShared实现。

Dequeue

当一个线程无法获取到同步状态，会被构造成节点加入到同步队列尾部，CAS设置能保证节点加入过程的线程安全。过程图如图所示。

Enqueue

节点操作由具体的模板方法AcquireQueued/AcquireShared等实现，而节点封装和入队细节如下列代码所示。

public abstract class AbstractQueuedSynchronizer {
    
    private Node head;
    private Node tail;

    private Node addWaiter(Node mode){
        Node node = new Node(Thread.currentThread(), mode);
        //快速尝试在尾部添加
        Node pred = tail;
        if( pred != null) {
            node.prev = pred;
            if (compareAndSetTail(pred, node)){
                pred.next = node;
                return node;
            }
        }
        enq(node);
        return node;
    }
    
    private Node enq(final Node node){
        // 死循环保证了节点的添加在有并发冲突的情况也能成功
        for(;;){
            Node t = tail;
            if(t == null){//Must initialize
                if(compareAndSetHead(new Node()))
                    tail = head;
            }else{
                node.prev = t;
                if(compareAndSetTail(t, node)){
                    t.next = node;
                    return t;
                }
            }
        }
    }
}

独占式同步状态获取与释放

独占式同步状态，是指在同一时刻只能有一个线程成功获取同步状态，锁的获取是排他的，不是共享的。

独占式同步状态获取流程如图所示:

共享式同步状态获取与释放

共享式获取与独占式获取最主要的区别在与同一时刻能否有多个线程同时获取到同步状态。以文件的读写为例，读操作可以是共享式访问，写操作则是独占式访问。

public final void acquireShared(int arg){
    if(tryAcquireShared(arg) < 0>)
        doAcquireShared(arg);
}

private void doAcquireShared(int arg){
    final Node node = addWaiter(Node.SHARED);
    boolean failed = true;
    try {
        boolean interrupted = false;
        // 自旋获取共享锁
        for(;;) {
            final Node p = node.predecessor();
            if (p == head){
                int r = tryAcquireShared(arg);
                //获取到了同步状态
                if( r >= 0){
                    setHeadAndPropagate(node, r);
                    p.next = null;
                    if(interrupted)
                        selfInterrupt();
                    failed = false;
                    return;
                }
            }
            if(shouldParkAfterFailedAcquire(p, node) && parkAndCheckInterrupt())
                interrupted = true;
        }
    } finally {
        if(failed)
            cancelAcquire(node);
    }
}

public final boolean releaseShared(int arg) {
    //tryReleaseShared通过自旋和CAS保证释放状态成功
    if (tryReleaseShared(arg)) {
        //释放同步状态后，会唤醒处于等待状态的节点。
        doReleaseShared();
        return true;
    }
    return false;
}

独占式超时获取同步状态

超时获取同步状态，即在指定的时间段内获取同步状态，如果获取到同步状态则返回true，否则，返回false。具体流程如下:

Workflow

private boolean doAcquireNanos(int arg, long nanosTimeout) throws InterruptedException{
    long lastTime = System.nanoTime();
    final Node node = addWaiter(Node,EXCLUSIVE);
    boolean failed = true;
    try {
        for(;;){
            final Node p = node.predecessor();
            //确定时间内获取成功
            if(p == head && tryAcquire(arg)){
                setHead(node);
                p.next = null;
                failed = false;
                return true;
            }
            //确定时间内获取失败
            if(nanosTimeout <= 0)
                return false;
            if(shouldParkAfterFailedAcquire(p, node) && nanosTimeout > spinForTimeoutThreshold)
                LockSupport.parkNanos(this nanosTimeout);
            long now = System.nanoTime();
            // 计算lastTime到现在的睡眠时间，并且更新还应该睡眠的时间
            nanosTimeout -= now - lastTime;
            lastTime = now;
            if (Thread.interrupted())
                throw new InterruptedException();
        }
    } finally {
        if(failed)
            cancelAcquire(node);
    }
}

Condition实现细节

每个Condition对象都包含一个等待队列，Object包含一个AQS队列，两个队列节点是AQS中的Node，并用这个两个队列共同实现了wait/notify功能。

等待

Condition.await()让线程释放锁，构造新节点加入等待队列进入等待状态。返回的前提是重新获取了condition相关联的锁。底层是通过LockSupport的park()方法释放。

通知

Condition.signal()将等待队列中等待时间最长的节点加入同步队列，并用LockSupport.unpark()唤醒该节点。加入同步队列的节点通过tryAcquire()竞争获取锁，获取锁后从await()中返回继续执行。

并发集合实现细节

ConcurrentHashMap实现细节

ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成。Segment是一种可重入锁ReentrantLock，在ConcurrentHashMap里扮演锁的角色，HashEntry则用于存储键值对数据。一个ConcurrentHashMap里包含一个Segment数组，Segment的结构和HashMap类似，是一种数组和链表结构，一个Segment里包含一个HashEntry数组，每个HashEntry是一个链表结构的元素，每个Segment守护者一个HashEntry数组里的元素,当对HashEntry数组的数据进行修改时，必须首先获得它对应的Segment锁。

ConcurrentHashMap

读取HashEntry信息是不需要拿锁，从而保证了并发读的高效性。HashMap中读取Map.Entry<K,V>是需要拿锁的。

static final class HashEntry<K,V> {  
    final K key; // immutable field保证链表稳定性，新节点头插入,或者替换已有的值（不能重复value）。  
    final int hash;  
    volatile V value;  //volatile保证可见性，删除需要O(n)倒序复制被删节点前的list。
    final HashEntry<K,V> next;  
}

在Hash中，会进行分段哈希从而保证segment中数组的均匀性，会对hash值的高字段和低字段进行分段处理，前半段获取segment位置，后端确定segment中数组中未知。

get()操作不需要枷锁，除非读到的值为空才会加锁重读。
put()操作需要对加锁操作。扩容时，只会对某segment中的数组进行扩种。
size()操作会两次不加锁计算，当操作数没有变化，则直接返回，如果变化则加锁获取size。

阻塞队列实现原理

线程池并行执行机制Executor

Java线程即是工作单元，也是执行机制。工作单元包括Runnable和Callable，而执行机制由Executor框架提供。应用程序通过Executor框架控制上层的调度，下层的调度由操作系统内核控制，下层调度不受应用程序的控制。

Executor接收Runnable/Callable<T>接口的实例的任务，返回Future<T>接口的FutureTask<T>实例，当任务完成时，可以获取任务执行结果。

ThreadPoolExecutor (线程池)框架和实现原理

ThreadPoolExecutor可以有三种: FixedThreadPool, SingleThreadExecutor, CachedThreadPool。这三种是不同配置的ThreadPoolExecutor，并非不同子类型。

FixedThreadPool:
FixedThreadPool是使用固定线程数的线程池，适用于为了满足资源管理的需求，而需要限制当前线程数量的应用场景，适用于负载较重的服务器。

public static ExecutorService newFixedThreadPool(int nThreads){
    return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>());//无界队列
};
public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory);

SingleThreadExecutor:
SingleThreadExecutor是单个线程的线程“池”，适用于需要保证顺序执行的各个任务，并且保证没有多个线程活动的应用场景。

public static ExecutorService SingleThreadExecutor(){
    // FinalizableDelegatedExecutorService 增加对gc时停掉线程池的功能
    return new FinalizableDelegatedExecutorService(new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()));
};
public static ExecutorService SingleThreadExecutor(ThreadFactory threadFactory);

CachedThreadPool:
CachedThreadPool是大小无界的线程池，适用于执行多的短期异步任务的小程序，适合负载较轻的服务器。

public static ExecutorService CachedThreadPool(){
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS,new SynchronousQueue<Runnable>());//使用没有容量的工作队列，因为线程数没有限制。
};
public static ExecutorService CachedThreadPool(ThreadFactory threadFactory);

ThreadPoolExecutor实现原理

public Class ThreadPoolExecutor{
    private int corePool; // 核心线程池大小，当前运行线程数少于此则创建新线程至预热完成。
    private int maximumPool; //最大线程池的大小，当前线程数不会超过此，多的任务会挂起在工作阻塞队列中。
    private BlockingQueue<Runnable> workQueue; //保存任务的工作队列，只要队列不为空，空闲的线程会获取任务并执行，直到任务队列为空。
    private RejectedExecutionHandler handler; // 工作队列饱和时调用的handler

    private long keepAliveTime; //空闲线程存活时间
    private TimeUnit unit; //空闲时间单位
    ...
}

ScheduledThreadPoolExecutor (调度线程池）框架实现原理

调度线程池是线程池实现的扩展，主要在给定的延迟后运行任务，或者定期执行任务。
ScheduledThreadPoolExecutor有两种: ScheduledThreadPoolExecutor和SingleThreadScheduledExecutor。

ScheduledThreadPoolExecutor:
ScheduledThreadPoolExecutor是固定个数线程的调度线程池，适用于需要多个后台线程执行周期任务，同时为了满足资源管理的需求而需要限制后台线程的数量的应用场景。
1
2
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize);
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize, ThreadFactory threadFactory);

SingleThreadScheduledExecutor:
SingleThreadScheduledExecutor是单个后台线程执行周期任务，同事需要保证顺序地执行各个任务的应用场景。

1 2	public static ScheduledExecutorService SingleThreadScheduledExecutor(); public static ScheduledExecutorService SingleThreadScheduledExecutor(ThreadFactory threadFactory);

ScheduledThreadPoolExecutor实现原理

public class ScheduledThreadPoolExecutor extends ThreadPoolExecutor{
    private long time; // 任务要被执行的具体时间，当前时间大于等于time值时被执行
    private long sequenceNumber; // 任务被添加到Executor时的序号
    private long period; // 任务执行的间隔周期
}

提交任务
ScheduledThreadPoolExecutor接受实现了RunnableScheduledFuture接口的ScheduledFutureTask实例。通过scheduleAtFixedRate()方法或者scheduleWithFixedDelay()方法提交，放在DelayQueue<RunnableScheduledFuture>中。
执行任务
DelayQueue封装了一个PriorityQueue, 对队列中的ScheduledFutureTask进行排序，time小的排在前面。如果time值相同，则sequenceNumber小的在前面。
放回任务
对于执行过的周期任务，time值被重置为下一次的执行时间，并且将task放回DelayQueue中。

DelayQueue部分实现原理

public class DelayQueue<E extends Delayed>{
    private ReentrantLoc lock;
    private PriorityQueue<E> q;
    private Thread leader;
    private Condition available;

    public E take(){
        final ReentrantLock lock = this.lock;
        lock.lockInterruptibly(); // 处理队列需要获得锁
        try {
            for(;;){
                E first = q.peek();// 线程锁住等待直到有task出现
                if( first == null) {
                    available.await();
                }else {
                    long deplay = first.getDelay(TimeUnit.NANOSECONDS);
                    if(delay > 0){
                        long tl = available.awaitNanos(delay); // wait nanoseonds for task to be ready to execute.
                    }else {
                        E x = q.poll(); // when task is ready, take the task and do
                        assert x != null;
                        if( q.size() != 0)
                            available.signalAll(); //release condition
                        return x;
                    }
                }
            }
        } finally {
            lock.unlock();
        }
    }

    public void offer(E e){
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            E first = q.peek(); 
            q.offer(e); // 拿到锁后放入这个queue
            if(first == null) || e.compareTo(first) < 0)
                available.singalAll(); // 检查task是否到期可以执行，如果ready触发take的线程。
            return true;
        } finally {
            lock.unlock();
        }
    }

}

ForkJoinPool 框架实现原理

ForkJoinPool由ForkJoinTask数组和ForkJoinWorkerThread数组组成，前者用于存放程序提交的任务，ForkJoinWorkerThread数组负责执行任务。

算法执行分两段，fork阶段将任务分割到足够小，创建/唤醒一个工作线程执行；join阶段将任务的结果收集合并结果得到最后的结果。

public class ForkJoinTask<V> {
    public final ForkJoinTask<V> fork() {
        ((ForkJoinWorkerThread) Thread.currentThread()).pushTask(this);
        return this;
    }

    public final V join() {
        if(doJoin() != NORMAL)
            return reportResult();
        else
            return getRawResult();
    }

    private V reportResult(){
        int s; Throwable ex;
        if((s = status) == CANCELLED)
            throw new CancellationException();
        if(s == EXCEPTIONAL && (ex = getThrowableException()) != null)
            UNSAFE.throwException(ex);
        return getRawResult();
    }

    private int doJoin(){
        Thread t; ForkJoinWorkerTHread w; int s; boolean completed;
        if((t = Thread.currentThread()) instanceof ForkJoinWorkThread) {
            if (( s = STATUS)  < 0)
                return s;
            if( ((w = (ForkJoineWorkerThread)t).unpushTask(this))) {
                try {
                    completed = exec();
                } catch (Throwable rex) {
                    return  setExceptionalCompletion( rex);
                }
                if(completed)
                    return setCompletion(NORMAL);
            }
            return w.joinTask(this);
        }
        else
            return exeternalAwaitDone();
    }
}

public class ForkJoinWorkerThread{
    final void pushTask(ForkJoinTask<?> t) {
        ForkJoinTask<?>[] q; int s, m;
        if((q = quque) != null) {
            long u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;
            UNSAFE.putOrderObject(q, u, t);
            queueTop = s + 1;
            if ((s -= queueBase) <= 2)
                pool.singalWork();
            else if (s == m)
                growQuque();
        }
    }
}

异步执行机制

FutureTask实现原理

FutureTask实现了Future, Runnable接口。是Executor的执行任务单元，也可以由调用线程直接执行FutureTask.run()。FutureTask的get方法能阻塞当前线程，等待任务执行结果再执行下文。

FutureTask通过内部聚合的AQS的子类实现完成FUtureTask的获取和释放操作。队列中的每个FutureTask实例的get方法并不以一定需要在run方法之前执行，get方法会阻塞调用线程直到run方法被执行完成。每个任务只会执行一次，并且会有定义好的执行顺序，从get方法调用线程恢复执行上下文，从而达到异步调用的效果。类似.NET中的beginInvoke和endInvoke方法。
Future

public class FutureTask<V> implements Future<V>, Runnable{
    private Sync sync;

    public void run() {
        ...
        Callable.call();
        ...
        AQS.compareAndSetState(int expect, int update);
        ...
        AQS.releaseShared(int arg);
        ...
        FutureTask.done();
    }
    public boolean cancel();
    public void get() {
        ...
        AQS.acquireSharedInterruptily(int arg);
        ...
    };
    
    class Sync extends AbstractQueuedSynchronizer {
        public V innerGet();
        public void innerRun();
        public boolean innerCancel();
    }
}

CompletableFuture实现原理

CompletableFuture实现了Future，CompletionStage接口，后者接口增加了更多对任务流程的控制接口，可以直接通过接口实现回调函数的定义。

从有限状态机机制理解Scheduler的实现原理

RxJs Observables

发表于 2019-10-19 更新于 2021-06-22 分类于 JS

What is Observable

Observable利用观察者模式，建立了发布者publisher和订阅者subscriber之间的联系。联系本身不会修改发布的信息，只是定义声明了订阅者对发布信息的处理方式。

使用目的：

流式处理本身是延迟执行的，即在需要数据的一刻进行处理，并且不改变数据本身而是生成一个新的流。多流处理的支持。
异步回调保证了流式处理结果的实时渲染，因此Observable是高性能前端的重要概念。可以将同步方法转换成异步方法。
支持事件处理，动态注册事件及句柄。

创建Observable

import { Observable} from 'rxjs';
// subscriber/observer is callback functions for this observable.
// {next, error, complete}
const observable = new Observable(subscriber => {
    // observable can decide how frequency next/error/complete callback is called.
    subscriber.next(1);
    subscriber.next(2);
    subscriber.next(3);

    setTimeout(() => {
        subscriber.next(4);
        subscriber.complete();
    }, 1000);

    return {unsubscribe() {}};
})

传入Observable回调函数/创建一个subscriber

observable.subscribe({
    x => console.log('got value ' + x),
    err => console.error('got error ' + err),
    () => console.log('done')
})

创建multicast Observable

function multicastSequenceSubscriber(){
    const observers = [];

    let timeoutId;

    return (observer) => {
        observers.push(observer);
        // start the sequence when firstly subscribed.

        if( observers.length === 1) {
            timeoutId = doSequence({
                next(val) {
                    // 将所有observer封装成一个observer
                    observers.forEach(obs => obs.next(val));
                },

                complete() {
                    observers.slice(0).forEach( obs => obs.complete());
                }
            }, seq, 0)
        }

        return {
            unsubscribe() {
                //remove observer
                observers.splice(observers.indexOf(observer), 1);
                // cancel subscription if no observers.
                if(observers.length === 0){
                    clearTimeout(timeoutId);
                }

            }
        }
    }
}

const multicastObservable = new Observerble(multicastSequenceSubscriber())

// subscribe to this observable
multicastObservable.subscribe({
    next(num) { console.log(num)}
    complete(){}
})

multicastObservable.subscribe({
    next(num) { console.log('second: ' + num)}
    complete(){}
})

Observable关系操作符

Area	Operator
Creation	from, fromEvent, of
Comibination	combineLatest,concat, merge, startWith, withLatestFrom, zip
Filtering	debounceTime, distinctUtilChanged, filter, take, takeUtil
Transformation	bufferTime, concatMap, map, mergeMap, scan, switchMap
Utility	tap
Multicasting	share

Observable的关系操作符，是通过.pipe()引入的，更多的操作符，可以参考rxjs官方API文档here。

Using observables in Angular

EventEmitter
HTTP模块处理AJAX requests
Router, Forms 模块监听/响应用户输入

Observable v.s. Promise

共同点

方面	细节
异步处理	subscribe/then callback
使用语言	支持typescript, javascript
支持HTTP	通过Angular httpClient支持, observable.toPromise()

不同点

方面	细节
使用场景	O: 事件处理句柄, 流式处理； P: 链式处理
操作符复杂度	O:多样化； P:单一

Reactive Programming

使用异步数据流进行编程，通过代码来忠实反映业务之间的关系。

HTTP protocol introduction

发表于 2019-08-11 更新于 2024-02-08 分类于架构， Web

HTTP 协议

HTTP协议属于应用层协议，其设计目的是为了方便文本内容的分享与发布。HTTP协议是Web资源共享的基础，与URL(文档地址定位符)，HTML共同构建了Web世界。

HTTP协议属于点到点通信协议，请求访问资源的一端称为客户端，提供资源相应的一端称为服务器。

HTTP协议方法

GET：请求访问资源。
POST：传输主体内容。
PUT：传输内容，幂等传输。
HEAD: 获得报文首部，用于确认资源有效性和更新日期。
DELETE: 删除内容。
OPTIONS: 询问资源支持方法。
TRACE：追踪路径，用于计算客户端到服务器端的跳数。
CONNECT: 要求用socket协议连接代理。

HTTP方法本身是无状态协议，为了支持复杂有状态场景，引入了Cookie技术，确保认证客户端通信的上下文是连续的。

HTTP状态码

	类别	原因短语
1XX	Informational(信息性状态码)	接收的请求正在处理
2XX	Success（成功状态码）	请求正常处理完毕
3XX	Redirection（重定向状态码）	需要进行附加操作以完成请求
4XX	Client Error（客户端错误状态码）	服务器无法处理请求
5XX	Server Error(服务器错误状态码)	服务器处理请求出错

HTTP协议架构中的转发功能节点

代理：代理服务器的基本行为是接收客户端发送的请求转发给其他服务器，不改变请求URI。分为两类：
1. 缓存代理：缓存内容。
2. 透明代理：纯粹内容转发，不做缓存。
网关：网关为通信链路上的服务器提供非HTTP协议连接，例如与信用卡结算系统联动，数据库联动等。
隧道：隧道的建立能够确保客户端与服务器之间安全的通信。也能扩展HTTP通信协议，例如支持推送功能等等。

HTTPS

HTTP协议的缺点：

明文信息会被窃听；
无法验证通信方身份，会被伪装；
无法验证报文的完整性，会被篡改。

HTTP over SSL/TSL

SSL/TSL协议独立与HTTP协议，存在于HTTP和TCP协议之间，在建立HTTP连接之前，先建立SSL通信机制，交换加密密钥，从而在HTTP通信报文可以进行加密传输。

HTTPS 协议通信握手/分手协议步骤：

HTTPS

握手主要分为4个阶段:

SSL证书请求，及公钥获取。<= 由于非对称加密机制的效率较低，安全性高，只用作密钥交互。
客户端密钥加密发送。
服务器端密钥确认。
数据传输… <= 数据传输阶段的加密是基于协商确定的对称密钥发送，效率较高。

WebSocket协议

Web浏览器支持的全双工通信协议，在HTTP部首加入upgrade：websocket字段，服务器通过返回状态码101 swtiching protocols响应连接，一旦服务器与客户端建立WebSocket协议的通信连接，之后所有的通信都用这个专用协议进行。

推送功能：服务器可以直接发送数据到客户端。
减少通信量：保持连接的状态减少HTTP协议的连接开销。

用户认证问题

HTTP/1.1常见的认证方式如下：

BASIC认证：直接提交用户名密码完成认证。
DIGEST认证：客户端根据服务器端的质询码生成响应码完成认证。
SSL客户端认证：凭借HTTPS的客户端认证证书完成认证。
FormBase认证：在用户登录信息以表单形式提交后，服务器端发放Session ID用于用户认证状态的绑定和保持。
Kerberos认证：
NTLM认证：
SSO认证：

Web安全问题

跨站脚本工具XSS：通过执行非法HTML标签/JS脚本进行攻击。
1. 表单中插入非法标签执行JS脚本。
2. 基于用户Cookie的窃取攻击
SQL注入攻击：通过加入SQL结束符，强制加入SQL语句执行。
OS命令攻击:通过Shell脚本注入执行系统命令。
HTTP部首注入攻击：通过访问URL加入换行符，注入HTTP首部字段进行攻击。
1. Cookie设置字段生效。
2. HTTP响应截断攻击，强制显示伪造内容。
邮件首部注入攻击:
1. BCC邮件泄露。
目录遍历攻击: 访问无疑公开的文件目录。
远程文件包含漏洞：引入其他包，例如System包进行代码污染。

Java Xml Libraries

发表于 2019-04-24 更新于 2019-05-06 分类于 Java

本文描述了当前主流的Java Xml libraries，以及对比区别。

下文摘取自https://www.baeldung.com/java-xml-libraries

SAX: It is an event based parsing API, it provides a low level access, is memory efficient and faster than DOM since it doesn’t load the whole document tree in memory but it doesn’t provide support for navigation like the one provided by XPath, although it is more efficient it is harder to use too.
DOM(DOM4J and JDOM): It as model based parser that loads a tree structure document in memory, so we have the original elements order, we can navigate our document both directions, it provides an API for reading and writing, it offers XML manipulation and it is very easy to use although the price is high strain on memory resources.
StAX: It offers the ease of DOM and the efficiency of SAX but it lacks of some functionality provided by DOM like XML manipulation and it only allows us to navigate the document forward.
JAXB: It allows us to navigate the document in both directions, it is more efficient than DOM, it allows conversion from XML to java types and it supports XML manipulation but it can only parse a valid XML document.

JavaXmlLibs

Office 365 Addin development guide

发表于 2019-04-12 更新于 2024-02-08 分类于 Runbooks

This is a guide for how to develop Office 365 cross platform addin.

Front end UI framework

Microsoft has provided offical Office UI framework: Office Fabric UI. The office site is at https://developer.microsoft.com/en-us/fabric. The are three directions of the UI project future roadmap. All the three projects are implementation of UI components, demos are available at https://developer.microsoft.com/en-us/fabric#/components.

Fabric React (Official support)
AngularJS (Community version, no updates)
Fabric iOS
Fabric JS (Stop support from MSFT)

New UI design sytem is called fluent, the website is at https://www.microsoft.com/design/fluent/. It can help let developer know how to design an Windows style application UI and the guide of UWP web app design.

Fabric.js is an open source js framework using canvas as the basic style of UI components, the official site is at http://fabricjs.com/.

Useful links:

Directly reuse existing Microsoft designed and implemented components is very convinient as long as your application can work well with these codes.

Office UI Fabric Core (Style and fonts): https://github.com/OfficeDev/office-ui-fabric-core
Office UI Fabric React (Full components): https://github.com/OfficeDev/office-ui-fabric-react
Office UI Fabric JS (Full components in JS): https://github.com/OfficeDev/office-ui-fabric-js/

Except Windows style UI frameworks, there are other frameworks using morden components:

Material-UI: https://www.jianshu.com/p/b3cfaca94596 , https://material-ui.com/getting-started/example-projects/
PrimeNG: https://www.primefaces.org/primeng

Front end Office.js framework

Office.js is the JavaScript based Office model provided by Microsoft, there are also Excel-15.js or Outlook-15.js for application respectively.

Office JavaScript API object model

This doc https://docs.microsoft.com/en-us/office/dev/add-ins/develop/office-javascript-api-object-model explains the API model for new O365 addin JS model.

The object is still under active development, there are more and more new features added, reading the documents can get the updated information. As for now, there are below bullet points:

JSAddinFeatures

This is also guide for how to develop Addin with Angular front end. https://docs.microsoft.com/en-us/office/dev/add-ins/develop/add-ins-with-angular2

Office appication has its own object model, so developers can read the related documents for detailed guide.

Outlook Backend service

Except the general Office JS API model, Outlook has its own API. The development guide is at https://docs.microsoft.com/en-us/outlook/add-ins/.

Manifest version and corresponding clients support

ClientSupport

Troubleshooting manifest file here

Outlook Web Addin Catalogs

Outlook Addin has its own concepts and there are many aspects:

OutlookCatalog

Sample Addins for Outlook

https://developer.microsoft.com/zh-cn/outlook/gallery/?filterBy=Outlook,Samples,Add-ins

Other Office Web Addin Demos

Word Style Checker: https://github.com/OfficeDev/Word-Add-in-Angular2-StyleChecker
Word task pane add-in: https://github.com/OfficeDev/Office-Add-in-Fabric-UI-Sample
Outlook Addin: https://github.com/OfficeDev/outlook-add-in-attachments-demo
Word dialog Addin: https://github.com/OfficeDev/Office-Add-in-Dialog-API-Simple-Example

Git best practices

发表于 2019-03-29 更新于 2025-02-10 分类于 Runbooks

Git 基本操作

创建Git仓库

git init

查看代码情况

1 2	git status git diff {filepath}

提交代码

git clone {clone.git}
git add -A
git commit -m "message"
git push orgin master

保存/恢复临时修改文件

1 2	git stash git checkout stash@{0} -- {filepath}

读取文件历史版本

1	git checkout {commithash} -- {filepath}

创建标签

1
2
3

git tag -a v1.0  # tag most recent commit
git tag -a v0.9 85fc7e7 # tag on a specific commit
git tag # view tags

Pull/Fork工作流

fork from the github

clone to local and commit changes

git clone {clone.git}
git checkout -b feature
# make changes to this branch
git add -p
git commit -m "feature message"
git push origin feature

rebase commits after remote master

git remote add upstream {remote.git}
git pull upstream master
# no changes on master, then automatically git history is updated
git checkout feature
git pull --rebase origin master
# apply changes from origin master to feature newly commits
git push origin feature --force

raise pull request for code review

提交历史管理

缩减冗余commit log

通过rebase修改commit history

1
2
3

# rewrite last 10 commit logs
git rebase -i HEAD~10 feature
git push orign feature --force

通过squash命令压缩commit history

git reset --hard HEAD~12 # 将git指针定位到历史版本

git merge --squash HEAD@{1} # 从该点开始merge到最新的版本

git commmit -m "xxx" # 提交commit重写

git push origin master --force # 强制改写历史

分支管理

创建新分支

在创建新的local分支时，也可以添加commit hash告诉git分支最新的HEAD指向

1 2	git checkout -b feature # create a branch based on current branch

切换分支/从Detached HEAD切换

1	git checkout feature

删除本地分支

1 2	git branch -d feature git branch -D feature # force delete

删除远程分支

1	git push orgin --delete feature

合并分支

1 2	git merge feature # merge changes from feature branch to current master branch

CherryPick别的分支commit/branch

在需要apply的分支上保证没有unstaged change，运行如下命令

1	git cherry-pick <commitHash>/<feature branch name>

github migration from port 22 to 443

github服务器已经将22端口关闭，git工具需要访问ssh.github.com:443而不是默认的github.com:22 SSH端口。

需要更新~/.ssh/config文件如下：

Host github.com
HostName ssh.github.com
User git
Port 443
PreferredAuthentications publickey
IdentityFile ~/.ssh/id_rsa

测试方法

1	ssh -T git@github.com

JVM Bytecode Execution Engine Subsystem

发表于 2019-02-13 更新于 2024-02-08 分类于 Java

JVM执行引擎是Java虚拟机核心组件之一。物理机的执行引擎是直接建立在处理器、硬件、指令集和操作系统层面上，而虚拟机的执行引擎是自己实现的，可以自行制定指令集与执行引擎的结构体系，并且能够执行那些不被硬件直接支持的指令集格式。

运行时栈帧结构

栈帧（Stack Frame）是用于支持虚拟机进行方法调用和方法执行的数据结构，它是虚拟机运行时数据区中的虚拟机栈（Virtual Machine Stack）的栈元素。栈帧存储了方法的局部变量表、操作数栈、动态连接和方法返回地址等信息。每一个方法从调用开始至执行完成的过程，都对应着一个栈帧在虚拟机栈里面从入栈到出栈的过程。

每一个栈帧都包括了局部变量表、操作数栈、动态连接、方法返回地址和一些额外的附加信息。在编译程序代码的时候，栈帧中需要多大的局部变量表，多深的操作数栈都已经完全确定了，并且写入到方法表的Code属性之中，因此一个栈帧需要分配多少内存，不会受到程序运行期变量数据的影响，而仅仅取决于具体的虚拟机实现。

StackFrame

局部变量表

局部变量表（Local Variable Table）是一组变量值存储空间，用于存放方法参数和方法内部定义的局部变量。在Java程序编译为Class文件时，就在方法的Code属性的max_locals数据项中确定了该方法所需要分配的局部变量表的最大容量。

局部变量表的容量以变量槽（Variable Slot，下称Slot）为最小单位，虚拟机规范中并没有明确指明一个Slot应占用的内存空间大小，只是很有导向性地说到每个Slot都应该能存放一个boolean、byte、char、short、int、float、reference或returnAddress类型的数据，这8种数据类型，都可以使用32位或更小的物理内存来存放。

方法执行时，如果执行的是实例方法，那局部变量表中第0位索引的默认是this的引用，即实例本身。

注1：与虚拟机模型设计不同的是，执行引擎的实现为了节约局部变量表的空间，局部变量表的Slothi可以重用的。

LocalVariable

注2：局部变量定义了但没有赋初始值是不能使用的，因为局部变量的加载没有类加载的准备和初始化阶段。

操作数栈

操作数栈（Operand Stack）也常称为操作栈，它是一个后入先出（Last In First Out, LIFO）栈。同局部变量表一样，操作数栈的最大深度也在编译的时候写入到Code属性的max_stacks数据项中。操作数栈的每一个元素可以是任意的Java数据类型，包括long和double。

动态链接

每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用，持有这个引用是为了支持方法调用过程中的动态连接

方法返回地址

当一个方法开始执行后，只有两种方式可以退出这个方法。

第一种方式是执行引擎遇到任意一个方法返回的字节码指令，这时候可能会有返回值传递给上层的方法调用者（调用当前方法的方法称为调用者），是否有返回值和返回值的类型将根据遇到何种方法返回指令来决定，这种退出方法的方式称为正常完成出口（Normal Method Invocation Completion）。

另外一种退出方式是，在方法执行过程中遇到了异常，并且这个异常没有在方法体内得到处理，无论是Java虚拟机内部产生的异常，还是代码中使用athrow字节码指令产生的异常，只要在本方法的异常表中没有搜索到匹配的异常处理器，就会导致方法退出，这种退出方法的方式称为异常完成出口（Abrupt Method Invocation Completion）。一个方法使用异常完成出口的方式退出，是不会给它的上层调用者产生任何返回值的。

附加信息

调试信息等，属于虚拟机可以自由实现的部分。

方法调用

方法调用阶段是确定被调用方法版本的过程。Java的编译过程并不存在连接过程，是在JVM运行时进行动态调用的。

解析

在类加载的解析阶段，会将其中的一部分符号引用转化为直接引用，这种解析能成立的前提是：方法在程序真正运行之前就有一个可确定的调用版本，并且这个方法的调用版本在运行期是不可改变的。换句话说，调用目标在程序代码写好、编译器进行编译时就必须确定下来。这类方法的调用称为解析（Resolution）。

invokestatic：调用静态方法。
invokespecial：调用实例构造器<init>方法、私有方法和父类方法。
invokevirtual：调用所有的虚方法。
invokeinterface：调用接口方法，会在运行时再确定一个实现此接口的对象。
invokedynamic：先在运行时动态解析出调用点限定符所引用的方法，然后再执行该方法，在此之前的4条调用指令，分派逻辑是固化在Java虚拟机内部的。其中只要能被invokestatic和invokespecial指令调用的方法（即非虚方法），都属于静态解析可以确定调用版本的，而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。

分派Dispatch

分派调用过程是Java多态的一种基本体现，主要是有重载、重写两块。

静态分派

在编译阶段，依赖静态类型来定位方法执行版本的动作成为静态分派。典型应用是方法重载。但是，在很多情况下，重载版本并不唯一，所以虚拟机在运行时也会选更加合适的版本。

静态分派示例：


package org.fenixsoft.polymorphic;

public class StaticDispatch {
    
    static abstract class Human{

    }

    static class Man extends Human {
        
    }

    static class Woman extends Human {

    }

    public void sayHello(Human guy) {
        System.out.println("hello, guy!");
    }

    public void sayHello(Man guy) {
        System.out.println("hello, gentleman!");
    }

    public void sayHello(Woman guy){
        System.out.println("hello, lady!");
    }

    public static void main(String[] args){
        Human man = new Man();
        Human woman = new Woman();
        StaticDispatch sr = new StaticDispatch();
        sr.sayHello(man);
        sr.sayHello(woman);


        // 实际类型变化，编译器并不能在编译时就这道，只能在运行时才可以确定的。
        man = new Woman();
        sr.sayHello(man);

        // 静态类型变化
        sr.sayHello((Woman) man);
    }
}

hello, guy!
hello, guy!
hello, guy!
hello, lady!

重载方法匹配优先级代码示例：

package org.fenixsoft.polymorphic;

public class Overload {
    public static void sayHello(Object arg) {
        System.out.println("hello Object");
    }

    public static void sayHello(int arg) {
        System.out.println("hello int");
    }

    public static void sayHello(long arg) {
        System.out.println("hello long");
    }

    public static void sayHello(Character arg) {
        System.out.println("hello Character");
    }

    public static void sayHello(char arg) {
        System.out.println("hello char");
    }

    public static void sayHello(char... arg) {
        System.out.println("hello char ...");
    }

    public static void sayHello(Serializable arg){
        System.out.println("hello Serializable");
    }

    public static void main(String[] args) {
        sayHello('a');
    }
}

代码输出：
1
hello char
注释掉sayHello(char arg)方法，代码输出：
1
hello int
注释掉sayHello(int arg),代码输出：
1
hello long
注释掉sayHello(long arg),代码输出：
1
hello Character
注释掉sayHello(Character arg),代码输出：
1
hello Serializable
注释掉sayHello(Serializable arg),代码输出：
1
hello Object
注释掉sayHello(Object arg),代码输出：
1
hello char ...
这个示例生动的展示了JVM在运行时静态分派时，是从继承关系中从下往上开始搜索，越接近上层的优先级越低。即使方法调用传入的参数值为null，这个规则仍然适用。变长参数的重载优先级是最低的。

动态分派

动态分派是重写的重要体现。

动态分派示例：

package org.fenixsoft.polymorphic;

public class DynamicDispatch {
    static abstract class Human {
        protected abstract void sayHello();
    }

    static class Man extends Human {
        @Override
        protected void sayHello(){
            System.out.println("man say hello");
        }
    }

    static class Woman extends Human {
        @Override
        protected void sayHello(){
            System.out.println("woman say hello");
        }
    }

    public static void main(String[] args) {
        Human man = new Man();
        Human woman = new Woman();
        man.sayHello(); // invokevirtual #21  // Method org/fenixsoft/polymorphic/Dynamic-Dispatch$Human.sayHello:()V
        woman.sayHello(); // invokevirtual #21
        man = new Woman();
        man.sayHello(); // invokevirtual #21
    }
}

运行结果：

1
2
3

man say hello
woman say hello
woman say hello

从字节码的角度来看， sayHello()方法均是通过invokevirtual指令触发，但是最终的执行方法版本却完全不同，invokevirtual执行的运行时解析过程如下：

找到操作数栈顶的第一个元素所指向的对象的实际类型，记作C。
如果在类型C中找到与常量中的描述符和简单名称都相符的方法，则进行访问权限校验，如果通过则返回这个方法的直接引用，查找过程结束；如果不通过，则返回java.lang. IllegalAccessError异常。
否则，按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。
如果始终没有找到合适的方法，则抛出java.lang.AbstractMethodError异常。

单分派与多分派

方法的宗量，即方法的接收者与方法的参数统称。可以有单宗量分派，即根据一个宗量对目标方法进行选择。也可以有多宗量分派，即根据多个宗量对目标方法进行选择。Java的静态分派属于多分派类型。JVM在运行时动态分派属于单宗量分派。

单分派和多分派代码示例：

public class Dispatch {
    static class QQ {}

    static class _360 {}

    public static class Father {
        public void hardChoice(QQ arg) {
            System.out.println("father choose qq");
        }
                
        public static hardChoice(_360 arg) {
            System.out.println("father choose 360");
        }
    }



    public static class Son {
        public static hardChoice(QQ arg) {
            System.out.println("son choose qq");
        }

        public static hardChoice(_360 arg) {
            System.out.println("son choose 360");
        }
    }

    public static void main(String[] args) {
        Father father = new Father();
        Father son = new Son();
        // 静态分派：多宗量分派，方法接收者静态类型是Father,方法参数是_360 invokevirtual Father.hardChoice(360)
        // 动态分派：单宗量分派，方法接收者实际类型是Father，执行 Father.hardChoice(360)
        father.hardChoice(new _360());
        // 静态分派：静态类型是Father，方法参数是QQ invokevirtual Father.hardChoice(QQ)
        // 动态分派：实际类型是Son，执行Son.hardChoice(QQ)
        son.hardChoice(new QQ());
    }
}

运行结果：

1 2	father choose 360 son choose qq

虚拟机动态分派的实现

处于性能考虑，动态分派常用”稳定优化“手段：在类的方法区建立一个虚方法表(Virtual Method Table, vtable)，和接口方法表(Interface Method Table, itable)。从而虚拟机不需要进行元数据查找，直接通过虚方法表确定应该执行的方法版本。

vtable

动态类型语言支持

动态语言的关键特征是它的类型检查的主体过程实在运行期而不是编译期，代码会更加简洁。而静态语言在编译器确定类型，最显著的好处是编译器可以提供严谨的类型检查，利于稳定性及代码达到更大规模。目前JVM支持的动态语言有Clojure, Groovy, Jython, JRuby等。

字节码解释执行引擎

本节探讨的是JVM将会如何对方法中的字节码进行解释执行的。

传统编译过程是从程序源码到目标代码的一个过程，代表有C/C++语言。
Java是采用了现代的编译原理思路，把源码转化成抽象语法树，再由JVM进行解释执行，属于编译半独立实现。C#也是一种半独立实现的编译语言。
而有些语言则将词法分析，抽象语法树，解释执行都封装在一起，例如JavaScript执行器，这类语言一般属于动态语言。

JIT

指令集架构

现在的指令执行主要有两种执行方式：

基于栈的指令集架构
- 可移植
- 执行速度相对较慢
基于寄存器的指令集架构
- 执行速度快

Java是基于栈的指令集架构。

基于栈的解释器执行过程示例

JVM Class Loader Subsystem

发表于 2019-02-10 更新于 2024-02-08 分类于 Java

Class文件结构

Class文件时一组以8位字节为基础单位的二进制流，各个数据项目严格按照顺序紧凑地排列在Class文件之中，中间没有添加任何分隔符，这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据。

Class文件本身是由下图的这些数据类型组成，这些数据项之间并没有分隔符，而是通过约定好的规范和表结构填入对应的信息，从而将Java语言代码翻译成字节码。Class文件数据项包含如下这些类型。

1. 魔数

第1~4字节：0xCAFEBABE

2. Class文件的版本

第5、6字节：次版本号（4x.0~4x.65535）

第7、8字节：主版本号（45~）

3. 常量池

常量池入口放置一项u2类型的数据，代表常量池容量计数值，从1开始。0作为没有常量池的表述。

字面量：接近Java语言层面常量概念，如文本字符串、声明为final的常量值等。
符号引用：编译原理概念，包括三类常量：
1. 类和接口的全限定名
2. 字段的名称和描述符
3. 方法的名称和描述符

常量池中每一项常量都是一个表。JDK中定义了14种结构的表结构数据，如下图所示：

表开始的第一位都是一个u1类型的标志位（binary 0000 0000 0000 0000 中某几位为1），代表本表属于哪种常量类型，而后则遵从常量表自己的格式填入数据，结构总表如下所示。

4. 访问标志

常量池后面两个字节：以16个标志位识别类或接口层次的访问信息，包括：

1. Class是类还是接口；
2. 是否为public类型；
3. 是否为abstract类型；
4. 如果是类的话，是否被声明为final。

访问标志本身总共由16个标志位可以使用，具体代表如下图所示：

5. 类索引、父类索引和接口索引集合

类索引和父类索引都是一个u2类型的数据，而接口索引集合是一组u2类型的数据的集合，Class文件中由这三项数据确定这个类的全限定名。

类索引和父类索引都指向了一个CONSTANT_Class_info类，而接口所以则第一位是接口的个数，后面跟了相应个数的索引分别指向CONSTANT_Class_info类。

6. 字段表集合

字段表用于描述接口或者类中声明的变量。字段包括类级变量以及实例级变量，但不包括在方法内部声明的局部变量。

字段结构如下所示：

字段的访问标志位有如下这些表格，标志位值和Class访问标志定义一样，但是支持的标志个数不一样：

name_index保存的是对常量池CONSTANT_Utf8的引用，保存了方法简单名称。

全限定名和简单名称很好理解，“org/fenixsoft/clazz/TestClass”是这个类的全限定名，仅仅是把类全名中的“.”替换成了“/”而已，为了使连续的多个全限定名之间不产生混淆，在使用时最后一般会加入一个“;”表示全限定名结束。简单名称是指没有类型和参数修饰的方法或者字段名称，这个类中的inc()方法和m字段的简单名称分别是“inc”和“m”。
描述符引用指向了一个字段/方法描述符CONSTANT_Utf8。
- 字段描述符，比如int实例变量的描述符是“I”;java.lang.Object 的实例描述符是 “Ljava/lang/Object;”，“double[][][]”的描述符为“[[[D”;
- 方法描述符，比如Object mymethod(int i, double d, Thread t)的描述符为 (IDLjava/lang/Thread;)Ljava/lang/Object;。
描述符支持如下类型：

7. 方法表集合

方法表用于描述接口或者类中声明的方法，包括类级方法以及实例方法。表结构跟字段表相似，在此不再赘述。

方法的访问标志与字段不同，如下图:

8. 属性表集合

属性表并不是单独存在的表，而是在Class文件、字段表、方法表都可以携带自己的属性表集合，用于描述某些场景专有的信息。属性表结构对后续属性进行了总表，结构如下:

目前虚拟机规范定义了下列属性：

字节码指令

Java编译器将代码的操作本身处理生成了字节码指令，放在了Code属性中，JVM读取指令进行执行。JVM支持的字节码指令和操作数如表格所示:

Class加载时机

5大主动引用场景：

遇到new、getstatic、putstatic或invokestatic这4条字节码指令时，如果类没有进行过初始化，则需要先触发其初始化。生成这4条指令的最常见的Java代码场景是：使用new关键字实例化对象的时候、读取或设置一个类的静态字段（被final修饰、已在编译期把结果放入常量池的静态字段除外）的时候，以及调用一个类的静态方法的时候。
使用java.lang.reflect包的方法对类进行反射调用的时候，如果类没有进行过初始化，则需要先触发其初始化。
当初始化一个类的时候，如果发现其父类还没有进行过初始化，则需要先触发其父类的初始化。
当虚拟机启动时，用户需要指定一个要执行的主类（包含main()方法的那个类），虚拟机会先初始化这个主类。
当使用JDK 1.7的动态语言支持时，如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄，并且这个方法句柄所对应的类没有进行过初始化，则需要先触发其初始化。

不会出发加载的三个被动引用例子：

通过子类引用父类的静态字段，不会导致子类初始化。
通过数组定义来引用类，不会出发此类的初始化。
常量在编译阶段会存入调用类的常量池中，本质上没有直接引用到定义敞亮的类，因此不会触发定义常量的类的初始化。

Class加载过程

类从被加载到虚拟机内存中开始，到卸载出内存为止，它的整个生命周期包括：加载（Loading）、验证（Verification）、准备（Preparation）、解析（Resolution）、初始化（Initialization）、使用（Using）和卸载（Unloading）7个阶段。其中验证、准备、解析3个部分统称为连接（Linking），这7个阶段的发生顺序如下图所示。

加载

通过一个类的全限定名来获取定义此类的二进制字节流
将字节流所代表的静态存储结构转化为方法区的运行时数据结构：
- 如果是数组，JVM会直接创建数组类
  1. 引用类型的数组：递归采用类加载过程去加载这个类型
  2. 如果是非引用类型的数组：JVM将会把数组标记为引导类加载器关联。
在内存中生成一个代表这个类的java.lang.Class对象，作为方法区这个类的各种数据访问入口。

验证

文件格式验证

验证字节流是否符合Class文件格式的规范。

元数据验证

对字节码描述的信息进行语义分析，以保证其描述的信息符合Java语言规范要求。

字节码验证

通过数据流和控制流分析，确定程序语义是合法的、符合逻辑的。

符号引用验证

发生在符号引用转化为直接引用的时候，是对类自身意外（常量池里的各种符号引用）信息进行匹配性校验。

准备

正式为变量分配内存并设置类变量为初始值阶段。引用类型的内存分配具体步骤参考JVM新对象创建。

解析

虚拟机将常量池内的符号引用替换为直接引用的过程。

符号引用：符号引用以一组符号来描述引用的目标，符号可与是任何形式的字面量，只要能无歧义的定义到目标即可。
直接引用：直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。

解析动作主要针对如下：

类或接口 CONSTANT_Class_info
字段 CONSTANT_Fieldref_info
类方法 CONSTANT_Methodref_info
接口方法 CONSTANT_InterfaceMethodref_info
方法类型 CONSTANT_MethodType_info
方法句柄 CONSTANT_MethodHandle_info
和调用点限定符 CONSTANT_InvokeDynamic_info

这7类符号引用进行。

类或接口的解析
1. 如果C不是一个数组类型，那虚拟机将会把代表N的全限定名传递给D的类加载器去加载这个类C。在加载过程中，由于元数据验证、字节码验证的需要，又可能触发其他相关类的加载动作，例如加载这个类的父类或实现的接口。一旦这个加载过程出现了任何异常，解析过程就宣告失败。
2. 如果C是一个数组类型，并且数组的元素类型为对象，也就是N的描述符会是类似“[Ljava/lang/Integer”的形式，那将会按照第1点的规则加载数组元素类型。如果N的描述符如前面所假设的形式，需要加载的元素类型就是“java.lang.Integer”，接着由虚拟机生成一个代表此数组维度和元素的数组对象。
3. 如果上面的步骤没有出现任何异常，那么C在虚拟机中实际上已经成为一个有效的类或接口了，但在解析完成之前还要进行符号引用验证，确认D是否具备对C的访问权限。如果发现不具备访问权限，将抛出java.lang.IllegalAccessError异常。
字段解析
1. 首先将会对字段表内class_index项中索引的CONSTANT_Class_info符号引用进行解析，也就是字段所属的类或接口的符号引用。如果在解析这个类或接口符号引用的过程中出现了任何异常，都会导致字段符号引用解析的失败。
2. 如果C本身就包含了简单名称和字段描述符都与目标相匹配的字段，则返回这个字段的直接引用，查找结束。
3. 否则，如果在C中实现了接口，将会按照继承关系从下往上递归搜索各个接口和它的父接口，如果接口中包含了简单名称和字段描述符都与目标相匹配的字段，则返回这个字段的直接引用，查找结束。
4. 否则，如果C不是java.lang.Object的话，将会按照继承关系从下往上递归搜索其父类，如果在父类中包含了简单名称和字段描述符都与目标相匹配的字段，则返回这个字段的直接引用，查找结束。
5. 否则，查找失败，抛出java.lang.NoSuchFieldError异常。
类方法解析
1. 首先将会对字段表内class_index项中索引的CONSTANT_Class_info符号引用进行解析
2. 类方法和接口方法符号引用的常量类型定义是分开的，如果在类方法表中发现class_index中索引的C是个接口，那就直接抛出java.lang.IncompatibleClassChangeError异常。
3. 如果通过了第1步，在类C中查找是否有简单名称和描述符都与目标相匹配的方法，如果有则返回这个方法的直接引用，查找结束。
4. 否则，在类C的父类中递归查找是否有简单名称和描述符都与目标相匹配的方法，如果有则返回这个方法的直接引用，查找结束。
5. 否则，在类C实现的接口列表及它们的父接口之中递归查找是否有简单名称和描述符都与目标相匹配的方法，如果存在匹配的方法，说明类C是一个抽象类，这时查找结束，抛出java.lang.AbstractMethodError异常。
6. 否则，宣告方法查找失败，抛出java.lang.NoSuchMethodError。
接口方法解析
1. 首先将会对字段表内class_index项中索引的CONSTANT_Class_info符号引用进行解析
2. 与类方法解析不同，如果在接口方法表中发现class_index中的索引C是个类而不是接口，那就直接抛出java.lang.IncompatibleClassChangeError异常。
3. 否则，在接口C中查找是否有简单名称和描述符都与目标相匹配的方法，如果有则返回这个方法的直接引用，查找结束。
4. 否则，在接口C的父接口中递归查找，直到java.lang.Object类（查找范围会包括Object类）为止，看是否有简单名称和描述符都与目标相匹配的方法，如果有则返回这个方法的直接引用，查找结束。
5. 否则，宣告方法查找失败，抛出java.lang.NoSuchMethodError异常。

初始化

类初始化阶段是类加载过程的最后一步，前面的类加载过程中，除了在加载阶段用户应用程序可以通过自定义类加载器参与之外，其余动作完全由虚拟机主导和控制。到了初始化阶段，才真正开始执行类中定义的Java程序代码。

<clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块（static{}块）中的语句合并产生的，编译器收集的顺序是由语句在源文件中出现的顺序所决定的，静态语句块中只能访问到定义在静态语句块之前的变量，定义在它之后的变量，在前面的静态语句块可以赋值，但是不能访问。
<clinit>()方法与类的构造函数（或者说实例构造器<init>()方法）不同，它不需要显式地调用父类构造器，虚拟机会保证在子类的<clinit>()方法执行之前，父类的<clinit>()方法已经执行完毕。因此在虚拟机中第一个被执行的<clinit>()方法的类肯定是java.lang.Object。
由于父类的<clinit>()方法先执行，也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作，如下在代码清单中，字段B的值将会是2而不是1。

public class Test {
    public static int A = 1;
    static {
        A = 2;
    }
}

static class Sub extends Parent{
    public static int B = A;
}

public static void main(String[] args){
    System.out.println(Sub.B);
}

<clinit>()方法对于类或接口来说并不是必需的，如果一个类中没有静态语句块，也没有对变量的赋值操作，那么编译器可以不为这个类生成<clinit>()方法。
接口中不能使用静态语句块，但仍然有变量初始化的赋值操作，因此接口与类一样都会生成<clinit>()方法。但接口与类不同的是，执行接口的<clinit>()方法不需要先执行父接口的<clinit>()方法。只有当父接口中定义的变量使用时，父接口才会初始化。另外，接口的实现类在初始化时也一样不会执行接口的<clinit>()方法。
虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确地加锁、同步，如果多个线程同时去初始化一个类，那么只会有一个线程去执行这个类的<clinit>()方法，其他线程都需要阻塞等待，直到活动线程执行<clinit>()方法完毕。如果在一个类的<clinit>()方法中有耗时很长的操作，就可能造成多个进程阻塞，在实际应用中这种阻塞往往是很隐蔽的。

使用

卸载

Class加载器

虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现，以便让应用程序自己决定如何去获取所需要的类。这种实现便是类加载器。

对于任意一个类，都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性，每一个类加载器，都拥有一个独立的类名称空间。

类的相等语义，只有在这两个类是由同一个类加载器加载的前提下才有意义，只要类加载器不同，即使是加载自同一个Class文件，两个类也是不等的。（相等指的是，Class对象的equals(), isAssignableFrom(), isInstance()， instantof 的返回结果。例如下面代码运行结果则是：

1 2	class org.fenixsoft.classloading.ClassLoaderTest false

public class ClassLoaderTest{
    public static void main(String[] args) throw Exception {
        // Class ClassLoader define and override
        ClassLoader myLoader = new ClassLoader() {
            @Override
            public Class<?> loadClass(String name) throw ClassNotFoundException{
                try {
                    String fileName = name.substring(name.lastIndextOf(".") + 1) + ".class";
                    InputStream is = getClass().getResourceAsStream(fileName);
                    if(is == null){
                        return super.loadClasse(name);
                    }
                    byte[] b = new bye[is.available()];
                    is.read(b);
                    return defineClass(name, b, 0, b.length);
                }catch(IOException e){
                    throw new ClassNotFoundException(name);
                }
            }
        };

        Object obj = myLoader.loadClass("org.fenixsoft.classloading.ClassLoaderTest").newInstance();

        System.out.println(obj.getClass());
        System.out.println(obj instanceof org.fenixsoft.classloading.ClassLoaderTest);
    }
}

类加载器类型

目前只存在两种不同的类加载器：一种是启动类加载器(Bootstrap ClassLoader)，C++语言实现，虚拟机自身的一部分；另一种就是所有其他类加载器，继承自抽象类java.lang.ClassLoader。

启动类加载器（Bootstrap ClassLoader）：前面已经介绍过，这个类将器负责将存放在\lib目录中的，或者被-Xbootclasspath参数所指定的路径中的，并且是虚拟机识别的（仅按照文件名识别，如rt.jar，名字不符合的类库即使放在lib目录中也不会被加载）类库加载到虚拟机内存中。启动类加载器无法被Java程序直接引用，用户在编写自定义类加载器时，如果需要把加载请求委派给引导类加载器，那直接使用null代替即可，如下列代码清单所示为java.lang.ClassLoader.getClassLoader()方法的代码片段。

public ClassLoader getClassLoader() {
    ClassLoader cl = getClassLoader0();
    if(cl == null)
        return null;
    SecurityManager sm = System.getSecurityManger();
    if(sm != null){
        ClassLoader ccl = ClassLoader.getCallerClassLoader();
        if(ccl != null && ccl != cl && !cl.isAncestor(ccl)){
            sm.checkPermission(SecurityConstants.GET_CLASSLOADER_PERMISSION);
        }
    }
    return cl;
}

扩展类加载器（Extension ClassLoader）：这个加载器由sun.misc.Launcher$ExtClassLoader实现，它负责加载\lib\ext目录中的，或者被java.ext.dirs系统变量所指定的路径中的所有类库，开发者可以直接使用扩展类加载器。
应用程序类加载器（Application ClassLoader）：这个类加载器由sun.misc.Launcher$App-ClassLoader实现。由于这个类加载器是ClassLoader中的getSystemClassLoader()方法的返回值，所以一般也称它为系统类加载器。它负责加载用户类路径（ClassPath）上所指定的类库，开发者可以直接使用这个类加载器，如果应用程序中没有自定义过自己的类加载器，一般情况下这个就是程序中默认的类加载器。

双亲委派模型

图中展示的类加载器之间的这种层次关系，称为类加载器的双亲委派模型（Parents Delegation Model）。双亲委派模型要求除了顶层的启动类加载器外，其余的类加载器都应当有自己的父类加载器。这里类加载器之间的父子关系一般不会以继承（Inheritance）的关系来实现，而是都使用组合（Composition）关系来复用父加载器的代码。

双亲委派模型的工作过程是：

所有的加载请求都委派给父类加载器去完成。
当父类加载器反馈自己无法完成加载请求，子加载器才会尝试自己加载。

双亲委派模型保证了Java程序优先从启动类加载器进行搜索加载，使得java.lang.Object类型在程序的各种类加载环境中都是同一个类，能够稳定运行程序。

双亲委派模型实现如下：

protected synchronized Class<?> loadClass(String name, boolean resolve) throws ClassNotFoundException{
    //首先，检查请求的类是否已经加载过了
    Class c = findLoadedClass(name);
    if( c == null){
        try {
            if(parent != null){
                // 委派父类加载器先去尝试加载
                c = parent.loadClass(name, false);
            }else {
                c = findBootstrapClassOrNull(name);
            }
        } catch (ClassNotFoundException e) {
            // 如果父类加载器抛出异常，说明父类加载器不能加载，因此调用子类进行加载
            c = findClass(name);
        }
    }
    if(resolve) {
        resolveClass(c);
    }
    return c;
}

破坏双亲委派模型情况

loadClass没有按照双亲委派模型进行实现：目前已经不推荐重写loadClass方法，而是重写findClass方法，从而保证模型安全。
第三方JNDI接口提供者/SPI的代码不能被启动类加载器加载：线程上下文类加载器(Tread Context ClassLoader)。可以通过java.lang.Thread类的setContextClassLoader()进行设置。如果父类及应用全局都没有设置过，则默认就是应用程序类加载器。这样就让父类加载器请求子类加载器去加载SPI的代码。
为程序动态性的追求导致：代码热替换(HotSwap),模块热部署(Hot Deployment)等。每一个程序模块都有自己的类加载器，当需要更换一块程序模块是，就把这块代码以及类加载器一起换掉以实现代码的热替换。OSGi收到类加载请求时：
1. 将以java.*开头的类委派给父类加载器加载。
2. 否则，将委派列表名单内的类委派给父类加载器加载。
3. 否则，将Import列表中的类委派给Export这个类的Bundle的类加载器加载。
4. 否则，查找当前Bundle的ClassPath，使用自己的类加载器加载。
5. 否则，查找类是否在自己的Fragment Bundle中，如果在，则委派给Fragment Bundle的类加载器加载。
6. 否则，查找Dynamic Import列表的Bundle，委派给对应Bundle的类加载器加载。
7. 否则，类查找失败。
此实现只有前两个点符合双亲委派模型，后面的都是平级的类加载器中进行。

Java Memory Model

发表于 2018-12-24 更新于 2024-02-08 分类于 Java

本文将从JMM的理论模型和系统设计角度切入讲述并发工具的内存语义与实现细节。

JMM存在的目的

Java虚拟机规范中试图定义一种Java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异，以实现让Java程序在各个平台下都能达到一致的内存访问效果。

JMM

JVM内存模型操作

主内存操作

lock：将一个变量表示为一条线程独占的状态。
unlock: 将一个处于锁定状态的变量释放，释放后的变量才可以被其他线程锁定。
read: 将一个变量的值从主内存传输到线程的工作内存中，以便随后的load动作使用。
write: 将store操作从工作内存中得到的变量值放入主内存的变量中。

工作内存操作

load: 把read操作从主内存得到的变量值放入到工作内存的变量副本中。
use: 把工作内存中的一个变量值传递给执行引擎，每当虚拟机遇到需要使用变量复制的字节码指令时执行这个操作。
assign: 把一个执行引擎的接收到的值赋值给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
store: 把工作内存中一个变量的值传送到主内存中，以便随后的write操作使用。

内存操作执行基本规则

不允许read和load、store和write操作之一单独出现，即不允许一个变量从主内存读取了但工作内存不接受，或者从工作内存发起回写了但主内存不接受的情况出现。
不允许一个线程丢弃它的最近的assign操作，即变量在工作内存中改变了之后必须把该变化同步回主内存。
不允许一个线程无原因地（没有发生过任何assign操作）把数据从线程的工作内存同步回主内存中。
一个新的变量只能在主内存中“诞生”，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量，换句话说，就是对一个变量实施use、store操作之前，必须先执行过了assign和load操作。
一个变量在同一个时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。
如果对一个变量执行lock操作，那将会清空工作内存中此变量的值，在执行引擎使用这个变量前，需要重新执行load或assign操作初始化变量的值。
如果一个变量事先没有被lock操作锁定，那就不允许对它执行unlock操作，也不允许去unlock一个被其他线程锁定住的变量。
对一个变量执行unlock操作之前，必须先把此变量同步回主内存中（执行store、write操作）。

JVM内存模型特性

原子性 JVM对基本数据类型的访问读写（上述操作）是具备原子性的。
可见性当一个线程修改了共享变量的值，其他线程能够立刻知道这个修改。而volatile变量较普通变量能够保证多线程场景下线程在每次读写前都能刷新。
有序性本线程内，操作都是有序；多线程场景下，线程间操作是无序的。

Happen-Before先行发生法则

先行发生是JMM中定义的两项操作之前的偏序关系，如果说操作A先行发生于操作B，其实就是说发生操作B之前，操作A产生的影响能够被B观察到，“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等。

具体体现：

程序次序规则（Program Order Rule）：在一个线程内，按照程序代码顺序，书写在前面的操作先行发生于书写在后面的操作。准确地说，应该是控制流顺序而不是程序代码顺序，因为要考虑分支、循环等结构。
管程锁定规则（Monitor Lock Rule）：一个unlock操作先行发生于后面对同一个锁的lock操作。这里必须强调的是同一个锁，而“后面”是指时间上的先后顺序。
volatile变量规则（Volatile Variable Rule）：对一个volatile变量的写操作先行发生于后面对这个变量的读操作，这里的“后面”同样是指时间上的先后顺序。
线程终止规则（Thread Termination Rule）：线程中的所有操作都先行发生于对此线程的终止检测，我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值等手段检测到线程已经终止执行。
线程中断规则（Thread Interruption Rule）：对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生，可以通过Thread.interrupted()方法检测到是否有中断发生。
对象终结规则（Finalizer Rule）：一个对象的初始化完成（构造函数执行结束）先行发生于它的finalize()方法的开始。
传递性（Transitivity）：如果操作A先行发生于操作B，操作B先行发生于操作C，那就可以得出操作A先行发生于操作C的结论。

指令重排

编译器和处理器为了优化程序性能而对指令序列进行重新排序的一种手段。

单线程重排序：

数据依赖性：程序的任意两个操作的执行是可能具有一定的依赖性，不能改变。
as-if-serial语义：单线程程序的执行结果不能改变。
程序顺序规则: happens-before的顺序规则不能修改。

多线程重排序：

顺序一致性模型：概念上模型只有一个单一的全局内存，所有操作线程在每一步操作后看到的内存内容都是一致的。实际上并不能完全保证，只能保证同步程序在进出临界区内代码各个线程的内存视图能够一致。

内存屏障

硬件层的内存屏障分为两种：Load Barrier 和 Store Barrier即读屏障和写屏障。
内存屏障有两个作用：

阻止屏障两侧的指令重排序；
强制把写缓冲区/高速缓存中的脏数据等写回主内存，让缓存中相应的数据失效。

对于Load Barrier来说，在指令前插入Load Barrier，可以让高速缓存中的数据失效，强制从新从主内存加载数据；

对于Store Barrier来说，在指令后插入Store Barrier，能让写入缓存中的最新数据更新写入主内存，让其他线程可见。

java内存屏障

java的内存屏障通常所谓的四种即LoadLoad,StoreStore,LoadStore,StoreLoad实际上也是上述两种的组合，完成一系列的屏障和数据同步功能。

LoadLoad屏障：对于这样的语句Load1; LoadLoad; Load2，在Load2及后续读取操作要读取的数据被访问前，保证Load1要读取的数据被读取完毕。
StoreStore屏障：对于这样的语句Store1; StoreStore; Store2，在Store2及后续写入操作执行前，保证Store1的写入操作对其它处理器可见。
LoadStore屏障：对于这样的语句Load1; LoadStore; Store2，在Store2及后续写入操作被刷出前，保证Load1要读取的数据被读取完毕。
StoreLoad屏障：对于这样的语句Store1; StoreLoad; Load2，在Load2及后续所有读取操作执行前，保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的。在大多数处理器的实现中，这个屏障是个万能屏障，兼具其它三种内存屏障的功能

Java同步工具的内存语义及实现

锁的内存语义及实现

锁的语义决定了临界区代码的执行具有原子性。

内存语义

锁的释放可以让线程向获取同一个锁的线程发送消息。
锁的获取可以让线程对应的内存失效使得临界代码必须从主内存获取共享变量。

实现细节

公平锁获取通过AbstractQueuedSynchronizer即AQS实现，通过一个整型的volatile变量state来维护同步状态。拿锁时，tryAcquire方法会查看state值是否为0，即无锁状态，并将state值设置为传入变量acquires，如果state不为0，且owner不是current线程，则返回false.

protected final boolean tryAcquire(int acquires){
  final Thread current = Thread.currentThread();
  int c = getState();
  if(c == 0) {
    if( isFirst(current)) && compareAndSetState(0, acquires) {
      setExclusiveOwnerThread(current);
      return true;
    }
  }
  else if(current == getExclusiveOwnerThread()){
    int nextc = c + acquires;
    if(nextc < 0)
      throw new Error("Max lock count exceeded");
      setState(nextc);
      return true;
  }
  return false;
}

非公平锁的获取不需要tryAcquire方法中通过isFirst(current))方法进行竞争，而是直接调用compareAndSetState(int expect, int update)。

(非)公平锁释放通过tryRelease(int releases)实现：

protected final boolean tryRelease(int releases){
  int c = getState() - releases;
  if( Thread.currentThread() != getExclusiveOwnerThread())
    throw new IlleagalMonitorStateException();
    boolean free = false;
    if( c == 0){
      free = true;
      setExclusiveOwnerThread(null);
    }
    setState(c);
    return free;
}

CAS 内存语义及操作内容

内存语义

CAS更新操作，同时具有volatile读和volatile写的内存语义。

操作内容

CAS是处理器的一种操作，是native方法API。

确保对内存读-改-写的原子性。
禁止CAS指令前后读写指令重排。
把缓存区的所有数据刷新到内存中。

volatile 内存语义及实现

内存语义

volatile写与锁的释放有相同的内存语义，volatile读与锁的获取有相同内存语义。

实现细节

通过插入内存屏障，来组织编译器/操作系统进行指令重排序。
通过关联读/写操作和使用操作（用之前必须从主内存读，assign后必须写入主内存，以及写happens-before读规则）强制CPU的缓存失效来保证内存可见性。
volatile的内存屏障策略如下：
在每个volatile写操作前插入StoreStore屏障，在写操作后插入StoreLoad屏障；
在每个volatile读操作后分别插入LoadLoad屏障，和LoadStore屏障；

由于内存屏障的作用，避免了volatile变量和其它指令重排序、线程之间实现了通信，使得volatile表现出了锁的特性。

volatile强制缓存失效策略如下:

线程的Load、read和Use进行关联:只有当线程T对变量V执行的前一个动作是load的时候，线程T才能对变量V执行use动作；并且，只有当线程T对变量V执行的后一个动作是use的时候，线程T才能对变量V执行load动作。线程T对变量V的use动作可以认为是和线程T对变量V的load、read动作相关联，必须连续一起出现（这条规则要求在工作内存中，每次使用V前都必须先从主内存刷新最新的值，用于保证能看见其他线程对变量V所做的修改后的值）。
Assign和所有线程的store，write进行关联只有当线程T对变量V执行的前一个动作是assign的时候，线程T才能对变量V执行store动作；并且，只有当线程T对变量V执行的后一个动作是store的时候，线程T才能对变量V执行assign动作。线程T对变量V的assign动作可以认为是和线程T对变量V的store、write动作相关联，必须连续一起出现（这条规则要求在工作内存中，每次修改V后都必须立刻同步回主内存中，用于保证其他线程可以看到自己对变量V所做的修改）。
不同变量的上述的两段操作顺序一致假定动作A是线程T对变量V实施的use或assign动作，假定动作F是和动作A相关联的load或store动作，假定动作P是和动作F相应的对变量V的read或write动作；类似的，假定动作B是线程T对变量W实施的use或assign动作，假定动作G是和动作B相关联的load或store动作，假定动作Q是和动作G相应的对变量W的read或write动作。如果A先于B，那么P先于Q（这条规则要求volatile修饰的变量不会被指令重排序优化，保证代码的执行顺序与程序的顺序相同）。

Happens before法则: 前一个操作的执行结果要对第二个操作可见。

final 内存语义与实现细节

final关键字可以放在static域，实例成员域，和局部变量三种变量前。其中final修饰的局部变量的可以作为线程的局部变量传递给子线程。也能保证并发情况下的内存语义。

内存语义

对于final域，编译器和CPU会遵循两个重排序规则：

新建对象过程中，构造体中对final域的初始化写入和这个对象赋值给其他引用变量，这两个操作不能重排序；（废话嘛）
初次读包含final域的对象引用和读取这个final域，这两个操作不能重排序；（晦涩，意思就是先赋值引用，再调用final值）

总之上面规则的意思可以这样理解，必需保证一个对象的所有final域被写入完毕后才能引用和读取。这也是内存屏障的起的作用：

实现细节

写final域：在编译器写final域完毕，构造体结束之前，会插入一个StoreStore屏障，保证前面的对final写入对其他线程/CPU可见，并阻止this指针赋值与final域写被重排序(this = new Object(){ finalField = …})。（如果没有，普通域的写可以被重排到构造函数外）
写final域的成员域:构造函数内对一个final引用的对象的成员域的写入，与随后在构造函数外把这个被构造对象的引用赋值给一个引用变量，这两个操作之间不能重排序。
读final域：在上述规则2中，两步操作不能重排序的机理就是在读final域前插入了LoadLoad屏障，这个阻止了读取this引用和读取final域的重排序（isntance.finalField）。

X86处理器中，由于CPU不会对写-写操作进行重排序，所以StoreStore屏障会被省略；而X86也不会对逻辑上有先后依赖关系的操作进行重排序，所以LoadLoad也会变省略。

只要对象是正确构造的（被构造对象的引用在构造函数中没有“逸出”），那么不需要使用同步（指 lock 和 volatile 的使用），就可以保证任意线程都能看到这个 final 域在构造函数中被初始化之后的值。

this逸出代码：


public class FinalReferenceEscapeExample {
final int i;
static FinalReferenceEscapeExample obj;
public FinalReferenceEscapeExample () {
    i = 1;                              //1写final域
    obj = this;                          //2 this引用在此“逸出”
}
public static void writer() {
    new FinalReferenceEscapeExample ();
}
public static void reader {
    if (obj != null) {                     //3
        int temp = obj.i;                 //4
    }
}
}

Concurrent包的内存语义及实现

Concurrent包底层实现依赖如下图所示：

Cocurrent

延迟初始化问题讨论

延迟初始化是在需要实例的时候再进行初始化，从而达到提升程序初始化性能的目的。然而延迟初始化需要考虑多线程并发访问，和指令重排序问题。

静态域延迟初始化

静态域的延迟初始化能通过final关键词实现，因为final静态域能保证多线程安全初始化，同事也能保证computeFieldValue()方法不会溢出FieldHolder的构造方法。

private static class FieldHolder {
  static final FieldType field = computeFieldValue();
}
private static FieldType getField(){
  return FieldHolder.field;
}

成员域延迟初始化

单重检查模式

单重检查模式能够确保大多数情况的fiel的同步，但是当computeFieldValue()执行和field赋值可以重排序，导致在第一次检查时其他线程可能看到不完整的field值，并返回。

private volatile FieldType field;

private FieldType getField(){
  FieldType result = field;
  if(result == null){
    field = result = computeFieldValue();
    return result;
  }
}

双重检查模式

双重检查模式通过synchronized和volatile的内存语义，3, 4对其他线程可见，且其他线程在1处的读不会重排序到2语块的内部，能够确保在线程更新field值时，与其他线程查看field值之间的读写能够顺序执行。

局部变量result的使用能够保证尽量少次数的访问field和取锁，提升运行效率。

private volatile FieldType field;

private FieldType getField(){
  FieldType result = field;
  if(result == null){
    result = field;
    if(result == null){ // 1
      synchornized(this){ // 2
        field = result = computeFieldValue(); //3, 4
      }
    }
  }
  return result;
}