第一章走入并行世界

介绍没有什么需要记的

第二章 Java并发程序基础

2.1线程的六个基本状态

NEW RUNNABLE BLOCKED,WAITING,TIMED_WAITING,TERMINATED

2.2 线程基本操作

2.2.1 新建线程

一些简单的基本的耗字的就不写了

这里主要是Thread与Runnable区别以及Start开始线程方法推荐使用Runnable接口进行编写并发代码这也是最常见的方式

2.2.2 终止线程

stop方法(该方法会立即终止该线程)被废弃了原因是太过暴力可能导致数据不一致的问题
因为在stop方法会立即结束锁然后立即释放锁而这些锁是用来维持对象的一致性的如果写数据写到一半并强行终止的话那么对象就会被写坏另外一个等待该锁的就会读到这个不一致的对象悲剧就发生了

2.2.3 线程中断

在java中线程中断是一个重要的线程协作机制中断就是让目标线程停止运行的意思实际并非如此严格的讲线程中断并不会使线程退出而是给线程发送一个通知告知目标线程有人希望你退出至于目标线程接到通知如何处理则完全由目标线程自己决定如果中断后无条件退出就会遇到stop方法的老问题

与中断线程有关的三个方法

interrupt() //中断线程
isInterrupted() //判断是否中断
interrupted() //判断是否被中断并清除当前中断状态

中断方法乍看与上面的stop标记的手法非常相似但是中断更为强力比如如果在循环体中出现了类似wait()或者sleep()这样的操作则只能用中断来识别了

相关代码请见 InterruptTest

2.2.4 等待与通知
wait方法与notify方法
notify是随机的唤醒一个线程 notifyAll会唤醒所有等待的线程

这俩个方法的关键在一个监听器在使用wait方法前必须获得object对象的监听器 wait方法执行后会释放这个监听器这样做的目的是使得其他等待在object对象上的线程不至于因为第一个线程的休眠而全部无法正常执行在第二个线程使用notify前也必须获得一个object的监听器然后获得这个监听器后 notify就会尝试去唤醒一个等待线程在线程被唤醒后第一件事是尝试获得这个监听器而不是执行后续代码如果暂时无法获得就等待这个监听器获得了之后才能真正的继续执行

相关代码请见 SimpleWN

2.2.5 suspend与resume方法

suspend与resume方法现在已经是不推荐的操作了不推荐使用的原因是suspend会导致线程暂停的同时不会去释放任何锁资源此时其他任何线程想要访问被它暂用的锁时都会被牵连导致无法正常运行直到对应的线程上进行了resume操作被挂起的线程才能继续从而其他所有阻塞在相关锁上的线程也可以继续执行但是，如果resume操作意外的在suspend之前的执行了那么挂起的线程很难有机会继续执行并且它占用的锁不会释放因此可能会导致整个系统工作不正常而且对于被挂起的线程从它的线程状态来看居然还是Runnable 也会严重影响对系统当前状态的判断

2.2.6 等待线程结束(join)与谦让(yield)

Join有俩个不同参数的方法

一个是默认的无限等待一直阻塞当前线程直到目标线程执行完毕
第二个方法给出了一个最大等待时间如果超过给定时间目标线程还在执行当前线程也会因为“等不及了”，而继续往下执行

相关代码请见 JoinMain

有关Join 补充一点 join的本质是让调用线程wait在当前线程对象实例上
下面是JDK中join实现的核心代码片段

while(isAlive()){
wait(0);
}

可以看到它让调用线程在当前线程对象上进行等待当线程执行完成后被等待的线程也会在退出前调用notifyAll()通知所有的等待线程继续执行因此值得注意的一点是：不要在应用程序中在Thread的对象实例上使用类似wait()或者notify()等方法因为这很有可能会影响到系统API的或者被系统API所影响

Thread.yield（）方法它的定义如下

1	public static native void yield();

这是一个静态方法一旦执行它会使当前线程让出CPU 但要注意让出CPU并不表示当前线程不执行了当前线程在让出CPU后还会执行CPU资源的争夺但是是否能够被再次分配到就不一定了因此对Thread.yield调用就好像是在说：我已经完成了一些重要的工作我应该是可以休息一下了，可以给其他线程一些工作机会了

如果你觉得一个线程不是那么重要或者优先级非常低而且又害怕它会占用太多的CPU资源那么可以在适当的时候调用Thread.yield() 给予其他重要线程更多的工作机会

2.3 volatile与Java内存模型(JMM)

volatile的语义是易变的不稳地的这也正是使用volatile关键字的语义

当你使用volatile去声明一个变量时就等于告诉了虚拟机这个变量极有可能会被某些程序或者线程修改为了确保这个变量被修改后应用程序范围内的所有线程都能够“看到”这个改动，虚拟机就必须采用一些特殊的手段保证这个变量的可见性等特点

volatile对保证操作的原子性是有非常大的帮助的但是需要注意的是,volatile并不能代替锁 ,它也无法保证一些复合操作的原子性

2.4分门别类的管理：线程组

2.5 驻守后台：守护线程(Daemon)

守护线程是一种特殊的线程就和它的名字一样它是系统的守护者在后台默默地运行一些系统性的服务比如垃圾回收线程 JIT线程就可以理解为守护线程与之相对应的就是用户线程用户线程可以认为是系统的工作线程它会完成这个程序应该要完成的业务操作如果用户线程全部结束了这意味着这个程序实际上无事可做了守护线程要守护的对象已经不存在那么整个应用程序就自然应该结束因此当一个Java应用内只有守护线程时 Java虚拟机就会自然退出

2.6 先干重要的事：线程优先级

Java的线程可以有自己的优先级优先级高的在竞争线程时会更有优势更可能抢占资源当然这只是一个概率问题运气不好也抢不到这个线程的优先级调度和底层操作系统有密切的关系在各个平台上表现不一并且这种优先级产生的后果也可能不容易预测无法精准控制因此在要求严格的场合还是需要自己在应用层解决线程调度问题

在Java中使用1-10表示线程优先级一般可以使用内置的三个静态标量表示

public final static int MIN_PRIORITY = 1;

public final static int NORM_PRIORITY = 5;

public final static int MAX_PRIORITY = 10;

数字越高则优先级越大但有效范围在1-10 高优先级的线程倾向于更快的完成

2.7 线程安全的概念与synchronized

volatile不能真正保证线程安全它只能确保一个线程修改了数据后其他线程能够看到这个改动但当俩个线程同时修改某一个数据时却依然会产生冲突

2.8 程序中的幽灵:隐蔽的错误

2.8.1 无提示的错误案例

int v1=1073741827;
int v2=1473741575;
int ave=(v1+v2)/2;
System.out.println(ave);

这里就会出现一个错误这个错误是因为int的溢出问题这种问题就是无提示的错误案例这种问题非常难找不能得到异常与相关的错误日志

2.8.2 并发下的ArrayList

2.8.3 并发下诡异的HashMap

2.8.4 初学者常见问题：错误的加锁

第三章 JDK并发包

这章的难点在于解析并发包下并发容器的源码

其中主要还是ConcurrentLinkedQueue类

3.1 多线程的团队控制:同步控制

3.1.1 synchronized的功能扩展 :重入锁

重入锁完全替代synchronized关键字在JDK 5.0早期的版本中重入锁的性能远远好过synchronized 不过JDK6开始 JDK在synchronized做了大量的优化使得俩者性能差距不大

重入锁简单的使用案例入戏

中断响应

对于synchronized来说如果一个线程等待锁那么结果只有俩种情况要么继续执行要么它就是保持等待

而使用重入锁则提供了另外一种可能那就是线程可以被中断也就是在等待锁的过程中程序可以根据需要取消对锁的请求。有些时候这么做是非常有必要的

中断正式提供了一套机制如果一个线程正在等待锁那么它依旧可以收到一个通知被告知元素是否再等待可以停止工作了这种情况对处理死锁是有一定帮助的

下面的代码产生了一个死锁但得益与锁中断我们可以很轻易的解决这个死锁

锁申请等待限时

除了等待外部通知要避免死锁还有另外一种方法那就是限时等待给定一个等待时间让线程自动放弃这对系统来说是有意义的我们可以使用tryLock方法进行一次限时的等待

公平锁

公平锁不会产生饥饿只要你排队最终还是可以得到资源的如果我们使用synchronized关键字来实现锁控制那么产生的锁就是非公平的而重入锁允许我们队其公平性进行设置

3.1.2 重入锁的好搭档:Condition条件

Condition是与重入锁相关联的通过Lock接口(重入锁就实现了这一接口)的Condition newCondition()方法可以生成一个与当前重入锁绑定的Condition实例利用Condition对象我们就可以让线程在合适的时间等待或者在某一个特定的时刻得到通知继续执行

具体方法查文档‘、吧

例子如下

3.1.3 允许多个线程同时访问：信号量

信号量为多线程提供了更为强大的控制方法广义上说信号量是对锁的扩展无论是内部锁synchronized还是重入锁ReentrantLock 一次都只允许一个线程访问一个资源，而信号量却可以指定多个线程同时访问某一个资源信号量主要提供以下构造函数

1
2
3

public Semaphore(int permist)

public Semaphore(int permise,boolean fair)  //第二个参数可以指定是否公平

在构建信号量对象时必须要指定信号量的准入数即同时能申请多少个许可每当线程每次只申请一个许可时这就相当于指定了同时有多少个线程可以访问某一个资源

public void acquire()

public void acquireUninterruptibly()

public void  tryAcquire()

public void  tryAcquire(long timeout,Timeout unit)

public void  release()

acquire()方法尝试获得一个准入的许可若无法获得则线程会等待直到有线程释放一个许可或者当前线程被中断。acquireUninterruptibly()方法和acquire()方法类似但是不响应中断 tryAcquire()会尝试获得一个许可如果成功返回true 失败则是false 它不会进行等待立即返回

release()用于线程访问资源结束后释放一个许可以使其他等待许可的线程可以选择资源返回

3.1.4 ReadWriteLock 读写锁

ReadWriteLock是JDK5提供的读写分离锁读写分离锁可以有效的帮助减少锁竞争以提升系统开销

如果使用重入锁或者内部锁所有的读读与读写和写写之间都是要串行操作由于读操作不会对数据完整性造成破坏这种等待显然是不合理的所以读写锁就有了发挥功能的余地

下表是对写锁的访问约束

| \ | 读 | 写|

|:— | :—-: |—:|

|读 | 非阻塞 | 阻塞|

| 写 | 阻塞 | 阻塞|

读 -读不互斥读读之间不阻塞
读-写互斥:读阻塞写，写也会阻塞读
写-写互斥：写写阻塞

3.1.5 倒计时器：CountDownLatch

这个工具通常用来控制线程等待它可以让某一个线程等到直到倒计时结束再开始执行

CountDownLatch的构造函数接受一个整数作为参数即当前这个计数器的计数个数

1	public CountDownLatch(int count)

3.1.6 循环栅栏 :CyclicBarrier

CyclicBarrier是另外一种多线程并发控制实用工具和CountDownLatch非常类似它也可以实现线程间的计数等待但它的功能比CountDownLatch更加复杂且强大

CyclicBarrier可以理解为循环栅栏栅栏是一种障碍物前面的Cyclic意为循环也就是说这个计数器可以反复使用比如假设我们将计数器设置为10 那么凑齐第一批10个线程后计数器将归零然后继续接着凑齐下一批的10个线程这就是循环栅栏内在的含义

比CountDownLatch略微强大一些 CyclicBarrier可以接受一个参数作为barrierAction 所谓barrierAction就是当计数器一次计数完成后系统会执行的动作

1	public CyclicBarrier(int parties,Runnable barrierAction)

3.1.7 线程阻塞工具类:LockSupport

LockSupport是一个非常方便实用的线程阻塞工具，它可以在线程内任意位置上线程让出线程阻塞，和Thread.suspend()相比它弥补了由于resume()在前发生导致线程无法继续执行的情况和Object.wait()相比它不需要先伙食某发对象的锁也不会抛出InterruptedException异常

用LockSupport重写第二章提到的suspend()永久卡死线程的例子

3.2 线程复用：线程池

多线程的软件设计方法确实可以最大限度的发挥现代多核处理器的计算能力提高生产系统的吞吐量和性能但是若不加控制和管理的随意使用线程对系统的性能反而会产生不利影响

首先虽然与进程相比，线程是一种轻量级的工具。但其创建和关闭依然需要花费时间如果每一个小的任务都创建一个线程，很有可能出现创建和销毁线程所占用的时间大于该线程真实工作使所消耗时间的情况反而会得不偿失

其次线程本身也是要占用内存空间大量的线程会强占宝贵的内存资源如果处理不当可能会导致Out of Memory异常即便没有大量的线程回收也给GC代理很大的压力延长GC的停顿时间

因此对线程的使用必须掌握一个度在有限的范围内增加线程的数量可以明显提高系统的吞吐量但一旦超出了这个范围大量的线程只会拖垮应用系统因此在生成环境中使用线程必须对其加以控制和管理

3.2.1 什么是线程池

想仔细了解的查百科吧

对创建的线程进行复用

3.2.2 不要重复发明轮子：JDK对线程池的支持

为了更好的控制多线程 JDK提供了一套Executor框架帮助开发人员有效地进行线程控制其本质就是一个多线程

以上成员均在java.util.concurrent包中是JDK并发包的核心类其中ThreadPoolExecutor类表示一个线程池 Executors类则扮演着线程池工厂的角色通过Executors可以取得一个拥有特定功能的线程池从UML图中可知 ThreadPoolExecutor类实现了Executor接口因此通过这个接口任何Runnable的对象都可以被ThreadPoolExecutor线程池调度

Executor 执行器接口，该接口定义执行Runnable任务的方式。
ExecutorService 该接口定义提供对Executor的服务。
ScheduledExecutorService 定时调度接口。
AbstractExecutorService 执行框架抽象类。
ThreadPoolExecutor JDK中线程池的具体实现。
Executors 线程池工厂类

Executor框架提供了各种类型的线程池主要有以下工厂方法:

public static ExecutorService newFixedThreadPool(int nThreads)

public static ExecutorService newSingleThreadExecutor()

public static ExecutorService newCachedThreadPool()

public static ScheduledExecutorService newSingleThreadScheduleExecutor()

public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize)

以上工厂方法分别返回具有不同工作特性的线程池

newFixedThreadPool()方法该方法返回一个固定线程数量的线程池该线程池中的线程数量始终不变有新任务若有空线程就用没有空线程这个新任务就放到一个任务队列等有线程空闲去处理任务队列的任务
newSingleThreadExecutor()方法：该方法返回一个只有一个线程的线程池若多就放任务队列一个个按顺序来
newCacheThreadPool()方法：该方法返回一个可根据实际情况调整线程数量的线程池线程池的线程数量不确定但若有空闲线程可以复用则会优先使用可复用的线程若所有线程均在工作又有新的任务提交则会创建新的线程处理任务所有线程在当前任务执行完毕后将返回线程池进行复用
newSingleThreadScheduledExecutor()方法：该方法返回一个ScheduledExecutorService对象线程池大小为1 ScheduledExecutorService接口在ExecutorService接口之上扩展了在给定时间执行某任务的功能
newScheduledThreadPool()方法：该方法也返回一个ScheduledExecutorService对象但该线程池也可以指定线程数量

固定大小的线程池

3.2.3 刨根究底：核心线程池的内部实现

这个太麻烦就不写多了就写一些我认为关键的地方

无论是newFixedThreadPool()方法 newSingleThreadExecutor()方法还是newCachedThreadPool()方法虽然看起来创建的线程有着完全不同的功能特点但其内部实现均使用了ThreadPoolExecutor实现

public ThreadPoolExecutor(int corePoolSize,

                             int maximumPoolSize,

                             long keepAliveTime,

                             TimeUnit unit,

                             BlockingQueue<Runnable> workQueue,

                             ThreadFactory threadFactory,

                             RejectedExecutionHandler handler)

函数的参数含义如下

corePoolSize：指定了线程池中的线程数量
maximumPoolSize：指定了线程池中的最大线程数量
keepAliveTime：当线程池数量超过corePoolSize时多余的空闲线程的存活时间即超过corePoolSize的空闲线程在多长时间内会被销毁
unit：keepAliveTime的单位
workQueue:任务队列，被条件但尚未被执行的任务
threadFactory：线程工厂用于创建线程一般使用默认的即可
handler：拒绝策略当任务太多来不及处理如何拒绝服务

上述参数中只有workQueue和handler需要进行详细说明

参数workQueue是指提交单未执行的任务队列它是一个BlockingQueue接口的对象仅用于存放Runnable对象根据功能介绍在ThreadPoolExecutor的构造函数中可使用以下几种BlockingQueue

直接提交的队列:SynchronousQueue
有界的任务队列：ArrayBlockingQueue
无界的任务队列：LinkedBlockingQueue
优先任务队列：PriorityBlockingQueue

3.2.4 超负载了怎么办：拒绝策略

AbortPolicy策略：该策略会直接抛出异常阻止系统正常工作
CallerRunsPolicy策略：只要线程池未关闭，该策略直接在调用者线程中，运行当前被丢弃的任务。显然这样做不会真的丢弃任务，但是，任务提交线程的性能极有可能会急剧下降
DiscardOledestPolicy策略：该策略将丢弃最老的一个请求，也就是即将被执行了的一个任务并尝试再次提交当前任务
DiscardPolicy策略：该策略默默地丢弃无法处理的任务，不予任何处理如果允许任务丢失我觉得这可能是最好的一种方案了吧

以上内置的策略均实现了RejectedExecutionHandler接口若以上策略仍无法满足实际应用需要，完全可以自己扩展RejectedExecutionHandler接口，RejectedExecutionHandler的定义如下

1	void rejectedExecution(Runnable r, ThreadPoolExecutor executor);

下面的代码简单的演示了自定义线程池和拒绝策略的使用

3.2.5 自定义线程创建：ThreadFactory

ThreadFactory是一个借口它只有一个方法，用来创建线程

1	Thread newThread(Runnable r)

当线程池需要新建线程时就会调用这个方法

自定义线程池可以帮助我们做不少事，比如等我们可以追踪线程池究竟在何时创建了多少线程，也可以自定义线程的名称，组以及优先级等信息，设置可以任性地将所有线程设置为守护线程。总之，使用自定义线程池可以让我们更加自由地设置池中所有线程的状态

3.2.6 我的应用我做主：扩展线程池

虽然JDK已经帮我们实现了这个稳定的高性能线程池但如果我们需要对这个线程池做一些扩展比如我们想监控每个任务的开始和结束时间或者其他一些自定义的增强功能这个就可以通过ThreadPoolExecutor扩展的功能来实现它提供了beforeExecutor(),afterExecute()和terminated()三个接口对线程池进行控制

在默认的ThreadPoolExecutor实现中，提供了空的beforeExecute()和afterExecute()实现，在实际应用中。可以对其扩展来实现对线程池运行状态的跟踪输出一些有用的调试信息，以帮助系统故障诊断，这对多线程程序输出错误排查是很有帮助的

下面有个例子

3.2.7 合理的选择：优化线程池线程数量

线程池的大小对系统的性能有一定影响过大或者过小的线程数量都无法发挥最优的性能但是线程池大小的确定也不需要做的非常精准因为只要避免极大和极小俩种情况线程池的带下对系统的性能并不会影响太大，一般来说确定线程池的大小需要考虑CPU数量内存大小等因素在《Java Concurrency in Practice》一书中给出了一个估算线程池大小的经验公式

$$Ncpu=Cpu的数量$$

$$Ucpu=目标CPU的使用率,0<=Ucpu<=1$$

$$W/C=等待时间与计算时间的比率$$

在Java中可以通过

1	Runtime.getRuntime().availableProcessors()

取得可用的CPU数量

3.2.8 堆栈去哪里了：在线程池中寻找堆栈

先看一个简单的错误案例

3.2.9 分而治之：Fork/Join框架

“分而治之”这是一个非常有效的处理大量的数据的方法也是一个归并排序的实现思想注明的MapReduce也是采取了分而治之的思想

Fork一词原始含义是吃饭用的叉子，也有分叉的意思。在Linux平台中 fork()函数用来创建子进程

使得系统进程可以多一个执行分支。在Java中也沿用了类似的命名方式

而Join()的含义在之前的章节已经介绍这里也是相同的意思表示等待也就是使用fork()后系统多了一个执行分支（线程）,所以需要等待这个执行分支执行完毕才有可能得到最终的结果因此join()就表示等待

在实际使用中如果毫无顾忌使用fork()开启线程进行处理那么很有可能导致系统开启过多的线程而严重影响性能所以 JDK中给出一个ForkJoinPool线程池对于fork()方法并不急着开启线程而是提交给ForkJoinPool线程池进行处理以节省系统资源

由于线程池的优化，提交的任务和线程数量并不是一对一的关系。在绝大多数情况下，一个物理线程时间上是需要出来多个逻辑任务的因此每个线程必然需要拥有一个任务队列。因此在实际过程中会遇到一种情况线程A已经处理完自己的任务了但是线程B还有一堆没有处理于是A就可以去帮助B 从线程B的任务队列拿出一个任务过了处理尽可能达到平衡

一个值得的地方是当线程试图帮助别人时总是从任务队列的底部开始拿数据，而线程视图执行自己的任务时，则是从相反的顶部开始拿因此这种行为也十分有利于避免数据竞争

ForkJoinPool的一个重要接口

1	public <T> Future<T> submit(Callable<T> task);

你可以向ForkJoinPool线程池提交一个ForkJoinTask任务所谓ForkJoinTask任务就是支持fork()分析以及join()等待的任务 ForkJoinTask有俩个重要的子类，RecursiveAction和RecursiveTask。它们分别表示没有返回值的任务和可以携带返回值的任务

3.3 不要重复的发明轮子：JDK的并发容器

3.3.1 超好用的工具类：并发集合简介

JDK提供的这些容器大部分在java.util.concurrent包中

ConcurrentHashMap:这是一个高效的并发HashMap 可以理解为一个线程安全的HashMap
CopyOnWriteArrayList：这是一个List 从名字看是ArrayList一族的在读多邪少的场合这个List性能非常好远远好于Vector
ConcurrentLinkedQueue：高效的并发队列，使用链表实现可以看做一个线程安全的LinkedList
BlockingQueue ：这是一个借口 JDK内部通过链表数组等方式实现了这个接口表示阻塞队列非常适合用于作为数据共享的通道
ConcurrentSkipListMap:跳表的实现这是一个Map 使用跳表的数据结构进行快速查找

3.3.2 线程安全的HashMap

让一个线程不安全的HashMap如何变成线程安全的HashMap 一种可行方案就是使用Collections.synchronizedMap()方法包装我们的HashMap

1	public Map map = Collections.synchronizedMap(new HashMap<>());

这个内部实现的方法就是实现一个

public V get(Object key) {

          synchronized (mutex) {return m.get(key);}

      }

很明显通过一个mutex作为监听对象的来进行锁从而实现线程安全

如果并发级别不高一般也够用但是在高并发的环境中我们也有必要寻求新的解决方案

一个更加专业的并发HashMap是ConcurrentMap 它位于java.util.concurrent包内它专门为并发进行性能优化因此更加适合多线程的场合

3.3.3 有关List的线程安全

队列链表也是极其常用几乎所有的应用程序都会与之相关在Java中 ArrayList与Vector都是使用数组作为其内部实现俩者最大的不同在于Vector是线程安全的而ArrayList不是

3.3.4 高效读写的队列：深度剖析ConcurrentLinkedQueue

队列Queue也是常用的数据结构之一在JDK中提供了一个ConcurrentLinkedQueue类用来实现高并发的队列

ConcurrentLinkedQueue应该算是高并发环境中性能最好的队列就可以了它之所以有很好的性能是因为内部复杂的实现

这里需要无锁操作的一些知识

ConcurrentLinkedQueue内部定义结点Node

private static class Node<E> {

    volatile E item;

    volatile Node<E> next;

item用来表示目标元素 next字段表示当前Node的下一个元素这属于数据结构的基础了

对Node进行操作时使用了CAS操作(CAS是无锁操作相关的知识)

boolean casItem(E cmp, E val) {

        return UNSAFE.compareAndSwapObject(this, itemOffset, cmp, val);

    }

    

    void lazySetNext(Node<E> val) {

        UNSAFE.putOrderedObject(this, nextOffset, val);

    }

    

    boolean casNext(Node<E> cmp, Node<E> val) {

        return UNSAFE.compareAndSwapObject(this, nextOffset, cmp, val);

    }

ConcurrentLinkedQueue有俩个重要的字段 head和tail 分别表示链表的头部和尾部它们都是Node类型对于head来说它永远不会为null 并且通过head以及succ()后继方法一定能完整地遍历整个链表对于tail来说它自然应该表示队列的末尾

但ConcurrentLinkedQueue的内部实现非常的复杂它允许在运行多个不同的状态以tail为例一般来说我们期望tail总是为链表的末尾但实际上 tail的更新并不是及时的而是可能会产生拖延现象每次更新会跳跃俩个元素

public boolean offer(E e) {

       checkNotNull(e);

       //创建入队节点

       final Node<E> newNode = new Node<E>(e);

      //t为tail节点，p为尾节点，默认相等，采用失败即重试的方式，直到入队成功

       for (Node<E> t = tail, p = t;;) {

           //获得p的下一个节点

           Node<E> q = p.next;

            // 如果下一个节点是null,也就是p节点就是尾节点

           if (q == null) {

               // p是最后一个结点

               if (p.casNext(null, newNode)) {

                    //每俩次更新一下tail

                   if (p != t)  

                       casTail(t, newNode);   

                   return true;

               }

               // CAS竞争失败 再尝试

           }

              //遇到哨兵结点 从head开始遍历 也可能是刚初始化

              //但如果tail被修改 则使用tail(因为tail可能被修改对了)

           else if (p == q)

               p = (t != (t = tail)) ? t : head;

           else

               // 取下一个结点 或者最后一个结点

               p = (p != t && t != (t = tail)) ? t : q;

       }

   }

能看懂就看懂吧不懂的话看原书就好这里写起来字太多就说些关键的

第二个判断p==q的情况这种情况是遇到了哨兵结点导致的所谓哨兵结点就是next指向自己的结点这种结点没什么价值主要表示要删除的结点或者空结点当遇到哨兵结点时无法通过next获得后继元素就直接返回head 从链表头部开始遍历但一旦发生在执行过程中 tail被其他线程修改的情况则进行一次“打赌” 使用新的tail作为链表末尾（这样就避免了重新查找tail的开销)

那么有的人就会对这个语句会不明白了

1	p = (t != (t = tail)) ? t : head;

这句代码虽然只有一行首先！=不是原子操作它是可以被中断的也就是说在执行‘！=’时程序会先拿t的值再执行t=tail,并取得新的t的值然后比较这俩个值是否相等在单线程中 t!=t这种语句显然不会成立但是在并发环境中有可能在获得左边t值后，右边的t值就被其他线程修改这样t!=t就成立这里就是这种情况如果在比较过程中 tail被其他线程修改当它被再次赋值给t时就会导致等式左边的t和右边的t不同如果俩个t不同表示tail在中断被其他线程篡改这时我们就可以用新的tail作为链表末尾这就是这里等式右边的t 但如果tail没有被修改则返回head 要求从头部开始重新查找尾部

下边来看哨兵结点如何产生的

public E poll() {

    restartFromHead:

    for (;;) {

        for (Node<E> h = head, p = h, q;;) {

            E item = p.item;




            if (item != null && p.casItem(item, null)) {

                // Successful CAS is the linearization point

                // for item to be removed from this queue.

                if (p != h) // hop two nodes at a time

                    updateHead(h, ((q = p.next) != null) ? q : p);

                return item;

            }

            else if ((q = p.next) == null) {

                updateHead(h, p);

                return null;

            }

            else if (p == q)

                continue restartFromHead;

            else

                p = q;

        }

    }

}

这里写起来又得很麻烦推荐还是看原书吧写一些点这个代码如果看懂之前的offer看这个应该是比较容易了

首先假设加了一个元素在链表中当前的head的item是null的使用直接跳到最后p=q 注意在第二个判断中q=p.next 所以这时候p就是p.next了那么第二次循环item显然不是null的那么才会去执行p.casItem(item.null)这条语句成功了就往下走 p当然不等于链表的head了所以就更新头而原有的head就被设置为哨兵了

这其实也能感觉到CAS操作设计非常复杂好处是性能提升但是难度也是一大跨度

3.3.5 高效读取：不变模式下的CopyOnWriteArrayList

很多应用场景下读远远大于写这也是之前的读写锁说的话

为了将读取的性能发挥到极致 JDK中提供了CopyOnWriteArrayList类对它来说读取完全不用加锁并且更好的消息是写入也不会阻塞读操作只有写入与写入之间需要同步等待

其实就是在写入操作时进入一次自我复制换句话说当这个List需要修改时我不修改原有的内容而是对原有的数据进行一次复制将修改的内容写入副本中写完之后再将修改完的副本替换原来的数据这样就可以保证写不影响读了

public E get(int index) {

     return get(getArray(), index);

 }

final Object[] getArray() {

      return array;

 }   

public E get(int index) {

       return get(getArray(), index);

}

读取代码没有然后同步控制和所操作理由就是内部数据array不会发生修改只会被另外一个array替换因此可以保证数据安全

写入就麻烦了

public boolean add(E e) {

       final ReentrantLock lock = this.lock;

       lock.lock();

       try {

           Object[] elements = getArray();

           int len = elements.length;

           Object[] newElements = Arrays.copyOf(elements, len + 1);

           newElements[len] = e;

           setArray(newElements);

           return true;

       } finally {

           lock.unlock();

       }

   }

写入操作用锁当然这个锁仅限于控制写-写的情况其重点在于进行了内部元素的玩转复制因此会生成一个新的数组newElements 然后天魂而且array是volatile变量会立即发现

3.3.6 数据共享通道：BlockingQueue

前面提到是用ConcurrentQueue作为高性能的队列的

并发是追求高性能的但是多线程的开发模式还会引入一个问题如何进行多个线程间的数据共享呢

一般来说我们希望整个系统是松散耦合的

把这个BlockingQueue当做一个‘意见箱’ 双方都放东西但是双方解耦保证系统平滑过渡

BlockingQueue是一个接口主要还是在Blocking上这个意思就是阻塞

BlockingQueue会让服务线程在队列为空时进行等待当有新的消息进入队列后自动将线程唤醒

我们主要还是用ArrayBlockingQueue这个实现类来说明

向队列中压入元素可以使用offer()和put()方法对于offer方法如果当期队列已经满了它就会返回false 如果没有满则执行正常的入队操作所以我们不讨论这个方案关注put方法 put方法也是将元素压入队列末尾但如果队列满了它会一直等待直到队列中有空闲的位置

从队列中弹出元素可以用poll()方法和take()方法它们都从队列的头部获得一个元素不同之处在于如果队列为空 poll()方法之间返回null,而take()方法会等待直到队列内有可用元素

因此put方法和take方法才是提醒Blocking的关键为了做好等待和通知俩件事在ArrayBlockingQueue定义了如下字段

final ReentrantLock lock;



 private final Condition notEmpty;



 private final Condition notFull;

当执行take()操作时如果队列为空则让当前线程等待在notEmpty上新元素入队时则执行一次notEmpty上的通知

public E take() throws InterruptedException {

    final ReentrantLock lock = this.lock;

    lock.lockInterruptibly();

    try {

        while (count == 0)

            notEmpty.await();

        return dequeue();

    } finally {

        lock.unlock();

    }

}

这里如果为空就等待等待新元素的插入唤醒notEmpty

private void enqueue(E x) {

     // assert lock.getHoldCount() == 1;

     // assert items[putIndex] == null;

     final Object[] items = this.items;

     items[putIndex] = x;

     if (++putIndex == items.length)

         putIndex = 0;

     count++;

     notEmpty.signal();

 }

同理对Put()操作也一样当队列满是需要让压入线程等待

public void put(E e) throws InterruptedException {

       checkNotNull(e);

       final ReentrantLock lock = this.lock;

       lock.lockInterruptibly();

       try {

           while (count == items.length)

               notFull.await();

           enqueue(e);

       } finally {

           lock.unlock();

       }

   }

这里如果为空就等待等待元素的删除唤醒notFull

private E dequeue() {

    // assert lock.getHoldCount() == 1;

    // assert items[takeIndex] != null;

    final Object[] items = this.items;

    @SuppressWarnings("unchecked")

    E x = (E) items[takeIndex];

    items[takeIndex] = null;

    if (++takeIndex == items.length)

        takeIndex = 0;

    count--;

    if (itrs != null)

        itrs.elementDequeued();

    notFull.signal();

    return x;

}

3.3.7 跳表（SkipList）

跳表是一种可以用来快速查找的数据结构有点类似于平衡树它们都可以对元素进行快速的查找但一个重要的区别是：对平衡树的插入和删除往往很可能导致平衡树进行一次全局的调整对跳表的插入和删除只需要对整个数据结构的局部进行操作即可这样带来的好处是：在高并发的情况下你会需要一个全局锁来保证整个平衡树的线程安全而对于跳表你只需要部分锁即可这样在高并发的环境下你就可以拥有更好的性能而就查询的性能而言跳表的时间复杂度也是O(log n) 所以在并发数据结构中 JDK使用跳表来实现一个Map

跳表的另外一个特点是随机算法跳表的本质是同时维护了多个链表并且链表是分层的如下图所示

跳表所有的元素都是排序的查找时也是如图所示从顶级链表开始找一旦发现被查找的元素大于当前链表中的取值就会转入下一层链表继续找这也就是说查找的过程是跳跃式的

因此很显然跳表是一种使用空间换时间的算法

使用链表实现Map和使用哈希算法实现Map的另外一个不同之处是：哈希并不会保存元素的顺序而跳表所有的元素都排序的因此在对跳表进行遍历时你会得到一个有序的结果所以如果你的应用需要有序性那么跳表就是你不二的选择

跳表的内部结构有几个关键数据结构组成一个是Node 一个是Index

Node则就是key value 还有一个next指向下一个Node Index就是索引内部包装了Node 同时增加了向下引用与向上应用此外对于每一层的表头

还需要记录当前处于哪一层为此还需要一个称为HeadIndex的数据结构表示链表头部的第一个Index 它继承于Inndex

第四章锁的优化及注意事项

4.1 有助于提高“锁”性能的几点建议

4.1.1 减少锁持有时间

程序开发应尽可能的减少对某个锁的占用时间以减少程序互斥的可能

public  synchronized void syncMethod(){
  othercode1();
  mutextMethod();
  othercode2();
}

这里假设只有mutextMethod方法是有同步需要的而othercode1()和othercode2()并不需要同步控制如果othercode1和othercode2是重量级的方法的话使用整个个方法做同步会导致等待线程大量增加因为一个线程在进入该方法时获得内部锁只有在所有任务都执行完后才会释放锁

一个较为优化的解决方案是只在必要时进行同步这样就能明显减少线程持有锁的时间提高系统的吞吐量

public void syncMethod2(){
    othercode1();
    synchronized(this){
        mutextMethod();
    }
}

在改进的代码中只针对mutextMethod()方法做了同步锁占用的时间相对较短因此能有更改的并行度这种技术手段在JDK的源码包中也可以很容易地找到比如处理正则表达式的Pattern类

减小锁的持有时间有助于减低锁冲突的可能性进而提高系统的并发能力

4.1.2 减小锁粒度

减小锁粒度也是削弱多线程锁竞争的有效手段这种技术典型的使用场景就是ConcurrentHashMap类的实现在3.3节中介绍了这个类但是没有仔细的介绍这节仔细的介绍一下

对于HashMap来说最重要的俩个方法就是get()和put()。一种最自然的方法就是对HashMap加锁必然可以得到一个线程安全的对象但是这样做我们就认为加锁粒度太大了对于ConcurrentHashMap 它内部进一步细分为若干个小的HashMap 称之为段(SEGMENT) 默认情况下一个ConcurrentHashMap被进一步细分为16个段

如果需要在ConcurrentHashMap中增加一个新的表项并不是将整个HashMap加锁而是首先根据hashcode得到该表现应该存放到哪个段中然后对该段加锁并完成put()操作只要被加入的表项不存放在同一个段中则线程间便可以做到真正的并行

但是减小锁粒度会引入一个新的问题即：当系统需要取得全局锁时其消耗的资源会比较多仍然以ConcurrentHashMap类为例虽然其put()方法很好地分离了锁但是当试图访问ConcurrentHashMap全局信息时就会需要同时取得所有段的锁方能顺利实施比如ConcurrentHashMap的size()方法它将返回ConcurrentHashMap的有效表项的数量即ConcurrentHashMap的全部有效表项之和要获取这个信息需要取得所有子段的锁

事实上 size()方法会先使用无锁的方式求和如果失败才会尝试加锁的方法但不管怎么说在高并发场合ConcurrentHashMap的size()的性能依然要差于同步的HashMap

因此只有在类似size()获取全局信息的方法调用并不频繁时这种减小锁粒度的方法才能真正意义上提高系统吞吐量

ConcurrentHashMap在JDK1.8版本中大规模的重构了这里的笔记只适用于JDK1.7版本

所谓减少锁粒度就是指减少锁定对象的访问从而减少锁冲突的可能性进而提高系统的并发能力

4.1.3 读写分离锁来替换独占锁

使用ReadWriteLock可以提高系统的性能使用读写分离锁来替代独占锁是减小锁粒度的一种特殊情况那么读写锁则是对系统功能点的分割

在读多写少的场合读写锁对系统性能还是很有好处的因为如果系统在读写数据时均只使用独占锁那么读操作和写操作间写操作和写操作间均不能做到真正的并发并且需要互相等待而读操作本身不会影响数据的完整性和一致性因此理论上讲在大部分情况下应该可以运行多线程同时读，读写锁正是实现了这种功能

在读多写少的场合使用读写锁可以有效提示系统的并发能力

4.1.4 锁分离

如果将读写锁的思想做进一步的延伸就是锁分离读写锁根据读写操作功能的不同进行了有效的锁分离依据应用程序的功能特点使用类似的分离思想也可以对独占锁进行分离一个典型的案例就是java.util.LinkedBlockingQueue的实现

在LinkedBlockingQueue的实现中 take()函数和put()函数分别实现了从队列中取得数据和往队列中增加数据的功能虽然俩个函数都对当前队列进行了修改操作但由于LinkedBlockingQueue是基于链表的因此俩个操作分别作用域队列的前端和尾端从理论上说俩者并不冲突

如果使用独占锁则要求俩个操作进行时获取当前队列的独占锁那么take()和put()操作就不可能真正的并发在运行时它们会彼此等待对方释放锁资源在这种情况下锁竞争会相对比较激烈从而影响程序在高并发时的性能
因此在JDK的实现中并没有采用这样的方式取而代之的是俩把不同的锁分离了take()和put()操作

/** Lock held by take, poll, etc */
    private final ReentrantLock takeLock = new ReentrantLock();

    /** Wait queue for waiting takes */
    private final Condition notEmpty = takeLock.newCondition();

    /** Lock held by put, offer, etc */
    private final ReentrantLock putLock = new ReentrantLock();

    /** Wait queue for waiting puts */
    private final Condition notFull = putLock.newCondition();

以上代码片段定义了takeLock和putLock 它们分别在take()操作和put()操作中使用因此 take()函数和put()函数就此相互独立它们之间不存在锁竞争关系只需要在take()和take()间,put()和put()间分别对takeLock和putLock进行竞争从而削弱了锁竞争的可能性

public E take() throws InterruptedException {
       E x;
       int c = -1;
       final AtomicInteger count = this.count;
       final ReentrantLock takeLock = this.takeLock;
       takeLock.lockInterruptibly(); //不能有俩个线程同时取数据
       try {
           while (count.get() == 0) {//如果当前没有可用数据 一直等待
               notEmpty.await(); //等待 put()操作的通知
           }
           x = dequeue();//取得第一个数据
           c = count.getAndDecrement(); //数量减一 原子操作 因为会和put()函数同时访问count 注意：变量c是count减一前的值 
           if (c > 1)
               notEmpty.signal();//通知其他take()操作
       } finally {
           takeLock.unlock();//释放锁
       }
       if (c == capacity)
           signalNotFull();//通知put()操作 已有空余空间
       return x;
   }

函数put()的实现如下

public void put(E e) throws InterruptedException {
      if (e == null) throw new NullPointerException();
      int c = -1;
      Node<E> node = new Node<E>(e);
      final ReentrantLock putLock = this.putLock;
      final AtomicInteger count = this.count;
      putLock.lockInterruptibly(); //不能有俩个线程同时进行put()
      try {
          while (count.get() == capacity) {//如果队列满了
              notFull.await();//等待
          }
          enqueue(node);//插入数据
          c = count.getAndIncrement();//更新总数 变量c是count加1前的值
          if (c + 1 < capacity)
              notFull.signal();//有足够的空间 通知其他线程
      } finally {
          putLock.unlock();//释放锁
      }
      if (c == 0)
          signalNotEmpty();//插入成功后 通知take()操作取数据
  }

通过takeLock和putLock俩把锁 LinkedBlockingQueue实现了取数据和写数据的分离使俩者在真正意义上成为可并发的操作

4.1.5 锁粗化

通常情况下为了保证多线程间的有效并发会要求每个线程持有锁的时间尽量短即在使用完公共资源后应该立即释放锁只有这样等待在这个锁上的其他线程才能尽早的获得资源执行任务但是如果对同一个锁不停的进行请求，同步和释放其本身也会消耗系统宝贵的资源反而不利于性能的优化

为此虚拟机在遇到一连串连续对同一锁不断进行请求和释放的操作时，便会把所有的锁操作整合成对锁的一次请求从而减少对锁的请求同步次数这个操作叫锁的粗化

public void demoMethod(){
    synchronized(){
    // do sth
}

//做其他不需要的同步的工作 但能很快执行完毕
synchronized(lock){
    //do sth
}
}

会被整合为如下形式

public void demoMethod(){
   //整合成一次锁请求
   synchronized(lock){
       //do sth
       //做其他不需要的同步的工作 但能很快执行完毕
   }
}

在开发过程中大家也应该有意识地在合理的场合进行锁的粗化尤其当在循环内请求锁时以下是一个循环内请求锁的例子在这种情况下意味着每次循环都有申请锁和释放锁的操作但在这种情况下显然是没有必要的

for(int i =0;i<CIRCLE;i++){
    synchronized(lock){
        
    }
}

所以一种更合理的做法应该是在外层只请求一次锁

synchronized(lock){
for(int i=0;i<CIRCLE;i++){
    
}
}

注意性能优化是根据运行时的真是情况对各个资源点进行权衡折中的过程锁粗化的思想和减少锁持有时间是相反的但在不同的场合它们的效果并不相同所以大家需要根据实际情况进行权衡

4.2 Java虚拟机对锁优化所做的努力

4.2.1 锁偏向

锁偏向是一种针对加锁操作的优化手段它的核心思想是：如果一个线程获得了锁那么锁就进入了偏向模式当这个线程再次请求锁时无须再做任何同步操作这样就节省了大量相关锁申请的操作从而提高了程序性能因此对于几乎没有锁竞争的场合偏向锁有比较好的优化效果因为连续多次极有可能是同一个线程请求相同的锁而对于锁竞争比较激烈的场合其效果不佳因为在竞争激烈的场合最有可能的情况是每次都是不同的线程来请求相同的锁这样偏向模式会失效因此还不如不启用偏向锁使用Java虚拟机参数-XX:+UseBiasedLocking可以开启偏向锁

4.2.2 轻量级锁

如果偏向锁失败虚拟机并不会立即挂起线程它还会使用一种称之为轻量级锁的优化手段,轻量级锁的操作也很轻便它只是简单的将对象头部作为指针指向持有锁的线程堆栈的内部来判断一个线程是否持有对象锁如果线程获得轻量级锁成功则可以顺利进入临界区如果轻量级锁加锁失败则表示其他线程抢先争夺到了锁那么当前线程的锁请求就会膨胀为重量级锁

偏向锁与轻量锁的讲解

4.2.3 自旋锁

锁膨胀后，虚拟机为了避免线程真实地在操作系统层面挂起虚拟机还会在做最后的努力
—自旋锁由于当前线程暂时无法获得锁但是什么时候可以获得锁是一个未知数
也许在几个CPU时钟周期后就可以得到锁如果这样简单粗暴地挂起线程可能是一种得不偿失的操作因此系统会进行一次赌注：它会加上在不久的将来线程可以得到这把锁因此虚拟机会让当前线程做几个空循环（这也是自旋的含义）在经过若干次循环后如果可以得到锁那么就顺利进入临界区如果还不能获得锁才会真实地将线程在操作系统层面挂起

4.2.4 锁消除

锁消除是一种更彻底的锁优化 Java虚拟机在JIT编译时通过对运行上下文的扫描去除不可能存在共享资源竞争的锁通过锁消除可以节省毫无意义的请求锁时间

如果不可能存在竞争为什么程序还要加上锁呢这是因为在Java软件开发的过程中我们必然会使用一些JDK的内置API，比如StringBuffer，Vector等你在使用这些类的时候也许根本不会考虑这些对象到底内部是如何实现的比如你很有可能在一个不可能存在并发竞争的场合使用Vector 而众所周知 Vector内部使用了synchronized请求锁

public String[] createStrings(){
 Vector<String> v =new Vecotr<String>();
 for(int i=0;i<100;i++){
  v.add(Integer.toString(i);
 }
 return v.toArray(new String[]{});
}

比如在这种情况下 Vector的实例对象v只是一个局部变量局部变量是在栈上的属于线程私有的数据因此不可能被其他线程访问所以在这种情况下 Vector内部所有加锁同步都是没有必要的如果虚拟机检测到这种情况就会将这些无用的操作去除

锁消除涉及的一项关键技术为逃逸分析所谓逃逸分析就是观察某一个变量是否会逃出某一个作用域
在本例中变量v显然没有逃出createStrings()函数之外以此为基础虚拟机才可以大胆地将v内部的加锁操作去除如果createStrings()返回的不是String数组而是v本身那么就认为变量v逃逸出了当前函数也就是说v有可能被其他线程访问如果是这样虚拟机就不能消除v中的锁操作

逃逸分析必须要在-server模型下进行可以使用-XX:DoEscapeAnalysis参数打开逃逸分析使用-XX:+EliminateLocks参数可以打开锁消除

4.3 人手一只笔：ThreadLocal

除了控制资源的访问外我们还可以通过增加资源来保证所有对象的线程安全

4.3.1 ThreadLocal的简单实用

从ThreadLocal的名字上可以看到这是一个线程的局部变量也就是说只有当前线程可以访问既然是只有当前线程可以访问的数据自然是线程安全的

下面看一个简单的示例
相关代码请见 ThreadLocalDemo

从这里也可以看到为每一个线程人手分配一个对象的工作并不是由ThreadLocal来完成的而是需要在应用层面保证的如果在应用上为每一个线程分配了相同的对象实例那么ThreadLocal也不能保证线程安全这点也需要大家注意

注意：为每一个线程分配不同的对象需要在应用层面保证 ThreadLocal只是起到了简单的容器作用

4.3.2 ThreadLocal的实现原理

我们需要关注的自然是ThreadLocal的set()方法和get()方法从set()方法说起

public void set(T value) {
      Thread t = Thread.currentThread();
      ThreadLocalMap map = getMap(t);
      if (map != null)
          map.set(this, value);
      else
          createMap(t, value);
  }

可以看到这个方法set时先获得当前线程对象然后通过getMap()拿到线程的ThreadLocalMap，并将值设入ThreadLocalMap 而ThreadLocalMap就理解为一个Map就好但是它是定义在Thread内部的成员

1	ThreadLocal.ThreadlocalMap threadLocals =null;

而设置到ThreadLocal中的数据也正是写入了threadLocals这个Map 其中 key为ThreadLocal当前对象 value就是我们需要的值而threadLocals本身就保存了当前所在线程的所有“局部变量”，也就是一个ThreadLocal变量的集合

在进行get()操作时自然就是将这个Map中的数据拿出来

     public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }
```   
 
首先 get()方法也是先取得当前线程的ThreadLocalMap对象 然后 通过将自己做为key取得内部的实际数据
在了解ThreadLocal的内部实现后 我们自然会引出一个问题 那就是这些变量是维护在Thread类内部的（ThreadLocalMap定义所在类)，这也意味着只有线程不退出 对象的引用将一直存在
当线程退出时 Thread类会进行一些清理工作 其中就包括清理ThreadLocalMap 


```java
    /**在线程退出前 由系统回调 进行资源清理
    /
     private void exit() {
            if (group != null) {
                group.threadTerminated(this);
                group = null;
            }
            target = null;
            //加速资源清理
            threadLocals = null;
            inheritableThreadLocals = null;
            inheritedAccessControlContext = null;
            blocker = null;
            uncaughtExceptionHandler = null;
        }

因此如果我们使用线程池那就意味着当前线程未必会退出（比如固定大小的线程池，线程总是存在）如果这样将一些大大的对象设置到ThreadLocal中(它实际保存在线程持有的ThreadLocal Map内) 可能会使系统出现内存泄露的可能(这里的意思是：你设置对象到ThreadLocal中但是不清理它在你使用几次后这个对象也不再有用了但是它却无法被回收)
此时如果你希望及时回收对象最好使用ThreadLocal.remove()方法将这个变量移出就像我们有时候为了加速垃圾回收会特意写出类似obj=null的代码如果这么做 obj指向的对象就会更容易的被垃圾回收器发现从而加速垃圾回收

同理如果对于ThreadLocal的变量我们也手动将其设置为null 比如tl=null 那么这个ThreadLocal对于的所有线程的局部变量都有可能被回收

4.3.3 对性能有何帮助

为每一个线程分配一个独立的对象对系统性能也许是有帮助的当然这也不一定这完全取决于共享对象的内部逻辑如果共享对象对于竞争的处理容易引起性能损失
我们还是应该考虑使用ThreadLocal为每个线程分配单独的对象一个典型的案例就是在多线程下使用随机数

相关代码请见 RandomThreadLocalTest

4.4 无锁

人是分为乐天派与悲观派的那么对并发控制的处理也是分为乐观与悲观的

锁就是一种悲观的策略它总是假设每一次的临界区操作会产生冲突，因此，必须对每次操作都小心翼翼如果有多个线程同时需要访问临界区资源就宁可牺牲性能让线程进行等待所以说锁会阻塞线程执行

而无锁是一种乐观的策略它总是假设对资源的访问是没有冲突的既然没有冲突自然不需要等待所以所有的线程都可以在不停顿的状态下持续执行那遇到冲突怎么办?无锁的策略使用一种叫比较交换的技术（CAS CompareAndSwap)来鉴别线程冲突一旦检测到冲突产生就重试当前操作直到没有冲突为止

4.4.1 与众不同的并发策略:比较交换（CAS)

与锁相比使用比较交换简称为CAS会使程序看起来复杂一些但由于其非阻塞性它对死锁问题天生免疫并且线程间的相互影响也远远比基于锁的方式要小更为重要的是使用无锁的方式完全没有锁竞争代理的系统开销也没有线程间频繁调度带来的开销因此它要比基于锁的方式拥有更优越的性能

CAS算法的过程是这样的：它包含3个参数CAS(V,E,N),V表示要更新的变量 E表示预期值 N表示新值仅当V值等于E值时才会将V的值更新为N 如果V值和E值不同则说明已经有其他线程做了更新则当前线程什么都不做最后 CAS返回当前V的真实值 CAS操作是抱着乐观的态度进行的它总是认为自己可以独立完成操作
当多个线程同时使用CAS操作一个变量时只有一个会胜出并成功更新其他均会失败失败的线程不会被挂起仅是被告知失败并且允许再次尝试当然也允许失败的线程放弃操作基于这样的原理 CAS操作即使没有锁也可以发现其他线程对当前线程的干扰并进行恰当的处理

简单的说,CAS需要你额外给出一个期望值也就是你认为这个变量现在应该是什么样子的如果变量不是你想象的那样那说明它已经被别人修改过了你就重新读取再次尝试修改就好了

在硬件层面大部分的现代处理器都已经支持原子化的CAS指令在JDK5.0以后虚拟机便可以使用这个指令来实现并发操作和并发数据结构并且这种操作在虚拟机中可以说是无处不在

4.4.2 无锁的线程安全整数 AtomicInteger

为了让Java程序员能够受益于CAS等CPU指令 JDK并发包中有一个atomic包里面实现了一些直接使用CAS操作的线程安全类型

其中最常用的一个类应该就是AtomicInteger 你可以把它看做是一个整数但是与Integer不同它是可变的并且是线程安全的对其进行修改等任何操作都是用CAS指令进行的这里简单列举一些AtomicInteger的一些主要方法对于其他原子类操作也是非常相似的

public final int get()//取得当前值
public final void  set(int newValue)//设置当前值
public final int  getAndSet(int newValue)//设置新值 并返回旧值
public final boolean compareAndSet(int expect,int u)//如果当前值为expect 则设置为u
public final int getAndIncrement()//当前值加1并返回旧值
public final int getAndDecrement()//当前值减1并返回旧值
public final int getAndAdd(int delta)//当前值增加delta，返回旧值
public final int incrementAndGet() //当前值加1 返回新值
public final int decrementAndGet() //当前值减1 返回新值
public final int addAndGet(int delta)//当前值增加delta 返回旧值

就内部实现上来说 AtomicInteger中保存了一个核心字段

1	private volatile int value;

它代表了AtomicInteger的当前实际值此外还有一个

1	pirvate static final long valueObject;

它保存了value字段在AtomicInteger对象中的偏移量后面你会看到这个偏移量是实现AtomicInteger的关键

下面的代码是AtomicInteger的使用示例

4.4.3 Java中的指针:Unsafe类

1
2
3

public final boolean compareAndSet(int expect, int update) {
       return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
   }

在这里，我们看到了一个特殊的变量unsafe 它是sun.misc.Unsafe类型从名字看这个类应该是封装了一些不安全的操作那什么操作是不安全的呢学习过C或者c++都知道指针是不安全的这也是在Java中把指针去除的重要原因如果指针指错了位置或者计算指针偏移量出错结果可能是灾难性的你很有可能覆盖别人的内存导致系统崩溃

而这里的Unsafe就是封装了一些类似指针的操作 compareAndSwapInt()方法是一个natvie 方法它的几个参数含义如下

1	public final native boolean compareAndSwapInt(Object o, long offset, int expected, int x);

第一个参数o为给定的对象 offset为对象内的偏移量(其实就是一个字段到对象头部的偏移量通过这个偏移量可以快速定位字段),expected表示期望值 x表示要设置的值如果指定的字段的值等于expected 那么就会把它设置为x

不难看出,compareAndSwapInt()方法的内部比如是使用CAS原子指令完成的此外 Unsafe类还提供了一些方法

//获得给定对象偏移量上的int值
public native int getInt(Object o,long offset);
//设置给定对象偏移量上的int值
public native void putInt(Object o,long offset,int x);
//获得字段在对象中的偏移量
public native void objectFieldOffset(Field f);
//设置给定对象的int值 使用volatile语义
public native void putIntVolatile(Object o,long offset,int x);
//获得给定对象对象的int值，使用volatile语义
public native int getIntVolatile(Object o,long offset);
//和putIntVolatile()一样 但是它要求被操作字段就是volatile类型的
public native void putOrderdInt(Object o,long offset,int x);

在之前的3.3.4 深度剖析ConcurrentLinkedQueue一节中描述的ConcurrentLinkedQueue实现应该对ConcurrentLinkedQueue中的Node还有些印像 Node的有一些CAS操作也是使用Unsafe类来是实现的
这里就可以看到虽然Java派遣了指针但是在关键时刻类似指针的技术还是必不可少的这里底层的Unsafe实现就是最好的例子但是很不幸 JDK的开发人员不希望大家使用这个类获得Unsafe实例的方法就是调动其工厂方法getUnsafe()，但是他的实现却是这样的

public static Unsafe getUnsafe() {
       Class var0 = Reflection.getCallerClass();
       if(!VM.isSystemDomainLoader(var0.getClassLoader())) {
           throw new SecurityException("Unsafe");
       } else {
           return theUnsafe;
       }
   }

注意这里的代码如果是ClassLoader不为null 就会抛出异常拒绝工作因此这也使得我们自己的应用程序无法直接使用Unsafe类它是一个JDK内部使用的专属类

注意：根据Java类加载器的工作原理应用程序的类由AppLoader加载而系统核心类如rt.jar中的类由Bootstrap类加载器加载 Bootstrap加载器没有Java对象的对象因此试图获得这个类加载器会返回null 所以当一个类的类加载器为null时说明它是Bootstrap加载的而这个类极有可能是rt.jra中的类

4.4.4 无锁的对象引用：AtomicReference

AtomicReference和AtomicInteger非常类似不同之处就在与AtomicInteger是对整数的封装而AtomicReference则对应普通的对象引用
也就是它可以保证你在修改对象引用是的线程安全性

之前说过线程判断被修改对象是否可以正确写入的条件是对象的当前值和期望值是否一致这个逻辑从一般意义上是对的但是有一个小小的意外这个就是ABA问题当你获得对象当前数据后在准备修改为新值前对象的值被其他线程连续修改了俩次而经过这俩次修改后对象的值又恢复为旧值这样当前线程就无法正确判断这个对象究竟是否被修改过

一般来说发生这种情况的概率很小而且即使发生了可能也不是什么大问题比如我们只是很简单地做一个数值加法即使我在取得期望值后这个数字被不断的修改只要它最终改回了我的期望值我的加法计算就不会出错也就是说当你修改个对象没有过程的状态信息所有的信息都只保存与对象的数值本身

但是在现实中还可能存在另外一种场景就是我们是否能修改对象的值不仅取决于当前值还和对象的过程变化有关这时 AtomicRenference就无能无力了

举个例子如果有一家点为了挽留客户决定为贵宾卡余额小于20元的客户一次性赠送20元刺激消费者充值与消费
但条件时每个客户只能被赠送一次
使用AtomicReference演示这个场景

4.4.5 带有时间戳的对象引用：AtomicStampedReference

AtomicReference无法解决上述问题的根本是因为对象在修改的过程中丢失了状态信息对象值本身与状态被画上了等号因此我们只要能记录对象在修改过程中的状态值就可以很好的解决对象被反复修改导致线程无法正确判断对象状态的问题

AtomicStampedReference就是这么做的它内部不仅维护对象值还维护了一个时间戳（我这里把它称之为时间戳，实际上它可以使任何一个整数来表示状态值）当AtomicStampedReference对应的数值被修改时除了更新数据本身外还必须要更新时间戳当AtomicStampedReference设置新对象时对象值以及时间戳必须满足期望值写入才会成功因此即使对象值被反复读写写回原值只有时间戳发生变化就能防止不恰当的写入

AtomicStampedReference的几个API在AtomicReference的基础上新增了有关时间戳的信息

//比较设置 参数以此为：期望值 写入新值 期望时间戳 新时间戳
public boolean compareAndSet(V expectedReference,V new Reference,int expectedStamp,int newStamp)
//获得当前对象引用
public V getReference()
//获得当前时间戳
public int getStamp9)
//设置当前对象引用和时间戳
public void set(V newReference,int newStamp)

有了AtomicStampedReference这个法宝我们就再也不用担心对象被写坏
使用AtomicStampedReference来修正AtomicReferenceDemo的问题

相关代码请见 AtomicStampedReferenceDemo

我们使用AtomicStampedReference代替原来的AtomicReference 首先获得账户的时间戳后续的赠予操作以这个时间戳为依据如果赠予成功则修改时间戳使得系统不可能发生二次赠予的情况消费线程也是类似每次操作都使得时间戳加1 使之不可能重复

4.4.6 数组也能无锁：AtomicIntegerArray

除了提供基本数据类型外 JDK还为我们提供了数组等复合结构当前可用的原子数组有:AtomicIntegerArray,AtomicLongArray和AtomicReferenceArray,分别表示整数数组 long类型数组和普通的对象数组

AtomicIntegerArray本质上是对int[]类型的封装使用Unsafe类通过CAS的方式控制int[]在多线程下的安全性它提供了以下几个核心API

//获得数组第i个下标的元素
public final int get(int i)
//获得数组的长度
public final int length()
//将数组第i个下标设置为newVlaue，并返回旧的值
public final int getAndSet(int i,int newValue)
//进行CAS操作 如果第i个下标的元素等于expect，则设置为update，设置成功返回true
public final boolean compareAndSet(int i,int expect,int update)
//将第i个下标的元素加1
public final int getAndIncrement(int i)
//将第i个下标的元素减1
public final int getAndDecrement(int i)
//将第i个下标的元素增加delta(delta可以是负数)
public final int getAndAdd(int i,int delta)

相关代码请见 AtomicIntegerArrayDemo

4.4.7 让普通变量也享受原子操作:AtomicIntegerFieldUpdater

有时候,由于初期考虑不周或者后期的需求变化一些普通变量可能也会有线程安全的需求如果改动不大我们可以简单地修改程序中的每一个使用或者读取这个变量的地方但显然，这样不符合软件设计中的一条重要原则 —开闭原则也就是系统对功能的增加应该是开发的而对修改应该是相对保守的

所以在原子包里还有一个实用的工具类AtomicIntegerFieldUpdater 它可以让你不改动原有代码的基础上让普通的变量也享受CAS操作带来的线程安全性这样你可以修改极少的代码，来获得线程安全的保证

根据数据类型的不同这个Updater有三种分别是AtomicIntegerFieldUpdater,AtomicLongFieldUpdater和AtomicReferenceFieldUpdater 顾名思义它们分别可以对int,long和普通对象进行CAS修改

相关代码请见 AtomicIntegerFieldUpdaterDemo

虽然AtomicIntegerField很好用但是还有几个注意事项：

第一 Updater只能修改它可见访问内的变量因为Updater使用反射如果变量不可见就会出错比如如果score申明为private 就是不可行的
第二为了确保变量被正确的读取它必须是volatile类型的如果我们原有代码中未申明这个类型那么简单地申明一下就行这不会引起什么问题
第三由于CAS操作会通过对象实例中的偏移量直接进行赋值因此它不支持static字段(Unsafe.objectFieldOffset()不支持静态变量)

4.4.8 挑战无锁算法:无锁的Vector实现

这段讲我很迷以后再补吧这里讲的是 Amino CBB 实现的LockFreeVector 我不知道作者在这里主要讲Vector的扩容机制的目的是什么可能是因为get与push_back俩个方法是最关键的俩个方法把有兴趣的自己翻书吧

4.4.9 让线程之间互相帮助:细看SynchronousQueue的实现

在对线程池的介绍中提到了一个非常特殊的等待队列SynchronousQueue
SynchronousQueue的容量为0
任何一个对SynchronousQueue的写需要等待一个SynchronousQueue的读反之亦然因此 SynchronousQueue与其说是一个队列不如说是一个数据交换通道

SynchronousQueue中有大量的无锁操作
对SynchronousQueue来说它将put()和take()俩个功能截然不同的操作抽象为一个共同的方法Transferer.transfer() 从字面上看它就是数据传递的意思
它的完整签名如下

1	E transfer(E e, boolean timed, long nanos)

当参数e未非空时表示当前操作传递给一个消费者如果为空则表示当前操作需要请求一个数据 timed参数决定是否存在timeout时间 nanos决定了timeout的时长如果返回值为非空则表示数据已经接受或者正常提供如果为空则表示失败（超时或者失败）

SynchronousQueue内部会维护一个线程等待队列

Trasferer.transfer()函数的实现是SynchronousQueue的核心它大体分为三个步骤

如果等待队列为空或者队列中的节点的类型和本次操作是一致的那么将当前操作压入队列等待比如等待队列中是读线程等待本次操作也是读因此这俩个读都需要等待进入等待队列的线程可能会被挂起它们会等待一个‘匹配’操作
如果等待队列中的元素和本次操作互补(比如等待操作是读，而本次操作是写) 那么就可以插入一个‘完成’状态节点并且让他‘匹配’到一个等待节点上接着弹出这俩个节点并且使得对于的俩个线程继续执行
如果线程发现等待队列的节点就是‘完成’节点那么帮助这个节点完成任务其流程和步骤2是一致的

步骤一的实现如下代码参考JDK 1.8.0_141

SNode h = head;
                if (h == null || h.mode == mode) {  // 如果队列为空 或者模式相同
                    if (timed && nanos <= 0) {      // 不进行等待
                        if (h != null && h.isCancelled())
                            casHead(h, h.next);     //取消处理行为
                        else
                            return null;
                    } else if (casHead(h, s = snode(s, e, h, mode))) {
                        SNode m = awaitFulfill(s, timed, nanos);
                        if (m == s) {               // 等待被取消
                            clean(s);
                            return null;
                        }
                        if ((h = head) != null && h.next == s)
                            casHead(h, s.next);     // 帮助s的fulfiller
                        return (E) ((mode == REQUEST) ? m.item : s.item);
                    }

第一行SNode表示等待队列的节点内部封装了当前线程，next节点，匹配节点，数据内容等信息第二行判断当前等待队列为空或者队列中的元素的模式与本次操作相同第8行生成一个新的节点并置于队列头部这个节点就代表当前线程如果入队成功则执行第9行的awaitFulfill()函数，该函数被唤醒后(表示已经读取到数据或者自己尝试的数据已经被别的线程读取)在14-15行尝试帮助对应的线程完成俩个头部节点的出队操作（仅仅是友情帮助) 并在最后返回读取或者写入的数据

步骤二的实现如下

} else if (!isFulfilling(h.mode)) { // 是否处于fulfill状态
                  if (h.isCancelled())            // 如果以前取消了
                      casHead(h, h.next);         // 弹出并重试
                  else if (casHead(h, s=snode(s, e, h, FULFILLING|mode))) {
                      for (;;) { // 一直循环到匹配(match)或者没有等待者
                          SNode m = s.next;       // m是s的匹配者
                          if (m == null) {        // 已经没有等待者了
                              casHead(s, null);   // 弹出fulfill节点
                              s = null;           // 下一次使用新的节点
                              break;              // 重新开始主循环
                          }
                          SNode mn = m.next;
                          if (m.tryMatch(s)) {
                              casHead(s, mn);     // 弹出s和m
                              return (E) ((mode == REQUEST) ? m.item : s.item);
                          } else                  // match失败
                              s.casNext(m, mn);   // 帮助删除节点
                      }
                  }

首先判断头部节点是否处于Fulfill模式如果是进入步骤三否则就视自己为对应的fulfill线程第4行生成一个SNode节点设置为fulfill模式并将其压入队列头部接着设置m(原始的队列头部)为s的匹配节点这个tryMatch()操作将会激活一个等待线程并将m传递给那个线程如果设置成功则表示数据投递完成将s和m俩个节点弹出即可如果tryMatch()失败则表示已经有其他线程帮我完成了操作那么简单得删除m节点即可因为这个节点已经被投递不需要再次处理然后再次跳转到第5行的循环体进行下一个等待线程的匹配和数据投递直到队列中没有等待线程为止

} else {                            // 帮助一个fulfiller
                  SNode m = h.next;               // m 是h的match
                  if (m == null)                  // 没有等待者
                      casHead(h, null);           // 弹出fulfill节点
                  else {
                      SNode mn = m.next;
                      if (m.tryMatch(h))          // 尝试match
                          casHead(h, mn);         // 弹出h和m
                      else                        // match失败
                          h.casNext(m, mn);       // 帮助删除节点
                  }
              }

上述代码的执行原理与步骤2是完全一致的唯一的不同是步骤3不会返回因为步骤3进行工作是帮助其他线程尽快投递它们的数据而自己并没有完成对应的操作因此线程进入步骤3后再次进入大循环体才能步骤1开始重新判断和投递数据

从整个数据投递的过程中可以看到在SynchronousQueue中参与工作的所有线程不仅仅是竞争资源的关系更重要的是它们彼此之间还会互相帮助在一个线程内部可能会帮助其他线程完成它们的工作这种模式可以更大程度上减少饥饿的可能提供系统整体的并行度

4.5 有关死锁的问题

在一般情况下使用锁的情况一般比无锁要多而且在复杂的业务系统中使用无锁的难度也是非常的高但是使用锁就会引起一个问题 –那就是死锁

什么是死锁死锁就是俩个或者多个线程相互占用对方需要的资源而都不进行释放导致彼此之间都相互等待对方释放资源产生了无限制等待的现象死锁一旦发生如果没有外力介入这种等待将永远存在从而对程序的产生严重的影响

用来描述死锁问题的一个有名场景就是‘哲学家就餐’问题

假设有五位哲学家围坐在一张圆形餐桌旁，做以下两件事情之一：吃饭，或者思考。吃东西的时候，他们就停止思考，思考的时候也停止吃东西。餐桌中间有一大碗意大利面，每两个哲学家之间有一只餐叉。因为用一只餐叉很难吃到意大利面，所以假设哲学家必须用两只餐叉吃东西。他们只能使用自己左右手边的那两只餐叉。哲学家就餐问题有时也用米饭和筷子而不是意大利面和餐叉来描述，因为很明显，吃米饭必须用两根筷子。

哲学家从来不交谈，这就很危险，可能产生死锁，每个哲学家都拿着左手的餐叉，永远都在等右边的餐叉（或者相反）。
如图

假设最简单的情况就是只有2个哲学家 A和B A左手拿着其中一只叉子 B也一样这样他们的右手都在等待对方的叉子并且这种等待会继续从而导致线程无法运转
下面用一个简单的例子模拟这个过程
相关代码请见 DeadLock

如果在实际环境中遇到了这种情况通常的表现就是相关的进程不再工作并且CPU占用率为0(因为死锁的显存不占用CPU)，不过这种表现线性只能猜测问题如果想要确认问题还需要使用JDK提供的一套专业工具
我们可以使用jps命令得到java进程的ID 接着使用jstack命令得到线程的线程堆栈

想要避免死锁除了使用无锁的函数外另外一种有效的方法就是使用第三章介绍的重入锁通过重入锁的中断或者限时等待可以有效避免死锁代理的问题

相关代码请见 DeadLockInterruptSolve
相关代码请见 DeadLockTimeLockSolve

第5章并行模式与算法

5.1 探讨单例模式

单例模式是一个对象创建模式用于产生一个对象的具体实例它可以确保系统中一个类只产生一个实例在Java中这样的行为能带来俩大好处

对于频繁使用的对象可以省略new操作花费的时间这对于那些重量级对象而言是非常可观的一笔系统开销
由于new操作的次数减少因而对系统内存的使用频率也会降低这将减轻GC压力缩短GC停顿时间

严格来说单例模式与并行没有直接的关系

下面是一个单例的实现

public class Singleton{
 private Singleton(){
 System.out.println("Singleton is create");
}
privat static Singleton instance =new Singleton();

public static Singleton getInstance(){
   return instance;
}

要保证系统中不会有人意外创建多余的实例因此我们把Sington的构造函数设置为private 这点非常重要这就警告所有的开发人员不能随便创建这个类的实例从而有效避免该类被错误的创建

第二点 instance对象必须是private并且static的如果不是privat 那么instance的安全性无法得到保证一个小小的以外就可能使得instance变成null 其次因为工程方法getInstance()必须是static的因此对于的instnace也必须是static

但是这种方式有一点不足就是Singleton构造函数或者说Sington实例在什么时候创建是不受控制的对于静态成员instance 它会在类第一次初始化的时候被创建这个时刻并不一定是getInstance()方法第一次被调用的时候

比如

public class Singleton{
public static int STATUS=1;

 private Singleton(){
 System.out.println("Singleton is create");
}
privat static Singleton instance =new Singleton();

public static Singleton getInstance(){
   return instance;
}

注意这个单例还包含一个表示状态的静态成员STATUS 此时在相同任何地方应用这个STATUS都会导致instance实例被创建（任何对Singleton方法或者字段的引用都会导致类初始化并创建intance实例但是类初始化只有一次因此instance实例永远只会被创建一次）

比如

1	System.out.println(Singleton.STATUS);

上述println会打印出

1 2	Singleton is create 1

可以看到即使系统没有要求创建单例 new Singleton（）也会被调用

如果你想精准控制instance的创建时间那么这种方法就不太友善了
有一种新的方法一种支持延迟加载的策略它慧慧在instance背第一次使用时创建对象具体实现如下

5.2 不变模式

多线程对同一个对象进行读写操作时为了保证对象数据的一致性和正确性有必要对对象进行同步而同步操作对系统性能是有相当的损耗的可以使用一种不会改变的对象依靠对象的不变形可以确保其在没有同步操作时的多线程环境中依然始终保持内部状态的一致性和正确性这就是不变模式

不变模式天生就是多线程友好的它的核心思想是一旦一个对象被创建则它的内部状态永远不会发生改变所以没有一个线程可以修改其内部状态和数据同时其内部状态也绝不会自行发生改变基于这些特性对不变对象的多线程操作不需要进行同步控制

同时还需要注意不变对象和只读属性是有一定的区别的不变模式是比只读属性具有更强的一致性和不变形对只读属性的对象而言对象本身不能被其他线程修改但是对象的自身状态却可能自行修改

因此不变模式的主要使用场景需要满足以下2个条件：

当对象被创建后其内部状态和数据不再发生任何变化
对象需要被共享被多线程频繁访问

在Javayuy中不变模式的实现很简单为确保对象被创建后不发生任何改变并保证不变模式正常工作只需要注意以下4点

去除setter方法以及所有修改自身属性的方法
将所有属性设置为私有并用final标记确保其不可修改
确保没有子类可以重载它的行为
有一个可以创建完整对象的构造函数

下面代码实现了一个不变的产品对象它拥有序列号名称和价格三个属性

Product.java

在JDK中不变模式用的非常广泛其中最为典型的就是java.lang.String类此外所有元数据包装类都是使用不变模式实现的

由于基本数据类型和String类型在实际的软件开发中应用极其广泛使用不变模式所有实例的方法都不需要同步操作保证了多线程下的性能

不变模式通过回避问题而不是解决问题的态度来处理多线程并发访问控制

5.3 生产者-消费者模式

生产者-消费者模式是一个经典的多线程设计模式它为多线程间的协作提供了良好的解决方案在生产者-消费者模式中通常有两类线程即若干个生产者线程和若干个消费者线程生成者线程负责提交用户请求消费者线程则负责处理生产者提交的任务生产者和消费者之间通过共享内存缓冲区来进行通信

生产者-消费者模式中的内存缓存区的主要功能是数据在多线程间的共享此外通过该缓冲区可以缓解生成者和消费者之间的性能差

生产者-消费者模式的核心组件是共享内存缓冲区它作为生产者和消费者间的通信桥梁

角色	作用
生产者	用于提交用户请求提取用户任务并装入内存缓冲区
消费者	在内存缓冲区中提取并处理任务
内存缓冲区	缓冲生产者提交的任务或数据供消费者使用

其中 BlockingQueue充当了共享内存缓冲区用于维护任务或数据队列

BlockingQueue在第三章

5.4 高性能的生产者-消费者：无锁的实现

BlockingQueue用于实现生产者和消费者一个不错的选择它可以很自然的实现作为生产者和消费者的内存缓冲区
但是BlockingQueue并不是一个高性能的实现它完全使用锁和阻塞等待实现线程间的同步在高并发场合它的性能并不是特别的卓越就像之前已经提过的ConcurrentLinkedQueue是一个高性能的队列但是BlockingQueue只是为了方便数据共享

5.4.1 无锁的缓存框架：Disruptor

Disruptor是由LMAX公司开发的一款高效的无锁内存队列它使用无锁的方式实现了一个环形队列非常适合于实现生产者和消费者模式比如事件和消息的发布在Disruptor中别出心裁的使用了环形队列（RingBuffer）来代替普通线性队列这个环形队列内部实现为一个普通的数组对于一般的队列势必要提供队列同步head和尾部tail俩个指针用于出队入队增加了线程协作的复杂度但是如果队列是环形的则只需要对外提供一个当前位置cursor 利用这个指针即可以入队也可以进行出队操作由于环形队列的缘故队列的总大小必须事先指定不能动态扩展为了能快速从一个序列对应数组的实际位置（每次有元素入队序列就加1），Disruptor要求我们必须将数组的大小设置为2的整数次方这样通过sequence&（queueSize-1）就能立即定位到实际的元素位置index 这个要比取余(%)操作快得多

如果大家不理解上面的sequence&（queueSize-1）在这里简单说明一下如果queueSize是2的整数次幂则这个数字的二进制表示比如是10，100,1000 等形式因此queueSize-1的二进制是一个全1的数字因此它可以将sequnce限定在queueSize-1的范围内并且不会有任何一位是浪费的

相关代码请见Disruptor案例
Disruptor至少要比BlockingQueue要高一个量级以上

5.4.3 提高消费者的响应时间：选择合适的策略

当有新数据在Disruptor的环形缓冲区中产生时消费者如何知道这些新产生的数据呢或者说消费者如何监控缓冲区中的信息呢为此 Disruptor提供了几种策略这些策略由WaitStrategy接口封装主要有以下几种实现

BlockingWaitStrategy：这是默认的策略使用BlockingWaitStrategy和使用BlockingQueue是非常类似的它们都使用锁和条件(Condition)进行数据的监控和线程的唤醒因为涉及到线程的切换 BlockingWaitStrategy策略是最节省CPU 但是在高并发下性能表现最糟糕的一种等待策略
SleepingWaitStrategy：这个策略也是对CPU使用率非常保守的它会在循环中不断等待数据它会先进行自旋等待如果不成功则使用Thread.yiled()让出cpu 并最终使用LockSupport.parkNanos(1)进行线程休眠以确保不占用太多的CPU数据因此这个策略对于数据处理可能产生比较高的平均延时它比较适合于延时要求不是特别高的场合好处是它对生产者线程影响最小典型的应用场景是异步日志
YiedldingWaitStrategy:这个策略用于低延时的场合消费者线程会不断循环监控缓冲区变化在循环内部它会使用Thread.yield()让出CPU给别的线程执行时间如果你需要一个高性能的系统并且对延时有较为严格的要求则可以考虑这种策略使用这种策略时相当于你的消费者线程变身为一个内部执行了Thread.yield()的死循环因此你最好有多余消费者线程数量的逻辑CPU数量（这里的逻辑CPU 指的是“双核四线程”中的四线程否则整个应用程序恐怕都会受到影响）
BusySpinWaitStrategy:这个是最疯狂的等待策略它就是一个死循环！消费者线程会尽最大努力疯狂的监控缓冲区的变化因此它会吃掉所有的CPU资源你只有在延时非常苛刻的场合可以考虑使用它（或者说你的系统真的非常繁忙）因为在这里你等同开启了一个死循环监控所以你的物理CPU必须要大于消费者线程数注意这里说的是物理CPU 不是超线程技术模拟的俩个逻辑核另外一个逻辑核显然会受到这种超密集计算的影响而不能正常工作

5.4.4 CPU cache的优化：解决伪共享问题

除了使用CAS和提供了各种不同的等待策略来提高系统的吞吐量外 Disruptor大有优化到底的气势甚至尝试解决CPU缓存的伪共享问题

什么是伪共享问题为了提高CPU的速度 CPU有一个高速缓存cache 在高速缓存中读写数据最小单位为缓存行（Cache line）它是从主存（memory）复制到缓存（Cache）的最小单位一般为32字节到128字节

如果俩个变量存放在一个缓存行中在多线程访问时可能会相互影响彼此的性能

为了不使这种情况发生一种可行的方法就是在变量的前后都先占据一定的位置（叫做padding吧）这样当内存被读入缓存时这个缓存行只有这个变量是实际有效的因此就不会发生多个线程修改缓存行中不同变量而导致变量全体失效的情况

5.5 Future模式

Future模式是多线程开发中非常常见的一种设计模式它的核心思想是异步调用

5.5.1 Future模式的主要角色

参与者	作用
Main	系统启动调用Client发出请求
Client	返回Data对象立即返回FutreData并开启ClientThread线程装配RealData
FutureData	Future数据构造很快但是是一个虚拟的数据需要装配RealData
RealData	真实数据其构造是比较慢的

5.5.2 Future模式的简单实现

有一个核心接口Data 这就是客户端想要的数据
在Futre模式中这个接口有俩个重要的实现一个是RealData 也就是真实数据一个是FutureData 只是用来提取RealData的一个订单
因此FutureData是可以立即返回的

1
2
3

public interface Data {
    public String getResult();
}

FuturData实现了一个快速返回它只是一个包装或者说是一个RealData的虚拟实现因此它可以很快被构造并返回当使用FutureData的getResult()方法时如果实际的数据没有准备好那么程序就会被阻塞等待RealData准备好并注入到FutureData中才最终返回数据

FuturData是Future模式的关键它实际上是真实数据RealData的代理封装了获取RealData的等待过程

5.5.3 Jdk内部的Future模式

RunnablFuture继承了Future和Runnable俩个接口其中run()方法用于构造真实的数据它有一个具体的实现FutureTask类
FutureTask有一个内部类Sync 一些实质性的工作会委托给Sync类实现而Sync类最终会调用Callable接口完成实际数据的组装工作

Callable接口只有一个方法call() 它会发货需要构造的实际数据这个Callable接口也是这个Future框架和应用程序之间的重要接口如果我们要实现自己的业务系统通常需要实现自己的Callable对象此外FutureTask类也与应用密切关联

JDK内部的Futute模式

5.6 并行流水线

并发算法虽然可以充分发挥多核CPU的性能但不幸的是并非所有的计算都可以改造成并发的形式简单的说执行过程中有数据相关性的运算都是无法完美并行化的

比如(B+C)B/2 这个过程就无法并行的原因是如果B+C无法完成则永远算不出（B+C)B 这就是数据相关性如果线程执行过程中所需的数据存在这种依赖关系那么就没有办法将它们完美的并行化

遇到这种情况补救措施就是采用日常生活中的流水线思想
相关代码请见并行计算

5.7 并行搜索

搜索是几乎每个软件都有个功能对于有序数据通常可以采用二分法对于无序数据只能挨个查找

给定一个数组要查找满足条件的元素对于串行程序来说只要遍历一下数组就可以得到结果但如果要使用并行方式则需要额外增加一些线程间的通信机制使各个线程可以有效的运行

一种简单的策略就是将原始数据集合按照期望的线程数进行分割，如果我们计划使用俩个线程进行搜索那么就可以把一个数组或集合分割成俩个每个线程各自的独立搜索当其中有一个线程找到数据后立即返回结果即可

5.8 并行排序

排序是一个非常常用的操作在应用程序运行时无时无刻不在排序
当排序元素有很多时若使用并行算法代替串行算法显然可以更加有效的利用CPU 但将串行算法改造为并行算法并非易事甚至会极大的增强原有算法的复杂度
这里介绍几个简单平行排序算法

5.8.1 分离数据相关性：奇偶交换排序

奇偶排序是对冒泡排序的并行改造

在SerialSort.java中有相关冒泡排序的代码

对于奇偶排序来说它将排序分为俩个阶段奇交换与偶交换对于奇交换来说它总是比较奇数索引以及相邻的后续元素而偶交换总是比较偶数索引和其相邻的后续元素并且奇交换与偶交换会成对出现这样才能保证比较和交换涉及到数组中的每一个元素
奇偶交换的串行实现也在SerialSort.java中有相关代码

这样的代码虽然是串行代码但是已经很好改造为并行模式了

5.8.2 改进的插入排序：希尔排序

插入排序也是一种很常用的排序算法

在SerialSort.java中有相关插入排序的代码
简单的插入排序是很难并行化的因为这一次的数据插入依赖上一次得到的有序排列因此多个步骤是无法并行的

希尔排序将整个数组根据间隔h分割为若干个子数组子数组相互穿插在一起每一次的排序时分别对每一个子数组进行排序

在每一组排序完成后可以递减h的值进行下轮更加精细的排序直到h为1 此时等价于一次插入排序

并行排序的一个主要优点是，即使一个较小的元素在数组的末尾由于每次元素移动都以h为间隔进行因此数组末尾的小元素可以在很少的交换次数下就被置换到最接近元素最终位置的地方

希尔排序的串行实现
相关代码请见SerialSort.java

希尔排序就很好改造为并行程序了
相关代码请见ShellSort.java

5.9 并行算法:矩阵算法

同第四章的无锁Vector一样不好找具体工具就不再说明了

5.10 准备好了再通知我：网络NIO

Java NIO是NEW IO的简称它是一种可以替代Java IO的一套新的IO机制它提供了一套不同于java标准的IO的操作机制严格来说 NIO与并发无直接的关系但是使用NIO技术可以大大的提高线程的使用效率

Java NIO涉及的基础内容有通道(Channel)和缓冲区（Buffer）,文件IO和网络IO 有关通道，缓冲区以及文件IO在这里不打算进行详细的介绍

5.10.1 基于Socket的服务端的多线程模式

这里以一个简单的Echo服务器为例对于Echo服务器它会读取客户端的一个输入并将这个输入原封不动的返回给客户端

相关代码请见 MultiThreadEchoServer.java
这是一个支持多线程的服务端的核心内容它的特点是在相同可支持的线程访问内可以尽量多地支持客户端的数量同时和单线程服务器相比它可以更好的支持多核CPU
相关代码请见MultiThreadEchoClient.java

对于绝大部分应用来说这种模式可以很好地工作但是如果想让你的程序工作更加高效就必须知道这个模式一个重大的弱点那就是倾向于让CPU进行IO等待
下面有个清晰的例子
HeavySocketClient.java
之所以处理的慢并不是因为服务端有多少繁重的业务而仅仅是因为服务线程在等待IO而已让高速运转的CPU去等待极其低效的网络IO是非常不合算的行为
是不是可以将网络IO的等待时间从线程中分离出来呢？

5.10.2 使用NIO进行网络编程

一个NIO入门链接

首先知道NIO中的一个关键组件Channel(通道)Channel有点类似于流一个Channel可以和文件或者网络Socket对应如果Channel对应一个Socket 那么往这个Channel中写数据就等于往Socket中写数据

和Channel一起使用的另外一个重要组件就是Buffer 大家可以简单的把Buffer理解成一个内存区或者Byte数组数据需要包装成Buffer的形式才能和Channel交互(写入或读取）

另外一个与Channel密切相关的是Selector(选择器) 在Channel众多实现中 SelectableChannel实现表示可被选择的通道
任何一个SelectableChannel都可以将自己注册到一个Selector中这样这个Channel就能被Selector所管理而一个Selector可以管理多个SelectableChannel 当SelectableChannel的数据准备好时 Selector就会接到通知得到那写已经准备好的数据而SocketChannel就是SelectableChannel的一种

这样的话一个Selector可以由一个线程进行管理而一个SocketChannel则可以表示一个客户端连接因此就构成由一个或者极少数线程来处理大量客户端连接的结构当与客户端连接的数据没有准备好时 Selector会处于等待状态(不过幸好用于管理Selector的线程是极少量的）而一旦有任何一个SocketChannel准备好了数据 Selector就能立即得到通知获取数据进行处理

5.10.3 使用NIO来实现客户端

5.11 读完了再通知我：AIO

AIO是异步IO的缩小即Asynchronized 虽然NIO在网络操作中提供了非阻塞的方法但是NIO的IO行为还是同步的对于NIO来说我们的业务线程是在IO操作准备好时得到通知接着就由这个线程自行进行IO操作 IO操作本身还是同步的

但是对AIO来说就更进一步它不是在IO准备好时再通知线程而是在IO操作已经完成后再给线程发出通知因此AIO是完全不会阻塞的此时我们的业务逻辑将变为一个回调函数等待IO操作完成后由系统自动触发

5.11.1 AIO EchoServer的实现

5.11.2 AIO Echo客户端实现

第六章 Java8与并发

6.1 Java8的函数式编程简介

6.1.1 函数作为一等公民

函数可以作为另外一个函数的返回值这也是函数式编程的特点

6.1.2 无副作用

函数的副作用指的是在调用过程中除了给出了返回值外还修改了函数状态比如函数在调用过程中修改了某一个全局状态函数式编程认为，函数的副作用应该被尽量避免

显示函数指函数与外界交换数据的唯一渠道就是参数和返回值显示函数不会去读取或者修改函数的外部状态与之相对的是隐式函数隐式函数除了参数和返回值外还会读取外部信息或者可能修改外部信息

完全的无副作用实际上做不到的因为系统总是需要获取或者修改外部信息的

6.1.3 申明式的（Declarative）

函数式编程是申明式的编程方式，相对于命令式（Imperative)而言命令式的程序设计喜欢大量使用可变对象和指令
在申明式的编程范式你不再需要提供明确的指令操作所有的细节指令将会更好地被程序库所封装你要做的只是提出你的需求申明你的用意即可

int[] arr = {1, 2, 3, 4, 5, 6, 7, 8, 9,10};
      for (int i : arr) {
          System.out.println(i);
      }

与之对应的申明式代码如下

 int[] arr = {1, 2, 3, 4, 5, 6, 7, 8, 9,10};
Arrays.stream(arr).forEach((final int x)->{
           System.out.println(x);
       });

在此我们只是简单的申明了我们的用意有关循环以及判断是否结束等操作都被简单地封装在程序库中

6.1.4 不变的对象

在函数式编程中几乎所有传递的对象都不会被轻易修改
例子如下

static int[] arr = {1, 2, 3, 4, 5, 6, 7, 8, 9,10};
 Arrays.stream(arr).map((x)->x=x+1).forEach(System.out::println);
System.out.println();
Arrays.stream(arr).forEach(System.out::println);

在使用函数式编程时这种状态是一种常态几乎所有的对象都拒绝被修改这非常类似于不变模式

6.1.5 易于并行

由于对象都处于不变的状态因此函数式编程更加易于并行我们之所以要关注线程安全一个很重要的原因是当多个线程对同一个对象进行写操作容易将这个对象”写坏” 但是由于对象是不变的因此在多线程环境下也就没有必要进行任何同步操作

6.1.6 更少的代码

通常情况下函数式编程更加简明扼要代码更少

6.2 函数式编程基础

Java 8 提出了函数式接口的概念所谓函数式接口简单来说就是只定义了的单一抽象方法的接口

@FunctionalInterface
public interface Runnable {
    /**
     * When an object implementing interface <code>Runnable</code> is used
     * to create a thread, starting the thread causes the object's
     * <code>run</code> method to be called in that separately executing
     * thread.
     * <p>
     * The general contract of the method <code>run</code> is that it may
     * take any action whatsoever.
     *
     * @see     java.lang.Thread#run()
     */
    public abstract void run();
}

注释FunctionInterface用于表明Runnable是一个函数式接口该接口被定义为只包含一个抽象方法run() 因此它符合函数式接口的设计如果一个函数满足函数式接口的定义那么即使不标注为@FunctionInterface 编译器依然会把它看做函数式接口这有点像@Overried注释如果你的函数符合重载的要求无论你是否标注了@Overried 编译器都识别这个重载函数但一旦你进行了标注而实际的代码不符合规范那么就会得到一个编译错误

这里需要强调的是函数式接口只能有一个抽象方法而不是只能有一个方法这份俩点来说在java8中接口运行存在实例方法比如默认方法静态方法其次如何被java.lang.Object实现的方法都不能视为抽象方法

6.2.2 接口默认方法

6.2.4 方法引用

6.3 一步一步走入函数式编程

关于这几章其实我在博客中的另外一篇博客 JAVA8新特性总结中已经介绍过了

6.4 并行流与并行排序

6.4.1 使用并行流过滤数据

     public class PrimeUtil {

    public static boolean isPrime(int number) {
        int  tmp =number;
        if (tmp < 2) {
            return  false;
        }
        for (int i=2;Math.sqrt(tmp) >=i;i++) {
            if (tmp % i == 0) {
                return  false;
            }
        }
        return true;
    }

    public static void main(String[] args) {
        System.out.println( IntStream.range(1, 1000000).parallel().filter(PrimeUtil::isPrime).count());
        }
}

可以使用parallel()方法得到一个并行流接着在并行流进行过滤此时 PrimeUtil.isPrime()会被多线程并发调用应用于流的所有元素

6.4.2 从集合得到并行流

在函数式编程中我们可以从集合得到一个流或者并行流

1 2	List<Student> ss = new AskThread(); double ave=ss.stream().mapToInt(s->s.score).avarage().getAsDouble();

在集合对象List中我们使用stream()方法可以得到一个流如果希望将这段代码并行化则可以使用parallelStream()函数

1	double ave=ss.parallelStream().mapToInt(s->s.score).avarage().getAsDouble();

6.4.3 并行排序

除了并行流外对于普通数组 Java8中也提供了简单的并行功能比如对于数组排序有Arrays.sort()方法当然这是串行排序在Java8中也有新增的Arrays.paralleSort()

1 2	int[] arr = new int[10]; Arrays.parallelSort(arr);

除了并行排序外 Arrays中还增加了一些API用于数组中数据的赋值

Random r = new Random();
Arrays.setAll(arr, (i) -> r.nextInt());
//并行版本的setAll
Arrays.parallelSetAll(arr, (i) -> r.nextInt());

6.5 增强的Future：CompletableFuture

CompleteableFuture是Java8新增的一个超大型工具类为什么说它大呢一方面是实现了Future接口更重要的是实现了CompletionStage接口
这个接口含有多达约40种方法之所以这么多方法视为了函数式编程的流式调用准备的通过CompletionStage提供的接口我们可以在一个执行结果上多次流式调用以此得到最终结果

6.5.1 完成了就通知我

CompletableFutre与Future一样可以作为函数调用的契约如果你向CpmpletableFuture请求一个数据如果数据还没有准备好请求线程就会等待而让人惊喜的是 CompletableFuture是可以手动设置完成状态的
相关代码请见AskThread.java

6.5.2 异步执行任务

通过将CCpmletableFuture提供的进一步封装我们很容易实现Future模式那样的异步调用

 public  static Integer calc(Integer para){
       try {
           //模拟一个长时间的执行
           Thread.sleep(1000);
       } catch (InterruptedException e) {
       }
       return para/2;
   }
public static void main(String[] args) throws ExecutionException, InterruptedException {
       final CompletableFuture<Integer> future = CompletableFuture.supplyAsync(() -> calc(50));
       System.out.println(future.get());
       }

上述代码中使用了一个CompletableFuture.supplyAsync()方法构造一个CompletableFuture实例在supplyAsync()函数中它会在一个新的线程中执行传入的参数在这里它会执行calc()方法而calc()方法执行是比较慢的但是这不影响CompletableFuture实例的构造速度因此supplyAsync()会理解返回它返回的CompletableFuture对象实例在supplyAsync()函数中它会在一个新的线程中执行传入的参数但这不影响CompletableFuture实例的构造速度因此supplyAsync()会立即返回
它返回的CompletableFuture对象实例就可以作为这次调用的契约在将来的任何场合用于获得最终的计算结果
如果当前计算没有完成则调用get()方法的线程会等待

在CompletableFuture中类似的工厂方法有以下几个

public static <U> CompletableFuture<U> supplyAsync(Supplier<U> supplier)

public static <U> CompletableFuture<U> supplyAsync(Supplier<U> supplier,
                                                   Executor executor)

public static CompletableFuture<Void> runAsync(Runnable runnable,
                                               Executor executor)

public static CompletableFuture<Void> runAsync(Runnable runnable,
                                               Executor executor)
```       
其中supplyAsync()方法用于那些需要有返回值的场景 比如计算某个数据等 而runAsync()方法用于没有返回值的场景 比如 仅仅是简单地执行一个异步任务

在这俩个方法中 都有一个方法可以接受Executor参数 这就使我们可以让Suppilier<U>或者Runnable在指定的线程池中工作 如果不指定 则在默认的系统公共的ForkJoinPool.common线程池中执行
                                                   
>注意 在Java8中 新增了ForkJoinPool.commonPool()方法 它可以获得一个公共的ForkJoin线程池 这个公共的线程池中的所有线程都是Daemon线程 这意味着如果主线程退出 这些线程无论是否执行完毕 都会退出系统 

### 6.5.3 流式调用
```java
  public  static Integer calc(Integer para){
        try {
            //模拟一个长时间的执行
            Thread.sleep(1000);
        } catch (InterruptedException e) {
        }
        return para/2;
    }

public static void main(String[] args) throws ExecutionException, InterruptedException {
   CompletableFuture<Void> fu = CompletableFuture.supplyAsync(() -> calc(50)).thenApply((i) -> Integer.toString(i))
                .thenApply((str)->"\""+str+"\"")
                .thenAccept(System.out::println);
        fu.get();
}

上述代码中使用supplyAsync()函数执行一个异步任务接着连续使用流式调用对任务的处理结果进行再加工直到最后结果输出

6.5.4 CompletableFuture中的异常处理

CompletableFuture提供了一个异常处理方法execptionally();

  public  static Integer calc(Integer para){
        return para/0;
    }
    
public static void main(String[] args) throws ExecutionException, InterruptedException {

         CompletableFuture<Void> fu = CompletableFuture.supplyAsync(() -> calc(50))
                .exceptionally(ex->{
                    System.out.println(ex.toString());
                    return 0;
                })
                .thenApply((i) -> Integer.toString(i))
                .thenApply((str)->"\""+str+"\"")
                .thenAccept(System.out::println);
        fu.get();
}

在上述代码中第8行对当前的CompletableFuture进行异常处理如果没有异常发生则CompletableFuture就会返回原有的结果如果遇到了异常就可以在exceptionally()中处理异常并返回一个默认的值

6.5.5 组合多个CompletableFuture

CompletableFuture还允许你将多个CompletableFuture进行组合一种方法是使用thenCompose()

一个CompletableFuture可以在执行完成后将执行结果通过Function传递给下一个CompletionStage进行处理(Function接口返回新的CompletionStage实例)

public  static Integer calc(Integer para){
        return para/2;
}
    
public static void main(String[] args) throws ExecutionException, InterruptedException {
        CompletableFuture<Void> fu = CompletableFuture.supplyAsync(() -> calc(50))
                .thenCompose((i) -> CompletableFuture.supplyAsync(() -> calc(i)))
                .thenApply((str) -> "\"" + str + "\"")
                .thenAccept(System.out::println);
        fu.get();
}

另外一种组合多个CompletableFuture的方法是thenCombine()

public  static Integer calc(Integer para){
        return para/2;
}

public static void main(String[] args) throws ExecutionException, InterruptedException {
      CompletableFuture<Integer> intFuture =CompletableFuture.supplyAsync(()->calc(50));
        CompletableFuture<Integer> intFuture2 =CompletableFuture.supplyAsync(()->calc(25));

        CompletableFuture<Void> fu =intFuture.thenCombine(intFuture2,(i,j)->(i+j)).thenApply((str)->"\""+str+"\"")
                .thenAccept(System.out::println);
        fu.get();
    }
}

上述代码中首先生成俩个CompletableFuture实例接着使用thenCombine（）组合将这俩个CompletableFuture 将这俩者的执行结果进行累加并将其累加结果转换为字符串

6.6 读写锁的改进：StampedLock

StampedLock是java8引入的一种新的锁机制简单的理解可以认为它是读写锁的一个改进版本读写锁虽然分离了读与写使得读与读之间可以完全并发但是读和写之间依然是冲突的读锁会完全阻塞写锁它使用的依然是悲观的锁策略如果有大量的读线程也有可能会引起写线程的“饥饿”
而StampedLock是一种乐观的读策略这种乐观的锁非常类似无锁的操作使得乐观锁完全不会阻塞写线程

6.6.1 StampedLock使用示例

6.6.2 StampedLock的小陷阱

StampedLock内部实现时使用类似CAS操作的死循环反复尝试的策略
在它挂起线程时使用的是Unsafe.park()函数而park()函数在遇到线程中断时会直接返回（注意，不同于Thread.sleep()它不会直接抛出异常)
而在StampedLock的死循环逻辑中没有处理有关中断的逻辑因此这就会导致阻塞在park()上的线程被中断后会再次进入循环而当退出条件得不到满足时就会发生疯狂占用CPU的情况这一点值得注意
下面的例子演示了这个问题
StampedLockCPUDemo.java

6.6.3 有关StampedLock的实现思想

StampedLock的内部实现是基于CLH锁的 CLH锁是一种自旋锁它保证没有饥饿发生并且可以保证FIFO(First-In-First-Out)的服务顺序

CLH锁的基本思想如下：
锁维护一个等待线程队列所有申请锁但是没有成功的线程都记录在这个队列中每一个节点(一个节点代表一个线程) ,保存一个标志位(Locked),用于判断当前线程是否已经释放锁

当一个线程试图获得锁，取得当前等待队列的尾部结点作为其前序节点并使用类似如下代码判断前序节点是否已经成功释放锁

1 2	while(pred.locked){ }

只要前序节点(pred)没有释放锁则表示当前线程还不能继续运行因此会自旋等待
反之如果前序线程已经释放锁则当前线程可以继续执行
释放锁时也遵循这个逻辑线程会将自身节点的locked位置标记为false 那么后续等待的线程就能继续执行了

StampedLock正是基于这种思想但是实现上更为复杂
在StampedLock内部会维护一个等待链表队列

static final class WNode {
    volatile WNode prev;
    volatile WNode next;
    volatile WNode cowait;    // list of linked readers
    volatile Thread thread;   // non-null while possibly parked
    volatile int status;      // 0, WAITING, or CANCELLED
    final int mode;           // RMODE or WMODE
    WNode(int m, WNode p) { mode = m; prev = p; }
}
/** Head of CLH queue */
private transient volatile WNode whead;
/** Tail (last) of CLH queue */
private transient volatile WNode wtail;

上述代码中 WNode为链表的基本元素每一个WNode表示一个等待线程字段whead和wtail分别指向等待链表的头部和尾部

另外一个很重要的字段state

1 2	/** Lock sequence/state */ private transient volatile long state;

字段state表示当前锁的状态它是一个long型有64位其中倒数第8位表示写锁状态如果该位为1 表示当前由写锁占领

public long tryOptimisticRead() {
     long s;
     return (((s = state) & WBIT) == 0L) ? (s & SBITS) : 0L;
 }

一次成功的乐观锁必须保证当前锁没有写锁占用其中WBIT用来获取写锁状态位值为0X80 如果成功则返回当前state的值（末尾7位清零，末尾7位表示当前正在读取的线程数量）
如果在乐观锁读后有线程申请了写锁那么state的状态就会改变

public long writeLock() {
      long s, next;  // bypass acquireWrite in fully unlocked case only
      return ((((s = state) & ABITS) == 0L &&
               U.compareAndSwapLong(this, STATE, s, next = s + WBIT)) ?
              next : acquireWrite(false, 0L));
  }

上述代码第4行设置写锁位为1（通过加上WBIT（0x80）) 这样就会改变state的取值那么在乐观锁确认时（validate）时就会发现这个改动导致乐观锁失效

public boolean validate(long stamp) {
     U.loadFence();
     return (stamp & SBITS) == (state & SBITS);
 }

上述validate()函数比较当前stamp和发生乐观锁时取得的stamp，如果不一致则宣告乐观锁失败

乐观锁失败后可以提高锁级别升级为悲观锁

public long readLock() {
      long s = state, next;  // bypass acquireRead on common uncontended case
      return ((whead == wtail && (s & ABITS) < RFULL &&
               U.compareAndSwapLong(this, STATE, s, next = s + RUNIT)) ?
              next : acquireRead(false, 0L));
  }

悲观锁会尝试设置state状态（第4行）它会将state加1（前提是读线程数量没有溢出，对于读线程数量溢出的情况会使用辅助的readerOverflow进行统计这里不讨论）用于统计线程的数量如果失败则进入acquireRead（）二次尝试锁获取

在acquireRead()中线程会在不同条件下进行若干次自旋试图通过CAS操作获得锁如果自旋宣告失败则会启用CLH队列将自己加入到队列中之后再启用自旋如果发现自己成功获得了读锁则会进一步把自己cowait队列中的读线程全部激活(使用Unsafe.unpark()方法) 如果最终依然无法成功获得读锁则会使用Unsafe.park()方法挂起当前线程
方法acquireWrite()和acquireRead()也非常类似也是通过自旋尝试加入等待队列直至最终Unsafe.park()方法挂起线程的逻辑进行的释放锁时与加锁动作想法以unlockWrite()为例

public void unlockWrite(long stamp) {
       WNode h;
       if (state != stamp || (stamp & WBIT) == 0L)
           throw new IllegalMonitorStateException();
       state = (stamp += WBIT) == 0L ? ORIGIN : stamp;
       if ((h = whead) != null && h.status != 0)
           release(h);
   }

上述代码第5行将写标识位清理如果state发生溢出则退回到初始值
接着如果等待队列不为空则从等待队列中激活一个线程（绝大多数情况下是第一个等待线程）继续执行（第7行）

6.7 原子类的增强

6.7.1 更快的原子类

在AtomicInteger类中它们都是在一个死循环中不断尝试修改目标值直到修改成功如果竞争不激烈的情况下修改成功率很高否则修改失败的概率就会很高在大量修改失败时这些原子操作就会进行多次循环尝试因此性能就会受到影响

那么当竞争激烈的时候有一种方案可以使用热点分离将竞争的数据进行分解提高系统的性能基于这种思路虽然CAS操作中没有锁但是像减小锁粒度这种分离热点的思想依然可以使用
一种可行的方案就是仿造ConcurrentHashMap 将热点数据分离比如可以将AtomicInteger的内部核心数据value分离成一个数组每个线程访问时通过哈希等算法映射到其中一个数字进行计数而最终的计算结果则为这个数组的求和累加
而LongAddrer正是使用了这种思想

在实际的操作中 LongAdder并不会一开始就动用数组进行处理而是将所有数据都先记录在一个称为base的变量中如果在多线程条件下大家修改base都没有冲突那么也没有必要扩展为cell数组但是一旦发现base修改发生冲突就会初始化cell数组使用新的策略如果使用cell数组更新后发现某一个cell上的更新依然发生冲突那么系统就会尝试创新的cell 或者将cell的数量加倍以减少冲突的可能

简单的分析一个increment（）方法的内部实现

public void increment() {
       add(1L);
   }
public void add(long x) {
       Cell[] as; long b, v; int m; Cell a;
       if ((as = cells) != null || !casBase(b = base, b + x)) {
           boolean uncontended = true;
           if (as == null || (m = as.length - 1) < 0 ||
               (a = as[getProbe() & m]) == null ||
               !(uncontended = a.cas(v = a.value, v + x)))
               longAccumulate(x, null, uncontended);
       }
   }

它的核心是第4行的add()方法最开始cells为null 因此数据会向base增加但是如果对base的操作冲突则会进入第7行并设置冲突标记uncontended为true 接着
如果判断cells数组不可用或者当前线程对应的cell为null 则直接进入longAccumulate（)方法否则会尝试使用CAS方法更新对应的cell数据如果成功则退出失败则进入longAccumulate()方法

longAccumulate()方法比较复杂其大致内容为根据需要创建新的cell或者对cell数组进行扩容以减少冲突

下面进行一个例子简单的对LongAdder，原子类以及同步锁进行性能测试测试方法是使用多个线程对同一个整数进行累加观察使用3种不同方法所消耗的时间
LongAdderDemo.java

这本书说的是LongAdder的表现最好但是可能是因为我是i5的cpu只有双核速度表现并不理想最好的是原子类
LongAdder的另外一个优化手段就是避免了伪共享在第5章有有关伪共享的问题但是需要注意的是 LongAdder中并不是直接使用padding这种看起来比较碍眼的做法而是引入了一种新的注释'@sun.misc.Contended‘

@sun.misc.Contended static final class Cell {
      volatile long value;
      Cell(long x) { value = x; }
      final boolean cas(long cmp, long val) {
          return UNSAFE.compareAndSwapLong(this, valueOffset, cmp, val);
      }

      // Unsafe mechanics
      private static final sun.misc.Unsafe UNSAFE;
      private static final long valueOffset;
      static {
          try {
              UNSAFE = sun.misc.Unsafe.getUnsafe();
              Class<?> ak = Cell.class;
              valueOffset = UNSAFE.objectFieldOffset
                  (ak.getDeclaredField("value"));
          } catch (Exception e) {
              throw new Error(e);
          }
      }
  }

可以看到在上述代码第一行申明了Cell类为sun.misc.Contended 这将会使得Java虚拟机自动为Cell解决伪共享问题
当然在我们的代码中也可以使用sun.misc.Contened来解决伪共享问题但是需要额外使用虚拟机参数-XX:-RestrictConteded 否则这个注释将被忽略

6.7.2 LongAdder的功能增强版：LongAccumulator

LongAccumulator是LongAdder的亲兄弟它们有公共的Striped64 因此 LongAccumulator的内部的优化方式和LongAdder是一样的它们都有一个long型的整数进行分割存储在不同的变量中以防止多线程竞争俩者的主要逻辑是类似的但是LongAccumulator是LongAdder的功能扩展对于LongAdder来说它只是每次对给定的整数执行一次加法而LongAccumulator则可以用任意函数操作

可以使用下面的构造函数创建一个LongAccumulator实例

1 2	public LongAccumulator(LongBinaryOperator accumulatorFunction, long identity)

第一个参数accumulatorFunction就是需要执行的二元函数（接受俩个long行参数并返回long），第二个参数是初始值
下面那个例子展示了LongAccumulator的使用它将通过多线程访问若干个整数并返回遇到的最大的那个数字

相关代码请见LongAccumulatorDemo.java

在上述代码中构造了LongAccumulator实例并且过滤了最大值因此传入Long::max函数句柄当有数据通过accumulate()方法传入LongAccumulator后 LongAccumulator会通过Long::max识别最大值并且保存在内部在第24行通过longValue()函数对所有的cell进行了Long::max操作得到最大值

第7章使用AKKA构建高并发程序

写出一个高并发并且可扩展的应用是很难的那么是否有一个好的框架可以帮助我们轻松构建这么一个应用呢 Akka提供了这么一个方式 Akka是遵循Apache2许可的开源人员这意味你可以无偿并且几乎没有限制的使用它包括应用商业环境

Akka是使用scala创建的但是Scala和java一样都是jvm上的内容都可以互相调用但是实际使用中还是推荐使用Scala来进行Akka的编写

Akka提供了一种Actor的并发模型其粒度比线程更小可以在代码中启用极其大量的Actor

其次 Akka中提供了一套容错机制运行在Actor出现异常时进行一些恢复或者重置操作

最后通过Akka不仅可以在单机上构建高并发程序也可以在网络上构建分布式程序
并提供位置透明的Actor定位服务

7.1 新并发模型:Actor

在使用Akka中基本就可以忘记线程了当你使用Akka时就有了一个全新的执行单元-Actor
Actor可以比喻为一个人多个人之间可以通过语言交流

传统Java并行程序还是完全基于对象的方法我们还是通过对象的方法调用进行信息的传递这时如果对象的方法会修改对象本身的状态那么在多线程情况下就有可能出现对象状态的不一致所以我们就必须对这类方法调用进行同步当然同步往往是以牺牲性能为代价的

在Actor模型中我们失去了对象的方法调用我们不是通过调用Actor对象的某一个方法来告诉Actor你需要做什么而是给Actor发生一条消息当一个Actor收到消息后它有可能会根据消息的内容做出某些行为包括更改自身状态但是在这种情况下这个状态的更改是Actor自己进行的并不是由外界强迫进行的

7.2 Akka之Hello World

一个Acotr的实现
Greeter.java
HelloWorld.java

上述代码中定义了一个换一种Greeter 继承自UntypedActor（它自然是Akka中的核心成员了） UntypedActor就是我们说的Actor 之所以说是无类型是因为还有一种有类型有类型的Actor可以使用系统中的其他类型构造可以缓解Java单继承的问题因为你在继承UntypedActor后就不能再继承系统中其他类了如果你一定想这么做那么就只能选择有类型的Actor 否则UntypedActor就是你的首选

在HelloWorld.java中又实现了一个HelloWorld的Actor 其中的preStart()方法为Akka的回调方法在Actor启动前会在Akka框架调用，完成一些初始化的工作
在这里由于创建Greeter时使用的是HelloWorld的上下文因此它属于HelloWorld的子Actor
onReceive()函数是为HelloWorld的消息处理函数

主函数如下：
HelloWorldMain.java
在主函数中创建了ActorSystem 表示管理和维护Actor的系统一般来说一个应用程序只需要一个ActorSystem就够用了 ActorSystem.create()的第一个参数‘hello’为系统名称第2个参数为配置文件
通过AcotorSystem创建一个顶级的Acotor(HelloWorld)

可以看到当使用Actor的时候关注点已经不在线程上了实际上线程调度已经被Akka框架进行了封装只需关注Actor对象即可而Actor对象之间的交流和普通对象的函数调用有明显区别它们是通过显示的消息发送来传递消息的

当系统有多个Actor存在时 Akka会自动在线程池中选择线程来执行我们的Actor 因此当多个不同的Actor可能被同一个线程执行同时一个Actor也有可能被不同线程执行因此一个值得注意的地方是：不要在一个Actor中执行耗时的代码这样可能会导致其他Actor的调度出现问题

7.3 有关消息投递的一些说明

整个Akka应用是由消息驱动的消息是除了Actor之外最重要的核心组件作为在并发程序中的核心组件在Actor之间传递应该满足不变性也就是不变模式因为可变模式无法高效的在并发环境使用理论上Akka的消息可以使用任何对象实例但实际使用中强烈推荐使用不可变模式

实际上对于消息投递可以有3种不同的策略

第一种称为最多一次传递每条消息最多投递一次在这种情况偶尔会有投递失败从而导致消息丢失
第二种称为最少一次投递每一条消息至少会被投递一次直到成功为止在一些偶然的场合接受者可能会受到重复的消息但不会发生消息丢失
第三种称为精准的消息传递，也就是所有的消息精准地投递并成功接收一次既不会有丢失也不会重复接收
很明显第一种性能最好第二种其次第三种成本最高最难以实现

那么是否真的需要保证消息投递的可靠性呢
答案是否定的实际上我们没有必要在Akka层保证消息的可靠性这样做成本太高了也是没有必要的消息的可靠性更应该在应用的业务层去维护因为也许在有些时候丢失一些消息完全是符合应用要求的因此在使用Akka时需要在业务层对此进行保证

此外对于消息投递Akka可以在一定程度上保证顺序性比如Actor A1向A2顺序发送M1，M2和M3三条消息 Actor A3向A2顺序发送了M4，M5和M6三条消息

如果M1没有丢失那它一定先于M2和M3被A2收到
如果M2没有丢失那它一定先于M3被A2收到
如果M4没有丢失那它一定先于M5和M6被A2收到
如果M5没有丢失那它一定先于M6被A2收到
对A2来说来自A1和A3的消息可能交织在一起没有顺序保证

在这里值得注意的一点是，这种消息投递规则不具备可传递性比如：
Actor A向C发生M1，接着Actor A向B发送了M2，B将M2转发给Actor C那么在这种情况下 C收到M1和M2的先后顺序是没有保证的

7.4 Actor的生命周期

一个Actor在actorOf()函数被调用后开始建立 Actor实例创建后会回调preStart()方法在这个方法里面可以进行一些资源的初始化工作在Actor的工作过程中可能会出现一些异常这种情况下 Actor会重启当Actor被重启时会回调preRestart()方法（在老的实例上）接着系统会创建一个新的Actor对象实例（虽然是新的实例，但它们都表示同一个Actor）当新的Actor实例创建后会回调postRestart()方法表示启动完成同时新的实例将会代替旧的实例停止一个Actor也有很多方式你可以调用Stop()方法或者给Actor发送一个PosionPill Actor停止后 postStop()方法会被调用同时这个Actor的监听者会受到一个Terminated消息

下面是一个既带有生命周期回调函数的Actor
MyWorker.java
另外为MyWoker指定了一个监听者
WatcherActor.java
本质上，它也是一个Actor 但不同的是它会在它的上下文中watch一个Actor 如果将来这个被监视的Actor的退出终止 WatchActor就能收到一条Terminated消息在这里我们将简单地打印终止消息Terminated的相关Actor路径并且关闭整个ActorSystem

主函数如下
DeadMain.java
注意在创建WatchActor的时候第一个参数为要创建的Actor类型第2个参数为这个Actor的构造函数的参数(在这里就是要调用WatchActor的构造函数)

7.5 监督策略

如果一个Actor在执行过程中发生意外比如没有处理某些异常导致出错那么这个时候该怎么办
对于这种情况 Akka框架给予了我们足够的控制权在Akka框架内父Actor可以对子Actor进行监督监控Actor的行为是否有异常大体上监督策略可以分为俩种一种是OneForOneStrategy的监督另外一种是AllForOneStrategy

对于OneForOneStrategy的策略父Actor只会对出问题的子Actor进行处理比如重启或者停止而对于AllForOneStrategy 父Actor会对出问题的子Actor以及它所有的兄弟类进行处理很显然对于AllForStrategy策略它更适合对各个Actor联系紧密的场景如果多个Actor间只要一个Actor出现故障则宣告整个任务的失败就比较适合使用AllForStrategy 否则在更多的场景中应该使用OneForOneStrategy
当然这也是Akka中的默认策略

要指定这些监督行为只要构造一个自定义的监督策略即可
首先定义一个父Actor 它作为所有子Actor的监督者
Supervisor.java
上述代码定义了一个OneForOneStrategy监督策略在这个策略中运行Actor在遇到错误后在1分钟内进行3次重试如果超过这个频率那么就会直接杀死actor

32-34行覆盖父类的supervisorStrategy()方法设置使用自定义的监督策略
第39行用来新建一个名为restartActor的子Actor 这个子Actor就由当前的supervisor进行监督当Supervisor接受一个Props对象时就会更加这个Props配置生成一个restartActor

RestartActor的实现如下
RestartActor.java
定义了一些Actor的生命周期的回调接口目的是更好的观察Actor的活动情况在32-34行模拟了一些异常情况第42行会抛出NullPointerException 而44行会抛出ArithmeticException

在主函数里面有一点要进行说明就是49-53行向Restart发送了100条RESTART信息这会使得RestartActor抛出NullPointerException

这里粘贴一部分的输出结果

preStart hashcode:1062883844
meet NullPointerException,restart
preReStart hashcode:1062883844
preStart hashcode:1915158180
postRestart hashcode:1915158180

第一行preStart表示RestartActor正在初始化注意hashcode为1062883844
接着遇到了NullPointerException 根据自定义的策略这将导致它重启
因此就有了preRestart 因为preRestart在正是重启之前调用因此HashCode还是1062883844 表示当前Actor和上一个Actor还是同一个实例
接着就进入了preStart hashcode已经变为了1915158180 说明已经不是一个实例系统已经为这个RestartActor生成了新的实例原有的实例因为重启已经被回收这说明同一个RestartActor在系统的工作始终未必能保持同一个实例重启完成后调用postRestart（）方法
实际上 Actor重启后的preStart()方法就是在postRestart()中调用的(Actor父类的postRestart（）会调用preStart()方法）

7.6 选择Actor

在一个ActorSystem中可能存在大量的Actor 如何才能有效地对大量Actor进行批量管理和通信呢 Akka为我们提供了一个ActorSelection类用来批量进行消息发送

下面只写示意代码

for(int i=0;i<WORDER_COUNT;i++){
 workers.add(system.actorOf(Props.create(MyWorker.class,i),"worker_"+i);
}
ActorSelection selection=getContext().actorSelection("/user/worker_*");
selection.tell(5,getSelf());

上述代码批量生成了大量Actor 接着我们要给这些worker发送信息通过actorSelection()方法提供的选择通配符可以得到代表所有满足条件的ActorSelection 最后通过这个ActorSelection实例便可以向所有worker Actor发送消息

7.7. 消息收件箱（Inbox)

我们知道所有Actor之间的通信都是通过消息来进行的这是否意味着我们必须构建一个Actor来控制整个系统呢不一定需要这么做 Akka框架已经为我们准备了一个叫做‘收件箱’的组件使用收件箱可以很方便地对Actor进行消息发送和接收大大方便了应用程序与Actor之间的交互

MyWorker.java

在上述代码中与这个MyWorker Actor交互的并不是一个Actor 而是一个邮箱邮箱的使用很简单在上述代码中根据ActorSystem绑定了一个Inbox 接着使用邮箱监视MyWorker 这样就能在MyWoker停止后得到一个消息通知在45-47行通过邮箱向MyWoker发送消息
第48到59行进行消息接受如果发现MyWorker已经停止工作则关闭整个ActorSystem

7.8 消息路由

Akka提供了非常灵活的消息发送机制有时候我们也许会使用一组Actor而不是一个Actor来提供一项服务这一组Actor组中的所有Actor都是对等的也就是说你可以找任何一个Actor来为你服务在这种情况下为了快速有效的找到合适的Actor 或者说如何更为合理调度这些消息才可以使负载均衡地分配在这一组Actor

为了解决这个问题 Akka使用了一个路由器组件（Router)来封装消息的调度系统提供了几种消息路由策略比如轮训选择Actor进行消息发送
随机消息发送将消息发送给最为空闲的Actor 甚至在组内广播消息

WatchActor.java
在上面的代码中定义了路由器组件Router 在构造Router时需要指定路由策略和一组被路由的Actor(Routee) 这里使用了RoundRobinRoutingLogic路由策略也就是对所有的Routee进行轮询消息发送在本例中 Routee是由5个MyWorker Actor构成

当有消息需要传递给这5个MyWorker时只需要将消息投递给这个Router即可 Router就会根据给定的消息路由策略进行消息投递当一个MyWorker停止工作时还可以简单地从其将工作组移出在这里如果发现没有可用的Actor 就会直接关闭系统

主函数如下：
RouteMain.java

除了RoundRobinRoutingLogic外还可以尝试BroadcastRoutingLogic广播策略 RandomRoutingLogic随机投递策略，SmallestMailBoxRoutingLogic空闲Actor优先投递策略

7.9 Actor的内置状态转换

在很多场景下 Actor的业务逻辑可能比较复杂
Actor可能需要根据不同的状态对同一条消息作出不同的处理 Akka已经为我们考虑到了这一点
一个Actor内部消息处理函数可以拥有多个不同的状态在特定的状态下可以对同一消息进行不同的处理状态之间也可以任意切换

下面模拟一个婴儿作为例子
BabyActor.java
在上述代码中使用了become()方法用于切换Actor的状态方法become()接受一个Procedure参数 Procedure在这里可以表示一种Actor的状态同时更重要的是它封装了在这种状态下的消息处理逻辑

在上面这个例子中定义了俩种Prodcedure 一种是angry 另外一个是happy
在初始状态下 BabyActor没有开心也没有生气因此angry处理函数和happy处理函数都不会工作当BabyActor接受到消息时会用onReceive()方法来处理这个消息

在onReceive（）函数中当处理SLEEP消息时就会切换当前Actor为angry 如果是play消息则切换状态为happy

一旦完成状态切换当后续有新的消息送达时就不会再由onReceive()处理了由于angry和happy都是消息处理函数因此后续的消息就直接交由当前状态处理从而很好地封装了Actor的多个不同处理逻辑

由此可见 Akka为Actor提供了灵活的状态切换机制处于不同状态的Actor可以绑定不同的消息处理函数进行消息处理
这对构造结构化应用有着重要的帮助

7.10 询问模式：Actor中的Future

由于Actor之间都是异步消息通信的当你发送一条消息给一个Actor后你通常只能等待Actor的返回与与同步方法不同在你发送异步消息后接受消息的Actor 可能还根本来不及处理你的消息而调用方已经返回了
这种模式与我们之间提到的Future模式非常相像不同之处只是在传统的异步调用中我们进行的是函数调用但是在这里我们发送了一条消息

AskMain.java
上述代码给出了俩处在Actor交互中使用Future的例子

上述代码使用aks()方法给worker发送消息方法ask()不会等待worker处理会立即返回一个Future对象
在第34行使用Await方法等待worker的返回接着在35行打印结果

在这种方法中我们间接的将一个异步调用转为同步阻塞调用虽然比较容易理解但是在有些场合可能会出现性能问题另外一种更有效的方法是使用pipe()函数

38行再次使用ask()方法询问worker 并传递数值6给worker 接着不进行等待而是使用pipe()函数将这个future重定向到另外一个称为printer的actor pipe()函数不会阻塞程序运行会立即返回

7.11 多个Actor同时修改数据：Agent

在实际开发中很难避免多个Actor需要访问同一个共享变量的情况

在Akka中使用Agent的组件来实现这个功能一个Agent提供了一个变量的异步更新当一个Actor希望改变Agent的值时它就会向这个Agent下发一个动作当多个Actor同时改变Agent时这些action将会在ExecutionContext中并发调度执行在任意时刻一个Agent最多只能执行一个action 对于某一个线程来说它执行action的顺序与它的发生顺序一致但对于不同线程来说这些action可能会交织在一起
Agent的修改可以使用俩个方法send()或者alter() 它们都可以向Agent发送一个修改动作但是send（）方法没有返回值而alter()方法会返回一个Future对象便于跟踪Agent的执行

CounterActor.java
上述代码定义了一个累加的Actor 在12-17行定义了累计动作action addMapper 它的作用就是对Agent的值进行修改这里简单的加1

CounterActor的消息处理函数onReceive()中对全局的counterAgent进行累加操作 alter()指定了累加动作addMapper 由于我们希望在将来知道累加行为是否完成因此在这里将返回的Future对象进行收集完成任务后 Actor自行退出

程序的主函数如下
AgentDemo.java

上述代码中创建了10个CounterActor对象在27-31行使用Inbox与CounterActor进行通信第29行将触发CounterActor进行累加操作第35到45行将等待所有10个CounterAcotr运行结束执行完成后我们便已经收集了所有的future 在第47行将所有的Future进行串行组合(使用sequence（）方法）构造了一个整体的Future 并为它创建onCompete()回调函数在所有的Agent操作执行完成后 onComplete()方法就会被调用在这个例子中我们简单地输出最终的counterAgent的值

7.12 像数据库一样操作内存数据：软件事务内存

在一些函数式编程语言中支持一种叫做软件事务内存（STM）的技术什么是软件事务内存？这里的事务和数据库说的事务非常相似具有隔离性原子性和一致性与数据库事务不同的是内存事务不具备持久性（很显然内存数据不会保存下来）

在很多场合某一项工作可能要由多个Actor协作完成在这种协作事务中如果一个Actor处理失败根据事务的原子性其他Actor所进行的操作必须要进行回滚
下面来看是如何启动一个内存事务的：
STMDemo.java
这里新建了一个Coordinated协调者并且将这个协调者当做消息发送给company 当company收到这个协调者消息后自动成为这个事务的第一个成员
下面是代表公司账户的Actor
CompanyActor.java
首先判断是不是Coordinated 如果是Coordinated 则表示这是一个新事物的开始则表示这是一个新事物的开始接着
将调用Coordinated.coordinate()方法将employee也加入到当前事务中这样这个事务中就有俩个参与者了

调用了Coordinated.atomic()定义了原子执行块作为这个事务的一部分在这个执行块中对公司账户进行余额调整

作为转账接收方的雇员账户如下：
EmployeeActor.java
上述代码中判断消息是否为Coordinated 如果是Coordinated 则当前Actor会自动加入Coordinated指定的事务

在这里俩个Actor都已经加入到同一个协调事务Coordinated中了因此当公司账户出现异常后雇员账户的余额就会回滚

7.13 一个有趣的粒子：并发粒子群的实现

粒子群算法（PSO）是一种进化算法它与大名鼎鼎的遗传算法非常相似可以用来解决一些优化问题

粒子群优化的具体解释注意wiki百科中文内容需要翻墙阅读

7.13.3 粒子群算法能做什么

粒子群算法应用族多的场景就是进行最优化计算实际上以粒子群算法为代表的进化算法可以说最优化方法中的通用方法几乎一切最优化问题都可以通过这种随机搜索的模式解决其成本低难度小效果好因此颇受欢迎
下面就是有一个典型优化的问题

假设有400万资金要求4年用完若存在第一年使用x万元则可以得到效益√x万元（效益不能再使用）当年不用的资金可存入银行年利率为10% 尝试制定出资金的使用规划使4年效益最大

很明显对于此类问题不同的方案得到结果可能会有很大的差异
如果使用拉格朗日乘子法对方程组求解可以得到第一年使用86.19万第2年使用104.29万第三年使用126.19万第4年使用152.69万为这个问题的最优解总效益达43.09万

由于求解过程过于复杂需要对12个未知数和方程进行联立求解比较难以实现
对于这种问题就是粒子群算法的涉猎范围当使用粒子群算法我们可以先随机给出若干个满足提交的资金规划方案接着根据粒子群的演化公式不断调整各个粒子的位置（粒子的每一个位置都代表一个方案）逐步探索更优的方案

7.13.4 使用Akka实现粒子群

使用Actor的模式与粒子群算法之间有天生契合度粒子群算法由于涉及到多个甚至是极其大量的粒子参与运算因此它隐含着并行计算的模式其次从直观上我们也可以知道粒子群算法的求解精度或者说求解的质量与参与运算的例子有着直接的关系很显然参与运算的粒子数量越多得到的解自然也就够精确

如果采用传统的多线程的方式实现粒子群一个最大的问题就是线程数量的可能是非常有限的在当前这种应用场景中我们希望可以有数万甚至数十万的粒子但是一台计算机开启数万的线程是不可能的就是可以系统的效率也会非常的低因此使用多线程的模型无法很好地和粒子群的实现相融合

但Akka的actor不同由于多个Actor可以复用一个线程而Actor本身作为轻量级的并发执行单元可以有极其大量的存在因此我们就可以使用Actor来模拟整个粒子群计算的场景

Akka实现PSO代码

代码本身没有什么特别需要说明的地方
首先是俩个表示pBest和gBest的消息类型用于多个Actor之间传递个体最优和全局最优

其次在PsoValue中主要包括俩个信息第一是表示投资规划的方案即每一年分别需要投资多少钱第二是这个投资方案的总收益
在Fitness中的fitness()函数返回了给定投资方案的适应度适应度也就是投资的收益我们自然应该更倾向于选择适应度更高的投资方案

Bird就是基本粒子

MasterBird是用来管理和通知全局全优的

第一章 走入并行世界