本文转载自:https://blog.csdn.net/u010425776/article/details/56673564
1. 线程池的作用
1、 减少资源的开销;
减少了每次创建线程、销毁线程的开销。
2、 提高响应速度;
每次请求到来时,由于线程的创建已经完成,故可以直接执行任务,因此提高了响应速度。
3、 提高线程的可管理性;
线程是一种稀缺资源,若不加以限制,不仅会占用大量资源,而且会影响系统的稳定性。
因此,线程池可以对线程的创建与停止、线程数量等等因素加以控制,使得线程在一种可控的范围内运行,不仅能保证系统稳定运行,而且方便性能调优。
2. 线程池的实现原理
线程池一般由两种角色构成:多个工作线程 和 一个阻塞队列。
- 工作线程
工作线程是一组已经处在运行中的线程,它们不断地向阻塞队列中领取任务执行。 - 阻塞队列
阻塞队列用于存储工作线程来不及处理的任务。当工作线程都在执行任务时,到来的新任务就只能暂时在阻塞队列中存储。
3. ThreadPoolExecutor的使用
3.1 创建线程池
通过如下代码即可创建一个线程池:
new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, timeUnit, runnableTaskQueue, handler);
- corePoolSize:基本线程数量
它表示你希望线程池达到的一个值。线程池会尽量把实际线程数量保持在这个值上下。 - maximumPoolSize:最大线程数量
这是线程数量的上界。
如果实际线程数量达到这个值:
1、 阻塞队列未满:任务存入阻塞队列等待执行;
2、 阻塞队列已满:调用饱和策略;
- keepAliveTime:空闲线程的存活时间
当实际线程数量超过corePoolSize时,若线程空闲的时间超过该值,就会被停止。
PS:当任务很多,且任务执行时间很短的情况下,可以将该值调大,提高线程利用率。 - timeUnit:keepAliveTime的单位
- runnableTaskQueue:任务队列 ,这是一个存放任务的阻塞队列,可以有如下几种选择:
1、 ArrayBlockingQueue;
它是一个由数组实现的阻塞队列,FIFO。
2、 LinkedBlockingQueue;
它是一个由链表实现的阻塞队列,FIFO。
吞吐量通常要高于ArrayBlockingQueue。
fixedThreadPool使用的阻塞队列就是它。
它是一个无界队列。
3、 SynchronousQueue;
它是一个没有存储空间的阻塞队列,任务提交给它之后必须要交给一条工作线程处理;如果当前没有空闲的工作线程,则立即创建一条新的工作线程。
cachedThreadPool用的阻塞队列就是它。
它是一个无界队列。
4、 PriorityBlockingQueue;
它是一个优先权阻塞队列。
- handler:饱和策略
当实际线程数达到maximumPoolSize,并且阻塞队列已满时,就会调用饱和策略。
JDK1.5由四种饱和策略:
1、 AbortPolicy;
默认,直接抛异常。
2、 CallerRunsPolicy;
只用调用者所在的线程执行任务。
3、 DiscardOldestPolicy;
丢弃任务队列中最久的任务。
4、 DiscardPolicy;
丢弃当前任务。
3.2 提交任务
可以向ThreadPoolExecutor提交两种任务:Callable和Runnable。
1、 Callable;
该类任务有返回结果,可以抛出异常。
通过submit函数提交,返回Future对象。
可通过get获取执行结果。
2、 Runnable;
该类任务只执行,无法获取返回结果,并在执行过程中无法抛异常。
通过execute提交。
3.3 关闭线程池
关闭线程池有两种方式:shutdown和shutdownNow,关闭时,会遍历所有的线程,调用它们的interrupt函数中断线程。但这两种方式对于正在执行的线程处理方式不同。
1、 shutdown();
仅停止阻塞队列中等待的线程,那些正在执行的线程就会让他们执行结束。
2、 shutdownNow();
不仅会停止阻塞队列中的线程,而且会停止正在执行的线程。
3.4 ThreadPoolExecutor运行机制
当提交一个新任务到线程池时,线程池的处理流程如下。
1、 线程池判断核心线程池里的线程是否都在执行任务如果不是,则创建一个新的工作线程来执行任务如果核心线程池里的线程都在执行任务,则进入下个流程;
2、 线程池判断工作队列是否已经满如果工作队列没有满,则将新提交的任务存储在这个工作队列里如果工作队列满了,则进入下个流程;
3、 线程池判断线程池的线程是否都处于工作状态如果没有,则创建一个新的工作线程来执行任务如果已经满了,则交给饱和策略来处理这个任务;
ThreadPoolExecutor执行execute()方法的示意图:
当有请求到来时:
1、 若当前实际线程数量少于corePoolSize,即使有空闲线程,也会创建一个新的工作线程;
2、 若当前实际线程数量处于corePoolSize和maximumPoolSize之间,并且阻塞队列没满,则任务将被放入阻塞队列中等待执行;
3、 若当前实际线程数量小于maximumPoolSize,但阻塞队列已满,则直接创建新线程处理任务;
4、 若当前实际线程数量已经达到maximumPoolSize,并且阻塞队列已满,则使用饱和策略调用RejectedExecutionHandler的rejectedExecution()方法;
线程池中的线程执行任务分两种情况:
1、 在execute()方法中创建一个线程时,会让这个线程执行当前任务;
2、 这个线程执行完上图中1的任务后,会反复从BlockingQueue获取任务来执行;
ThreadPoolExecutor中线程执行任务的如图所示:
4. 设置合理的线程池大小
任务一般可分为:CPU密集型、IO密集型、混合型,对于不同类型的任务需要分配不同大小的线程池。
- CPU密集型任务
尽量使用较小的线程池,一般为CPU核心数+1。
因为CPU密集型任务使得CPU使用率很高,若开过多的线程数,只能增加上下文切换的次数,因此会带来额外的开销。 - IO密集型任务
可以使用稍大的线程池,一般为2*CPU核心数。
IO密集型任务CPU使用率并不高,因此可以让CPU在等待IO的时候去处理别的任务,充分利用CPU时间。 - 混合型任务
可以将任务分成IO密集型和CPU密集型任务,然后分别用不同的线程池去处理。
只要分完之后两个任务的执行时间相差不大,那么就会比串行执行来的高效。
因为如果划分之后两个任务执行时间相差甚远,那么先执行完的任务就要等后执行完的任务,最终的时间仍然取决于后执行完的任务,而且还要加上任务拆分与合并的开销,得不偿失。