为什么阿里巴巴要禁用 Executors 创建线程池?

2019 年 11 月 18 日 ImportNew

(给ImportNew加星标,提高Java技能)

转自:掘金,作者:何甜甜在吗

juejin.im/post/5dc41c165188257bad4d9e69


看阿里巴巴开发手册并发编程这块有一条:线程池不允许使用Executors去创建,而是通过ThreadPoolExecutor的方式,通过源码分析禁用的原因


写在前面


首先感谢大家在盖楼的间隙阅读本篇文章,通过阅读本篇文章你将了解到:


  • 线程池的定义

  • Executors创建线程池的几种方式

  • ThreadPoolExecutor对象

  • 线程池执行任务逻辑和线程池参数的关系

  • Executors创建返回ThreadPoolExecutor对象

  • OOM异常测试

  • 如何定义线程池参数


如果只想知道原因可以直接拉到总结那


线程池的定义


管理一组工作线程。通过线程池复用线程有以下几点优点:


  • 减少资源创建 => 减少内存开销,创建线程占用内存

  • 降低系统开销 => 创建线程需要时间,会延迟处理的请求

  • 提高稳定稳定性 => 避免无限创建线程引起的OutOfMemoryError【简称OOM】


Executors创建线程池的方式


根据返回的对象类型创建线程池可以分为三类:


  • 创建返回ThreadPoolExecutor对象

  • 创建返回ScheduleThreadPoolExecutor对象

  • 创建返回ForkJoinPool对象


本文只讨论创建返回ThreadPoolExecutor对象


ThreadPoolExecutor对象


在介绍Executors创建线程池方法前先介绍一下ThreadPoolExecutor,因为这些创建线程池的静态方法都是返回ThreadPoolExecutor对象,和我们手动创建ThreadPoolExecutor对象的区别就是我们不需要自己传构造函数的参数。


ThreadPoolExecutor的构造函数共有四个,但最终调用的都是同一个:


public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)


构造函数参数说明:


  • corePoolSize => 线程池核心线程数量

  • maximumPoolSize => 线程池最大数量

  • keepAliveTime => 空闲线程存活时间

  • unit => 时间单位

  • workQueue => 线程池所使用的缓冲队列

  • threadFactory => 线程池创建线程使用的工厂

  • handler => 线程池对拒绝任务的处理策略


线程池执行任务逻辑和线程池参数的关系



执行逻辑说明:


  • 判断核心线程数是否已满,核心线程数大小和corePoolSize参数有关,未满则创建线程执行任务

  • 若核心线程池已满,判断队列是否满,队列是否满和workQueue参数有关,若未满则加入队列中

  • 若队列已满,判断线程池是否已满,线程池是否已满和maximumPoolSize参数有关,若未满创建线程执行任务

  • 若线程池已满,则采用拒绝策略处理无法执执行的任务,拒绝策略和handler参数有关


Executors创建返回ThreadPoolExecutor对象


Executors创建返回ThreadPoolExecutor对象的方法共有三种:


  • Executors#newCachedThreadPool => 创建可缓存的线程池

  • Executors#newSingleThreadExecutor => 创建单线程的线程池

  • Executors#newFixedThreadPool => 创建固定长度的线程池


Executors#newCachedThreadPool方法


public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}


CachedThreadPool是一个根据需要创建新线程的线程池


  • corePoolSize => 0,核心线程池的数量为0

  • maximumPoolSize => Integer.MAX_VALUE,可以认为最大线程数是无限的

  • keepAliveTime => 60L

  • unit => 秒

  • workQueue => SynchronousQueue


当一个任务提交时,corePoolSize为0不创建核心线程,SynchronousQueue是一个不存储元素的队列,可以理解为队里永远是满的,因此最终会创建非核心线程来执行任务。对于非核心线程空闲60s时将被回收。因为Integer.MAX_VALUE非常大,可以认为是可以无限创建线程的,在资源有限的情况下容易引起OOM异常


Executors#newSingleThreadExecutor方法


public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}


SingleThreadExecutor是单线程线程池,只有一个核心线程


  • corePoolSize => 1,核心线程池的数量为1

  • maximumPoolSize => 1,只可以创建一个非核心线程

  • keepAliveTime => 0L

  • unit => 毫秒

  • workQueue => LinkedBlockingQueue


当一个任务提交时,首先会创建一个核心线程来执行任务,如果超过核心线程的数量,将会放入队列中,因为LinkedBlockingQueue是长度为Integer.MAX_VALUE的队列,可以认为是无界队列,因此往队列中可以插入无限多的任务,在资源有限的时候容易引起OOM异常,同时因为无界队列,maximumPoolSize和keepAliveTime参数将无效,压根就不会创建非核心线程


Executors#newFixedThreadPool方法

public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}


FixedThreadPool是固定核心线程的线程池,固定核心线程数由用户传入


  • corePoolSize => 1,核心线程池的数量为1

  • maximumPoolSize => 1,只可以创建一个非核心线程

  • keepAliveTime => 0L

  • unit => 毫秒

  • workQueue => LinkedBlockingQueue

  • 它和SingleThreadExecutor类似,唯一的区别就是核心线程数不同,并且由于使用的是LinkedBlockingQueue,在资源有限的时候容易引起OOM异常


总结:


FixedThreadPool和SingleThreadExecutor => 允许的请求队列长度为Integer.MAX_VALUE,可能会堆积大量的请求,从而引起OOM异常

CachedThreadPool => 允许创建的线程数为Integer.MAX_VALUE,可能会创建大量的线程,从而引起OOM异常


这就是为什么禁止使用Executors去创建线程池,而是推荐自己去创建ThreadPoolExecutor的原因


OOM异常测试


理论上会出现OOM异常,必须测试一波验证之前的说法:


测试类:TaskTest.java


public class TaskTest {
public static void main(String[] args) {
ExecutorService es = Executors.newCachedThreadPool();
int i = 0;
while (true) {
es.submit(new Task(i++));
}
}
}


使用Executors创建的CachedThreadPool,往线程池中无限添加线程在启动测试类之前先将JVM内存调整小一点,不然很容易将电脑跑出问题【别问我为什么知道,是铁憨憨甜没错了!!!】,在idea里:Run -> Edit Configurations



JVM参数说明:


  • -Xms10M => Java Heap内存初始化值

  • -Xmx10M => Java Heap内存最大值


运行结果:


Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "main"
Disconnected from the target VM, address: '127.0.0.1:60416', transport: 'socket'


创建到3w多个线程的时候开始报OOM错误


另外两个线程池就不做测试了,测试方法一致,只是创建的线程池不一样


如何定义线程池参数


CPU密集型 => 线程池的大小推荐为CPU数量 + 1,CPU数量可以根据Runtime.availableProcessors方法获取


IO密集型 => CPU数量 * CPU利用率 * (1 + 线程等待时间/线程CPU时间)


混合型 => 将任务分为CPU密集型和IO密集型,然后分别使用不同的线程池去处理,从而使每个线程池可以根据各自的工作负载来调整


阻塞队列 => 推荐使用有界队列,有界队列有助于避免资源耗尽的情况发生


拒绝策略 => 默认采用的是AbortPolicy拒绝策略,直接在程序中抛出RejectedExecutionException异常【因为是运行时异常,不强制catch】,这种处理方式不够优雅。处理拒绝策略有以下几种比较推荐:


  • 在程序中捕获RejectedExecutionException异常,在捕获异常中对任务进行处理。针对默认拒绝策略

  • 使用CallerRunsPolicy拒绝策略,该策略会将任务交给调用execute的线程执行【一般为主线程】,此时主线程将在一段时间内不能提交任何任务,从而使工作线程处理正在执行的任务。此时提交的线程将被保存在TCP队列中,TCP队列满将会影响客户端,这是一种平缓的性能降低

  • 自定义拒绝策略,只需要实现RejectedExecutionHandler接口即可

  • 如果任务不是特别重要,使用DiscardPolicy和DiscardOldestPolicy拒绝策略将任务丢弃也是可以的


如果使用Executors的静态方法创建ThreadPoolExecutor对象,可以通过使用Semaphore对任务的执行进行限流也可以避免出现OOM异常。


推荐阅读

(点击标题可跳转阅读)

Executor, ExecutorService 和 Executors 间的不同

7 个显著提升编码效率的 IntelliJ IDEA 必备插件

深入分析 Session 和 Cookie


看完本文有收获?请转发分享给更多人

关注「ImportNew」,提升Java技能

好文章,我在看❤️

登录查看更多
0

相关内容

阿里巴巴集团于1999年创立,阿里巴巴集团子公司及关联公司有:阿里巴巴网络有限公司、淘宝网、淘宝商城(天猫)、一淘、支付宝、阿里云计算、中国雅虎等。
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
105+阅读 · 2020年5月3日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
65+阅读 · 2020年3月9日
TensorFlow Lite指南实战《TensorFlow Lite A primer》,附48页PPT
专知会员服务
68+阅读 · 2020年1月17日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
【干货】大数据入门指南:Hadoop、Hive、Spark、 Storm等
专知会员服务
94+阅读 · 2019年12月4日
tf.GradientTape 详解
TensorFlow
118+阅读 · 2020年2月21日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
29+阅读 · 2019年7月6日
面试题:Word2Vec中为什么使用负采样?
七月在线实验室
46+阅读 · 2019年5月16日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
10道题,测一测你的AI水平到底如何
七月在线实验室
8+阅读 · 2018年7月17日
为什么你应该学 Python ?
计算机与网络安全
4+阅读 · 2018年3月24日
[DLdigest-8] 每日一道算法
深度学习每日摘要
4+阅读 · 2017年11月2日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
A Sketch-Based System for Semantic Parsing
Arxiv
4+阅读 · 2019年9月12日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Arxiv
8+阅读 · 2019年5月20日
Arxiv
4+阅读 · 2018年10月31日
Knowledge Based Machine Reading Comprehension
Arxiv
4+阅读 · 2018年9月12日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
23+阅读 · 2017年3月9日
VIP会员
相关资讯
tf.GradientTape 详解
TensorFlow
118+阅读 · 2020年2月21日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
29+阅读 · 2019年7月6日
面试题:Word2Vec中为什么使用负采样?
七月在线实验室
46+阅读 · 2019年5月16日
一文看懂怎么用 Python 做数据分析
大数据技术
23+阅读 · 2019年5月5日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
10道题,测一测你的AI水平到底如何
七月在线实验室
8+阅读 · 2018年7月17日
为什么你应该学 Python ?
计算机与网络安全
4+阅读 · 2018年3月24日
[DLdigest-8] 每日一道算法
深度学习每日摘要
4+阅读 · 2017年11月2日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
相关论文
A Sketch-Based System for Semantic Parsing
Arxiv
4+阅读 · 2019年9月12日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Arxiv
8+阅读 · 2019年5月20日
Arxiv
4+阅读 · 2018年10月31日
Knowledge Based Machine Reading Comprehension
Arxiv
4+阅读 · 2018年9月12日
Arxiv
4+阅读 · 2018年1月15日
Arxiv
23+阅读 · 2017年3月9日
Top
微信扫码咨询专知VIP会员