提升Android下内存的使用意识和排查能力

2017 年 10 月 27 日 云栖社区 霍迪尼

内存问题一直是大型App的开发人员比较头痛的问题,特别是像手淘这种超级的App,App中到处都是带有图片和视频的界面,而且这些功能都是由不同的团队甚至不同的事业部开发的,要整体上去管控和排查内存的问题变得相当的复杂。


之前,我们多个线上版本都存在着严重的Activity等内存泄漏和不合理内存使用。这不是偶然,一个很重要的原因就是我们很多的开发测试人员侧重业务开发,忽略内存和性能,而且没有站在全局性的角度去考虑资源的使用。


认为我自己的模块多缓存一些就会加快速度,以空间换时间看似正确,但是在手淘这样的超级App中是不可取的,需要严格限制,否则不要说里面几百个模块,有几十个模块这样来做,其结果都会是灾难性的,不但没有加快速度,反而会拖慢速度以及带来很多稳定性问题。


经过一年多的更新,现在的Android Studio所带的工具已经相当的成熟。

以前我们还停留在使用MAT来分析内存,但是现在Android Studio的内存分析工具已经相当的强大,已经完全可以抛开MAT来实现更为直观的内存检测。

我想,作为一个大型App的开发人员和测试人员,掌握这些技能都是必不可少的,也是提高整个App质量的关键所在。


在使用工具分析内存之前,我们需要了解一下内存回收上的一些策略,否则很多时候排查到的可能都不是真正的问题。


1、没有强引用不代表这块内存就会马上回收


我们知道,Java的内存回收如果有强引用存在,那么这个对象的内存不会回收。


那么这个对象的引用如果不存在,是不是这块内存就会回收呢?


答案是否定的,VM有自己的回收策略,不会因为一个对象的引用为空了就立马对它进行回收。也就是说,回收策略需要达到一定的触发阈值。我们可以看一个Demo,写如下的分配对象的方法:



在内存充足的情况下,我们点击按钮4次,执行了4遍该函数,这个时候可以看到堆内存呈现了4次增长。如下图所示:



静置在那半个小时,内存仍然会维持现状,VM并不会来执行实际的GC。我们可以Dump内存看看内存中的对象:



我们可以看到,4000个ImageView对象仍然毫发无损的在内存中残留,系统没有回收其内存。


不管是Dalvik还是ART环境,包括最新的Android N,都可能出现这样的情况,具体是否每次都保持(等量)增长等还要看手机内存剩余情况和手机的GC策略。


所以,我们在检测内存占用或者内存泄漏之前,一定要执行工具自带的GC触发功能,否则结果会不准确。


明明没有泄漏或者没有占用,而Dump出来的堆中提示占用很大或者泄漏。


通过Memory Monitor工具,我们可以看到其引用的情况。

点击其中一个ImageView,我们看下它的引用情况:



可以看到,其引用路径是被一个FinalizerReference所持有。

该对象已经标记为红色,表明我们自己的代码中已经没有其他引用持有该对象,状态是等待被回收。


通过手动触发GC,我们可以来主动回收这块内存,点击如下图所示的按钮,触发GC。



当然,这里还有一个问题存在,因为刚才创建的属于Finalizer对象,该对象前面的文章已经分析过,需要至少两次GC才能真正回收其内存。所以,第一次触发GC的时候,我们可以看一下内存的变化。



第一次触发GC后,内存只是部分的下降,这个时候Finalize链表中的对象被回收,但是ImageView还没有回收(在不同Rom和Android 版本下可能会存在少许差异,在Dalvik下的差异会更大一些)。我们可以看一下堆内存:



该对象的引用链路全部标记为红色,已经没有强引用指向该对象,刚才的FinalizerReference已经执行了清理。


但是第一次GC只是执行了Finalizer清理,而没有真正的回收这部分对象。所以还需要再一次的触发GC,再次执行GC后,我们可以看到堆内存下降,这些对象被回收了。



我们可以通过Dump堆内存来验证是否已经回收,如下图所示,对内存中已经没有了刚才的ImageView对象,确实已经被回收了。



通过前面的分析我们可以知道,并不是引用释放了,内存就会回收。

在实际使用手机淘宝的过程中,我们也可以观察堆内存的变化,在退出一个界面的时候很可能是不会有GC的,堆内存不会变化。


如果这个时候用MAT工具去Dump内存,那结果很多是不够正确的。

而如果后续再做其他操作,引发GC后,才会使得结果更加准确,当然我们可以手动的去触发GC。


2、调用GC时的策略变化


在前面的文章中已经提到过,代码调用GC,只是告诉VM需要GC,但是是否真正的去执行GC还是要看VM的配置和是否达到阈值。


前面也提到,在执行手动GC的时候,Dalvik和ART下会有比较明显的差异。Android 5.0开始增加了更多的GC方式,到了6.0,7.0在GC方面有了更多的优化。


特别是在执行Finalizer对象方面,Android 5.0开始回收就没有那么快,单次执行GC,并不会导致失去引用的Finalizer对象进行完全回收,如果要更好的回收Finalizer对象,需要执行System.runFinalization()方法来强制回收Finalizer对象。


我们将测试代码后面加上主动调用GC的代码,如下:



在不同的Android版本上看下执行效果,点击按钮执行多次。

在Android 4.4.4版本的设备上,内存基本已经回收,如果将1000次修改为10次,偶尔可以看到有ImageView已经没有引用存在,但是仍然没有回收。如下图所示:



从这里可以看出来,在该版本下,大部分的对象在没有强引用后,调用System.gc()就会被回收。


我们再看下ART上的情况,在ART下,却发生了不一致的表现。在调用后没有进行GC。


查看堆内存,我们也可以看到,4000个ImageView仍然存在,并未执行GC。



看来在ART后,这部分的GC策略做了调整,System.gc()没有内存回收。我们可以看下源码,在Android 4.4.4下的源码:



我们可以看到,在调用gc函数后,直接调用了运行时的gc。再来看下5.0上的代码:



从源码我们可以发现,System.gc()函数,已经有了变化,从5.0开始,多了一些判断条件。


是否执行gc,是依赖于justRanFinalization变量,而变量justRanFinalization在runFinalization后才会变为true。


也就是说,直接调用System.gc()方法并没有调用Runtime.getRuntime().gc(),只是做了一个标记将runGC变量设置为true。


在runFinalization函数中,如果标记了runGC的,会先执行一次gc,然后清理Finalizer对象,并标记为依据清理过了Finalizer对象。


这样在下次gc调用的时候,就会真正执行一次gc,以回收Finalizer对象。


在Android ART的设备上,我们将调用gc的方式做下变更:



这里直接调用了Runtime.getRuntime().gc()。这个时候内存回收确实会有变化。


但是Finalizer对象仍然可能存在,在Android 5.0的时候会回收一部分,但是从6.0开始,单次调用gc,Finalizer对象却不一定回收。如下图所示,虽然所有引用链路已经不复存在,但是内存仍然没有回收:



那么执行2次gc是否就都能把内存回收了呢?我们修改下代码:



这里连续2次调用了gc,按理是可以回收Finalizer对象的,但是由于两次调用gc的间隔太短,而Finalizer对象是由专门的线程执行回收的,所以也不一定能完全回收。


这个和线程的调度情况有关系。例如执行上面代码可能出现的结果是部分回收:



如果想要全部回收,可以在中间停顿一些间隔,或者增加System.runFinalization()方法的调用。


这样就能将当前可以回收的内存基本都回收了。我们在Android Studio的触发GC的按钮,也是通过BinderInternal$GcWatcher等代码来执行内存回收的。

当然,在实际的业务代码中,不要主动调用gc,这样可能会导致额外的内存回收开销,在检测代码中,如果需要检测内存,最好按照gc,runFinalization,gc的顺序去回收内存后,再做内存的Dump分析。


3、使用Android Studio的Memory分析内存占用


Memory Monitor工具比起MAT一个很大的优势就是可以非常简单的查看内存占用,而且可以迅速找到自己的模块所占用的堆内存,所以希望开发和测试人员都能够迁移到Android Studio所带的工具上来。如何查看内存占用?

真的是非常的简单,而且可以找到很细小的内存占用情况。


例如,这里自定义一个类,然后创建该类,代码如下:



这里只是创建了一个该对象,但是也很容易可以跟踪到该对象的内存情况。

通过Memory Monitor的【Dump Java Heap】按钮可以把当前堆内存显示出来,如下图所示:



这里是默认查看方式,我们可以切换到以包名的形式查看。这样就可以很容易的找到我们自己的代码了。如下所示:



切换查看方式后,我们可以很容易的就找到自己所写的代码内存占用情况。这里可以看到实例的个数,占用内存的大小等情况。


例如在打开手机淘宝,简单操作一会后再来观察内存占用情况。按照包名查看后,我们很容易就可以看到整个堆内存的占用情况,如下图所示:



通过上图我们很容易看到,在com.taobao包名下占用了近240多M的内存。

继续往下看,聚划算模块,图片库模块占了大头。点击ju模块,展开后,又可以看到该包名下的内存占用:




通过上图我们可以清晰的看到,在ju包名下的内存分布情况。


所以,在内存占用的检查上,Android Studio已经给我们提供了强大的工具,各个开发和测试人员已经可以很简单的查看到自己开发的模块占据的内存大小,然后对内存的使用做一些改进等措施。

这里也可以通过右侧的Instance窗口检查各个实例的引用以及排查不合理的内存强制占用。


4、排查内存泄漏


Memory Dump下来后,我们可以检查Java堆的Activity内存泄漏和重复的String。


很多人还习惯于MAT分析工具,其实Memory Monitor已经包含了这个功能,而且使用非常简单。


首先dump内存,如前面分析的那样,在右侧可以看到【Analyzer Tasks】按钮。



然后,我们点击该按钮,就可以看到分析泄漏的工具。



这里可以只勾选 检测泄漏Activity选项,然后选择执行。这样就可以看到泄漏的Activity了。



通过引用指向,我们可以比较容易的判断出不该持有的强引用关系,而且该工具从上到下的排序,已经做了初步的判断。

当然在检测泄漏和占用之前,需要点击2次GC的按钮,这样结果才会相对准确。


对于Android Studio提供的内存分析工具,使用起来非常简单,会比Mat工具要快捷,排查问题也更加容易。

所以Android的开发和测试人员,应该尽可能的都迁移到该工具上来,并能够熟练的掌握内存分析工具,这样才能让自己开发的模块质量更加的优秀。


以上主要是针对Android Studio 2中的使用方式,在今年的Android Studio 3 Preview版本中,内存这块的分析工具更加强大,可以在面板上直接看到更细粒度的内存占用,不仅仅是Java的对内存了。



对于需要更细粒度和更全面的分析一些内存的细节,本文所涉及的内存知识还是不够的,还需要了解Linux下的内存机制以及Android下的一些内存机制,例如按页分配,共享内存,GPU内存等等。


作者:霍迪尼,手机淘宝技术专家,擅长解决Android客户端性能内存等相关问题。搭建了手淘及集团主要Android客户端的性能度量和检测体系。


往期精彩文章

0. 机器学习必备手册

1. MongoDB进阶之路:不仅仅是技术研究,还有优化和最佳实践

2.【沉淀】迁移、Insert和写入性能——数十倍提升,阿里王骞谈经历和收获

3. 如何在三年内快速成长为一名技术专家

4. 如何打造千万级Feed流系统

5.《阿里巴巴Java开发规约》IDEA插件与Eclipse插件使用指南


-END-

云栖社区

ID:yunqiinsight

云计算丨互联网架构丨大数据丨机器学习丨运维


登录查看更多
0

相关内容

Google 在2013年 I/O大会上推出的基于 IntelliJ IDEA的官方Android集成开发环境。
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
56+阅读 · 2020年6月26日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
96+阅读 · 2020年6月3日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
34+阅读 · 2020年4月5日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
PC微信逆向:两种姿势教你解密数据库文件
黑客技术与网络安全
16+阅读 · 2019年8月30日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
数据库之架构:主备+分库?主从+读写分离?
架构文摘
8+阅读 · 2019年4月23日
使用 C# 和 Blazor 进行全栈开发
DotNet
6+阅读 · 2019年4月15日
浅谈浏览器 http 的缓存机制
前端大全
6+阅读 · 2018年1月21日
Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算
A Survey on Bayesian Deep Learning
Arxiv
60+阅读 · 2020年7月2日
Arxiv
34+阅读 · 2019年11月7日
Arxiv
17+阅读 · 2019年4月5日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
6+阅读 · 2018年5月18日
Arxiv
8+阅读 · 2018年2月23日
Arxiv
6+阅读 · 2018年2月7日
VIP会员
相关VIP内容
【2020新书】使用高级C# 提升你的编程技能,412页pdf
专知会员服务
56+阅读 · 2020年6月26日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
96+阅读 · 2020年6月3日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
34+阅读 · 2020年4月5日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
相关资讯
在K8S上运行Kafka合适吗?会遇到哪些陷阱?
DBAplus社群
9+阅读 · 2019年9月4日
PC微信逆向:两种姿势教你解密数据库文件
黑客技术与网络安全
16+阅读 · 2019年8月30日
浅谈 Kubernetes 在生产环境中的架构
DevOps时代
11+阅读 · 2019年5月8日
数据库之架构:主备+分库?主从+读写分离?
架构文摘
8+阅读 · 2019年4月23日
使用 C# 和 Blazor 进行全栈开发
DotNet
6+阅读 · 2019年4月15日
浅谈浏览器 http 的缓存机制
前端大全
6+阅读 · 2018年1月21日
Spark的误解-不仅Spark是内存计算,Hadoop也是内存计算
相关论文
A Survey on Bayesian Deep Learning
Arxiv
60+阅读 · 2020年7月2日
Arxiv
34+阅读 · 2019年11月7日
Arxiv
17+阅读 · 2019年4月5日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
7+阅读 · 2018年11月29日
Arxiv
6+阅读 · 2018年5月18日
Arxiv
8+阅读 · 2018年2月23日
Arxiv
6+阅读 · 2018年2月7日
Top
微信扫码咨询专知VIP会员