【iOS】OC底层系列十八 - 性能优化

面试题1:你在项目中是怎么优化内存的?

面试题2:优化你是从哪几方面着手?

面试题3:列表卡顿的原因可能有哪些?你平时是怎么优化的?

面试题4:遇到tableView卡顿嘛?会造成卡顿的原因大致有哪些?

一、CPU和GPU

在屏幕成像的过程中,CPU和GPU起着至关重要的作用。

  • CPU(Central Processing Unit,中央处理器):对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码、图像的绘制(Core Graphics)等。
  • GPU(Graphics Processing Unit,图形处理器):纹理的渲染。

CPU把数据计算出来给到GPU,GPU负责把数据渲染到帧缓存中(在iOS中是双缓冲机制,有前帧缓存、后帧缓存),然后由视频控制器读取帧缓存中的缓存数据,最终显示到屏幕上。

双缓冲虽然能解决效率问题,但会引入一个新的问题。当视频控制器还未读取完成时,即屏幕内容刚显示一半时,GPU 将新的一帧内容提交到帧缓冲区并把两个缓冲区进行交换后,视频控制器就会把新的一帧数据的下半段显示到屏幕上,造成画面撕裂现象。

为了解决这个问题,GPU 通常有一个机制叫做垂直同步(简写也是 V-Sync),当开启垂直同步后,GPU 会等待显示器的 VSync 信号发出后,才进行新的一帧渲染和缓冲区更新。这样能解决画面撕裂现象,也增加了画面流畅度,但需要消费更多的计算资源,也会带来部分延迟。

二、卡顿优化

界面卡顿的原因以及优化方案强烈推荐强烈推荐强烈推荐http://blog.ibireme.com/2015/11/12/smooth_user_interfaces_for_ios/(iOS 保持界面流畅的技巧 — 作者YYKit)。

2.1. 卡顿产生的原因

在 VSync 信号到来后,系统图形服务会通过 CADisplayLink 等机制通知 App,App 主线程开始在 CPU 中计算显示内容,比如视图的创建、布局计算、图片解码、文本绘制等。随后 CPU 会将计算好的内容提交到 GPU 去,由 GPU 进行变换、合成、渲染。随后 GPU 会把渲染结果提交到帧缓冲区去,等待下一次 VSync 信号到来时显示到屏幕上。由于垂直同步的机制,如果在一个 VSync 时间内,CPU 或者 GPU 没有完成内容提交,则那一帧就会被丢弃,等待下一次机会再显示,而这时显示屏会保留之前的内容不变。这就是界面卡顿的原因。

从上面的图中可以看到,CPU 和 GPU 不论哪个阻碍了显示流程,都会造成掉帧现象。所以开发时,也需要分别对 CPU 和 GPU 压力进行评估和优化。

卡顿解决的主要思路:尽可能减少CPU、GPU资源消耗。

按照60FPS的刷帧率,每隔16ms(1s = 1000ms,1000ms/60fps ≈ 16.66ms)左右就会有一次VSync信号。

2.2. 卡顿优化

2.2.1. CPU优化

  • 尽量用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView。
  • 不要频繁地调用UIView的相关属性,比如frameboundstransform等属性,尽量减少不必要的修改。
  • 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性。
  • Autolayout会比直接设置frame消耗更多的CPU资源。
  • 图片的size最好刚好跟UIImageView的size保持一致。
  • 控制一下线程的最大并发数量。
  • 尽量把耗时的操作放到子线程,比如文本处理(尺寸计算、绘制)、图片处理(解码、绘制)。

2.2.2. GPU优化

  • 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示。
  • GPU能处理的最大纹理尺寸是4096x4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸。
  • 尽量减少视图数量和层次。
  • 减少透明的视图(alpha<1),不透明的就设置opaque为YES。
  • 尽量避免出现离屏渲染。

2.2.3. 离屏渲染

在OpenGL中,GPU有2种渲染方式:

  • On-Screen Rendering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作。
  • Off-Screen Rendering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作。

离屏渲染消耗性能的原因

  1. 需要创建新的缓冲区。

  2. 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕。

哪些操作会触发离屏渲染?

  • 光栅化,layer.shouldRasterize = YES
  • 遮罩,layer.mask
  • 圆角,同时设置layer.masksToBounds = YESlayer.cornerRadius大于0
    • 可以通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片来避免离屏渲染
  • 阴影,layer.shadowXXX,如果设置了layer.shadowPath就不会产生离屏渲染

2.3. 卡顿检测

“卡顿”主要是因为在主线程执行了比较耗时的操作。

可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以达到监控卡顿的目的。

三、耗电优化

耗电的主要来源:CPU处理(Processing)、网络(Networking)、定位(Location)、图像(Graphics)。因此可以针对这几个来源进行代码优化。

  • 尽可能降低CPU、GPU功耗

  • 少用定时器

  • 优化I/O操作

    • 尽量不要频繁写入小数据,最好批量一次性写入。
    • 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API。用dispatch_io系统会优化磁盘访问。
    • 数据量比较大的,建议使用数据库(比如SQLiteCoreData)。
  • 网络优化

    • 减少、压缩网络数据。
    • 如果多次请求的结果是相同的,尽量使用缓存。
    • 使用断点续传,否则网络不稳定时可能多次传输相同的内容。
    • 网络不可用时,不要尝试执行网络请求。
    • 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间。
    • 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载。如果下载广告,一次性多下载一些,然后再慢慢展示。如果下载电子邮件,一次下载多封,不要一封一封地下载。
  • 定位优化

    • 如果只是需要快速确定用户位置,最好用CLLocationManagerrequestLocation方法。定位完成后,会自动让定位硬件断电。
    • 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务。
    • 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
    • 需要后台定位时,尽量设置pausesLocationUpdatesAutomaticallyYES,如果用户不太可能移动的时候系统会自动暂停位置更新。
    • 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
  • 硬件检测优化

    • 用户移动、摇晃、倾斜设备时,会产生动作(motion)事件,这些事件由加速度计、陀螺仪、磁力计等硬件检测。在不需要检测的场合,应该及时关闭这些硬件。

四、APP启动优化

APP的启动可以分为2种

  • 冷启动(Cold Launch):从零开始启动APP。
  • 热启动(Warm Launch):APP已经在内存中,在后台存活着,再次点击图标启动APP。

APP启动时间的优化,主要是针对冷启动进行优化:通过添加环境变量可以打印出APP的启动时间分析(Edit scheme -> Run -> Arguments),DYLD_PRINT_STATISTICS设置为1。如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1。

APP的冷启动可以概括为3大阶段:dyld、runtime、main。

dylddynamic link editor):Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等)。

启动APP时,dyld所做的事情有:

  • 装载APP的可执行文件,同时会递归加载所有依赖的动态库。
  • 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步的处理。

runtime:运行时。到此为止,可执行文件和动态库中所有的符号(Class,Protocol,Selector,IMP,…)都已经按格式成功加载到内存中,被runtime 所管理。

启动APP时,runtime所做的事情有:

  • 调用map_images进行可执行文件内容的解析和处理。

  • load_images中调用call_load_methods,调用所有Class和Category的+load方法。

  • 进行各种objc结构的初始化(注册Objc类 、初始化类对象等等)。

  • 调用C++静态初始化器和__attribute__((constructor))修饰的函数。

main:程序入口函数。

APP的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库,并由runtime负责加载成objc定义的结构。所有初始化工作结束后,dyld就会调用main函数,接下来就是UIApplicationMain函数,AppDelegateapplication:didFinishLaunchingWithOptions:方法。

可以针对APP启动的不同阶段进行优化:

  • dyld

    • 减少动态库、合并一些动态库(定期清理不必要的动态库)。
    • 减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)。
    • 减少C++虚函数数量。
    • Swift尽量使用struct
  • runtime

    • +initialize方法和dispatch_once取代所有的__attribute__((constructor))、C++静态构造器、ObjC的+load
  • main

    • 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
      按需加载

五、安装包优化

安装包(IPA)主要由可执行文件、资源组成。

对安装包的优化主要是瘦身,减少安装包的体积。

生成LinkMap文件,可以查看可执行文件的具体组成。

Write Link Map File设置为YES,编译项目后就会自动往Path to Link Map File设置的地址生成LinkMap文件。

也可借助第三方工具解析LinkMap文件: https://github.com/huanxsd/LinkMap。

参考资料

  1. CPU和GPU的简单介绍:https://www.sohu.com/a/227394594_468626

  2. iOS 保持界面流畅的技巧(YYKit作者):http://blog.ibireme.com/2015/11/12/smooth_user_interfaces_for_ios/