请稍侯

iOS性能内存优化

13 December 2015

iOS性能内存优化

几个优化总体思路:

  • 避免过多的CPU计算
    • 简化复杂频繁的布局计算
    • 文本计算、格式转换、图像绘制、对象的创建调整等尽可能放到后台线程进行
  • 避免图层混合
    • 确保控件的opaque属性设置为true,确保backgroundColor和父视图颜色一致且不透明
    • 如无特殊需要,不要设置低于1的alpha值
    • 确保UIImage没有alpha通道
  • 避免临时转换
    • 确保图片大小和frame一致,不要在滑动时缩放图片
    • 确保图片颜色格式被GPU支持,避免劳烦CPU转换
  • 慎用离屏渲染
    • 绝大多数时候离屏渲染会影响性能
    • 重写drawRect方法,设置圆角、阴影、模糊效果,光栅化都会导致离屏渲染
    • 设置阴影效果是加上阴影路径
    • 滑动时若需要圆角效果,开启光栅化

屏幕显示图像的原理

  • CPU 计算好显示内容提交到 GPU,GPU 渲染完成后将渲染结果放入帧缓冲区,随后视频控制器会按照 VSync信号(垂直同步信号)逐行读取帧缓冲区的数据,经过可能的数模转换传递给显示器显示。
  • 显示系统一般都是双缓冲机制,即引入两个缓冲区。GPU 会预先渲染好一帧放入一个缓冲区内,让视频控制器读取,当下一帧渲染好后,GPU 会直接把视频控制器的指针指向第二个缓冲器。这样对帧缓冲区的读取和刷新的效率会较大提升。
  • 双缓冲又可能会带来画面撕裂的问题。当视频控制器还未读取完成时,即屏幕内容刚显示一半时,GPU 将新的一帧内容提交到帧缓冲区并把两个缓冲区进行交换后,视频控制器就会把新的一帧数据的下半段显示到屏幕上,就造成画面撕裂现象。
  • 多双缓冲区为了解决画面撕裂的问题,GPU 通常有一个机制叫做垂直同步(简写也是 V-Sync),当开启垂直同步后,GPU 会等待显示器的 VSync 信号发出后,才进行新的一帧渲染和缓冲区更新。这样能解决画面撕裂现象,也增加了画面流畅度,但需要消费更多的计算资源,也会带来部分延迟。
  • iOS 设备会始终使用双缓存,并开启垂直同步。而安卓设备直到 4.1 版本,Google 才开始引入这种机制,目前安卓系统是三缓存+垂直同步。

卡顿产生的原因和解决方案

  • 在 VSync 信号到来后,系统图形服务会通过 CADisplayLink 等机制通知 App,App 主线程开始在 CPU 中计算显示内容,比如视图的创建、布局计算、图片解码、文本绘制等。
  • 随后 CPU 会将计算好的内容提交到 GPU 去,由 GPU 进行变换、合成、渲染。随后 GPU 会把渲染结果提交到帧缓冲区去,等待下一次 VSync 信号到来时显示到屏幕上。
  • 由于垂直同步的机制,如果在一个 VSync 时间内,CPU 或者 GPU 没有完成内容提交,则那一帧就会被丢弃,等待下一次机会再显示,而这时显示屏会保留之前的内容不变。这就是界面卡顿的原因。所以CPU 和 GPU 不论哪个阻碍了显示流程,都会造成掉帧现象。

CPU 资源消耗原因和解决方案

  • 布局计算。
    • 视图布局的计算是 App 中最为常见的消耗 CPU 资源的地方。如果能在后台线程提前计算好视图布局、并且对视图布局进行缓存,那么这个地方基本就不会产生性能问题了。
    • 不论通过何种技术对视图进行布局,其最终都会落到对 UIView.frame/bounds/center 等属性的调整上。对这些属性的调整非常消耗资源,所以尽量提前计算好布局,在需要时一次性调整好对应属性,而不要多次、频繁的计算和调整这些属性。
    • Autolayout。Autolayout对于复杂视图来说常常会产生严重的性能问题。随着视图数量、层次的增长,Autolayout 带来的 CPU 消耗会呈指数级上升。当然可以使用 ComponentKit、AsyncDisplayKit 等框架替代解决。
  • 文本计算。
    • 如果一个界面中包含大量文本(比如微博微信朋友圈等),文本的宽高计算会占用很大一部分资源,并且不可避免。
    • 如果你对文本显示没有特殊要求,可以参考下 UILabel 内部的实现方式:用 [NSAttributedString boundingRectWithSize:options:context:] 来计算文本宽高,用 -[NSAttributedString drawWithRect:options:context:] 来绘制文本。尽管这两个方法性能不错,但仍旧需要放到后台线程进行以避免阻塞主线程。
  • 文本渲染。
    • 屏幕上能看到的所有文本内容控件,包括 UIWebView,在底层都是通过 CoreText 排版、绘制为 Bitmap 显示的。常见的文本控件 (UILabel、UITextView 等),其排版和绘制都是在主线程进行的,当显示大量文本时,CPU 的压力会非常大。
    • 对此解决方案只有一个,那就是自定义文本控件,用 TextKit 或最底层的 CoreText 对文本异步绘制。尽管这实现起来非常麻烦,但其带来的优势也非常大,CoreText 对象创建好后,能直接获取文本的宽高等信息,避免了多次计算(调整 UILabel 大小时算一遍、UILabel 绘制时内部再算一遍);CoreText 对象占用内存较少,可以缓存下来以备稍后多次渲染。
  • 图片的解码。
    • 原理:像素在内存中的布局和它在磁盘中的存储方式并不相同,每个像素有R、G、B和alpha四个值,每个值占用1字节,因此每个像素占用4字节的内存空间。一张1920*1080的照片(iPhone6 Plus的分辨率)一共有2,073,600个像素,因此占用了超过8Mb的内存。但是一张同样分辨率的PNG格式或JPEG格式的图片一般情况下不会有这么大。这是因为JPEG将像素数据进行了一种非常复杂且可逆的转化。
    • 解码过程: 当我们打开JPEG格式的图片时,CPU会进行一系列解码相关运算,将JPEG图片解压成像素数据。显然这个工作会消耗不少时间,所以不应该在滑动时进行,我们应该预先处理好图片。
    • 当你用 UIImage 或 CGImageSource 的那几个方法创建图片时,图片数据并不会立刻解码。图片设置到 UIImageView 或者 CALayer.contents 中去,并且 CALayer 被提交到 GPU 前,CGImage 中的数据才会得到解码。这一步是发生在主线程的,并且不可避免。
    • 如果想要绕开这个机制,就需要预先处理好图片格式的转换。常见的做法是在后台线程先把图片绘制到 CGBitmapContext 中,然后从 Bitmap 直接创建图片。目前常见的网络图片库都自带这个功能。
  • 图像的绘制。
    • 图片都需要被缩放
    • 图像的绘制通常是指用那些以 CG 开头的方法把图像绘制到画布中,然后从画布创建图片并显示这样一个过程。这个最常见的地方就是 [UIView drawRect:] 里面了。由于 CoreGraphic 方法通常都是线程安全的,所以图像的绘制可以很容易的放到后台线程进行。一个简单异步绘制的过程大致如下(实际情况会比这个复杂得多,但原理基本一致):

        - (void)display {
            dispatch_async(backgroundQueue, ^{
                CGContextRef ctx = CGBitmapContextCreate(...);
                // draw in context...
                CGImageRef img = CGBitmapContextCreateImage(ctx);
                CFRelease(ctx);
                dispatch_async(mainQueue, ^{
                    layer.contents = img;
                });
            });
        }
      
  • 对象创建。对象的创建会分配内存、调整属性、甚至还有读取文件等操作,比较消耗 CPU 资源。尽量用轻量的对象代替重量的对象,可以对性能有所优化。比如 CALayer 比 UIView 要轻量许多,那么不需要响应触摸事件的控件,用 CALayer 显示会更加合适。
    • 如果对象不涉及 UI 操作,则尽量放到后台线程去创建,但可惜的是包含有 CALayer 的控件,都只能在主线程创建和操作。
    • 尽量推迟对象创建的时间,并把对象的创建分散到多个任务中去。
    • 如果对象可以复用,并且复用的代价比释放、创建新对象要小,那么这类对象应当尽量放到一个缓存池里复用。
    • 通过 Storyboard 创建视图对象时,其资源消耗会比直接通过代码创建对象要大非常多。
  • 对象调整。对象的调整也经常是消耗 CPU 资源的地方。
    • 这里特别说一下 CALayer:CALayer 内部并没有属性,当调用属性方法时,它内部是通过运行时 resolveInstanceMethod 为对象临时添加一个方法,并把对应属性值保存到内部的一个 Dictionary 里,同时还会通知 delegate、创建动画等等,非常消耗资源。U
    • IView 的关于显示相关的属性(比如 frame/bounds/transform)等实际上都是 CALayer 属性映射来的,所以对 UIView 的这些属性进行调整时,消耗的资源要远大于一般的属性。对此你在应用中,应该尽量减少不必要的属性修改。
    • 当视图层次调整时,UIView、CALayer 之间会出现很多方法调用与通知,所以在优化性能时,应该尽量避免调整视图层次、添加和移除视图。
  • 对象销毁。对象的销毁虽然消耗资源不多,但累积起来也是不容忽视的。

GPU 资源消耗原因和解决方案

相对于 CPU 来说,GPU 能干的事情比较单一:接收提交的纹理(Texture)和顶点描述(三角形),应用变换(transform)、混合并渲染,然后输出到屏幕上。通常你所能看到的内容,主要也就是纹理(图片)和形状(三角模拟的矢量图形)两类。

  • 避免短时间内大量图片的显示。纹理的渲染,所有的 Bitmap,包括图片、文本、栅格化的内容,最终都要由内存提交到显存,绑定为 GPU Texture。不论是提交到显存的过程,还是 GPU 调整和渲染 Texture 的过程,都要消耗不少 GPU 资源。当在较短时间显示大量图片时(比如 TableView 存在非常多的图片并且快速滑动时),CPU 占用率很低,GPU 占用非常高,界面仍然会掉帧。避免这种情况的方法只能是尽量减少在短时间内大量图片的显示,尽可能将多张图片合成为一张进行显示

  • 避免图片过大。超过 GPU 的最大纹理尺寸时,图片需要先由 CPU 进行预处理,这对 CPU 和 GPU 都会带来额外的资源消耗。目前来说,iPhone 4S 以上机型,纹理尺寸上限都是 4096x4096。所以,尽量不要让图片和视图的大小超过这个值。

  • 避免不必要的缩放。在给UIImageView设置图片时,应尽可能保证无论是本地图片还是从网络或取得图片的大小,都与其frame保持一致,因为图片的缩放需要占用CPU时间的。

  • 避免图层的混合 (Composing)。当多个视图(或者说 CALayer)重叠在一起显示时,GPU 会首先把他们混合到一起。如果视图结构过于复杂,混合的过程也会消耗很多 GPU 资源。为了减轻这种情况的 GPU 消耗,应用应当尽量减少视图数量和层次,并在不透明的视图里标明 opaque 属性以避免无用的 Alpha 通道合成。如果只想显示最上层的图层,可以把它的透明度设置为100%,这样GPU会忽略下面所有的layer,从而节约了很多不必要的运算。当然,这也可以用上面的方法,把多个视图预先渲染为一张图片来显示。
    • UIView的opaque属性默认值就是true,也就是说只要不是人为设置成透明,都不会出现图层混合。
    • 对于UIImageView来说,不仅它自身需要是不透明的,它的图片也不能含有alpha通道。
    • 还有一个更重要的是backgroundColor属性,如果不设置这个属性,控件依然被认为是透明的。所以可以在控件init的时候给backgroundColor设置一个不透明的颜色。
    • 具体做法:
      • 确保控件的opaque属性设置为true,确保backgroundColor和父视图颜色一致且不透明。
      • 如无特殊需要,不要设置低于1的alpha值。
      • 确保UIImage没有alpha通道。
  • 避免反复的离屏渲染。CALayer 的 border、圆角、阴影、遮罩(mask),CASharpLayer 的矢量图形显示,通常会触发离屏渲染(offscreen rendering),而离屏渲染通常发生在 GPU 中。
    • 当一个列表视图中出现大量圆角的 CALayer,并且快速滑动时,可以观察到 GPU 资源已经占满,而 CPU 资源消耗很少。这时界面仍然能正常滑动,但平均帧数会降到很低。为了避免这种情况,可以尝试开启 CALayer.shouldRasterize 属性,但这会把原本离屏渲染的操作转嫁到 CPU 上去。
    • 对于只需要圆角的某些场合,更高效的做法是可以用一张已经绘制好的圆角图片覆盖到原本视图上面来模拟相同的视觉效果。最彻底的解决办法,就是把需要显示的图形在后台线程绘制为图片,避免使用圆角、阴影、遮罩等属性。
  • 缩小重绘区域。刷新视图时,我们应该把需要重绘的区域尽可能缩小。对于未发生变化的内容则不应该重绘。

离屏渲染

  • 离屏渲染,指的是GPU在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作。
  • 当设置了以下属性时,会触发离屏渲染:
    • 重写drawRect方法
    • 开发光栅化shouldRasterize(光栅化)
    • masks、layer.masksToBounds以模糊效果(遮罩)
    • shadows或是layer.shadow(阴影)
    • edge antialiasing(抗锯齿)
    • group opacity(组透明)
  • 光栅化,光栅化是将一个layer预先渲染成位图(bitmap),然后加入缓存中。如果对于阴影效果这样比较消耗资源的静态内容进行缓存,可以得到一定幅度的性能提升。
  • 离屏渲染耗时的原因主要有创建缓冲区和上下文切换。
    • 上下文切换,首先要保存当前屏幕渲染环境,然后切换到一个新的绘制环境,申请绘制资源,初始化环境,然后开始一个绘制,绘制完毕后销毁这个绘制环境,如需要切换到主屏渲染或者再开始一个新的离屏渲染,则又要重复之前的操作。
    • 不要在滚动视图使用cornerRadius或者mask,如果非要如此,可以开启光栅化shouldRasterize = YES会使视图渲染内容被缓存起来,下次绘制的时候可以直接显示缓存。

以上参考:

离屏渲染

iOS 保持界面流畅的技巧

iOS性能优化之内存管理:Analyze、Leaks、Allocations的使用和案例代码

UIKit性能调优实战讲解

小心别让圆角成了你列表的帧数杀手

iOS-Performance-Optimization