Hybrid App 离线包方案实践 #63

mcuking · 2019-12-24T12:17:29Z

文章首发于我的博客 #63

背景

在 H5 + Native 的混合开发模式中，让人诟病最多的恐怕就是加载 H5 页面过程中的白屏问题了。下面这张图描述了从 WebView 初始化到 H5 页面最终渲染的整个过程。

其中目前主流的优化方式主要包括：

针对 WebView 初始化：该过程大致需耗费 70~700ms。当客户端刚启动时，可以先提前初始化一个全局的 WebView 待用并隐藏。当用户访问了 WebView 时，直接使用这个 WebView 加载对应网页并展示。
针对向后端发送接口请求：在客户端初始化 WebView 的同时，直接由 Native 开始网络请求数据，当页面初始化完成后，向 Native 获取其代理请求的数据。
针对加载的 js 动态拼接 html（单页面应用）：可采用多页面打包，服务端渲染，以及构建时预渲染等方式。
针对加载页面资源的大小：可采用懒加载等方式，将需要较大资源的部分分离出来，等整体页面渲染完成后再异步请求分离出来的资源，以提升整体页面加载速度。

当然还有很多其它方面的优化，这里就不再赘述了。本文重点讲的是，在与静态资源服务器建立连接，然后接收前端静态资源的过程。由于这个过程过于依赖用户当前所处的网络环境，因此也成了最不可控因素。当用户处于弱网时，页面加载速度可能会达到 4 到 5 s 甚至更久，严重影响用户体验。而离线包方案就是解决该问题的一个比较成熟的方案。

技术方案

首先阐述下大概思路：

我们可以先将页面需要的静态资源打包并预先加载到客户端的安装包中，当用户安装时，再将资源解压到本地存储中，当 WebView 加载某个 H5 页面时，拦截发出的所有 http 请求，查看请求的资源是否在本地存在，如果存在则直接返回资源。

下面是整体技术方案图，其中 CI/CD 我默认使用 Jenkins，当然也可以采用其它方式。

前端部分

离线包管理平台

客户端

部分问题解答

1. 离线包是否可以自动更新？

当前端资源通过 CI 机自动打包后部署到静态资源服务器，那么又如何上传到离线包平台呢？我曾经考虑过当前端资源打包好时，通过接口自动上传到离线包平台。但后来发现可行性不高，因为我们的前端资源是需要经过测试阶段后，通过运维手动修改 docker 版本来更新前端资源。如果自动上传，则会出现离线包平台已经上传了了未经验证的前端资源，而静态资源服务器却没有更新的情况。因此仍需要手动上传离线包。当然读者可以根据实际情况选择合适的上传方式。

2. 多 App 情况下如何区分离线包属于哪个 App？

在上传的离线包填写信息的时候，增加了 appName 字段。当请求离线包列表 json 文件时，在 query 中添加 appName 字段，离线包平台会只返回属于该 App 的离线包列表。

3. 一定要在 App 启动的时候下载离线包吗？

当然可以做的更丰富些，比如可以选择在客户端连接到 Wi-Fi 的时候，或者从后台切换到前台并超过 10 分钟时候。该设置项可以放在离线包平台中进行配置，可以做成全局有效的设置或者针对不同的离线包进行个性化设置。

4. 如果客户端离线包还没有下载完成，而静态资源服务器已经部署了最新的版本，那么是否会出现客户端展示的页面仍然是旧的版本呢？如果这次改动的是接口请求的变动，那岂不是还会引起接口报错？

这个大可不必担心，上面的代码中如果 http 请求没有命中任何前端资源，则会放过该请求，让它去请求远端的服务器。因此即使本地离线包资源没有及时更新，仍然可以保证页面的静态资源是最新的。也就是说有一个兜底的方案，出了问题大不了回到原来的请求服务器的加载模式。

5. 如果客户端离线包版本为 1，而离线包平台的对应的离线包最新版本为 4，即版本相差大于 1 时，也是通过下载差分包然后本地进行 patch 合并吗？

笔者开发的离线包平台目前仅对相邻版本进行了差分，所以如果客户端本地离线包版本和离线包平台最新版本不相邻，会下载最新版本的全量包。当然，各位可以根据需要，可以将上传的离线包和过去 3 个版本或者更多版本进行差分，这样客户端可以选择下载对应版本的差分包即可，例如下载 1->3 的差分包。

6. 如果离线包除了离线 js、css 等资源，还离线 html，会有什么问题么？

这里笔者举个例子方便阐述，假设客户端请求线上离线包版本的时机是在 app 启动时和定时每两个小时请求一次。当 app 刚刚请求线上离线包版本完没多久，线上的前端页面资源更新了，同时线上离线包也会更新。这个时候用户访问页面时，客户端并不知道线上资源已经更新，所以仍旧会拦截 html 资源请求，并从本地离线包中查找。由于 html 文件名中没有 hash，即使页面更新内容变化，文件名称仍然不变，所以还是可以从本地离线包中找到对应的 html 文件并返回，虽然这个 html 文件相对于线上已经是较旧的文件了。而旧的 html 中引用的 js/css 等资源也会是旧的资源，由此便导致用户看到的页面始终是旧的。只有等到 app 重新启动或者等待将近两个小时后，客户端重新请求线上离线包版本后，才能更新到最新的页面。

对此主要问题根源在于，客户端并不知道线上资源的更新时机，只能通过定时轮询。如果服务端主动通知客户端，例如通过推送方式，当线上离线包一更新，便通知客户端请求最新版本离线包，就可以保证尽量的及时更新。（当然下载离线包也会需要一些时间）

讲到这里读者可以思考一个问题，前端的页面更新是否及时真的是非常重要的事情么？这里涉及到用户打开页面的体验和页面及时更新两者的取舍问题，可以类比下原生 app，原生 app 一般只有用户同意更新之后才会下载更新，很多用户使用的版本可能并不是最新的。所以笔者认为，只要能够做好后端接口的兼容性，不至于出现页面不更新的话，请求的线上接口参数变更甚者被废除，导致页面报错这种情况，页面的无法及时更新还是可以容忍的。

况且一般用户使用 app 的时间不会太长，当下一次再打开的时候客户端就会下载最新的离线包了。笔者所在公司也有这样的问题，但并没有影响到用户的实际使用。所以还是建议离线 html 文件，以彻底提升页面的打开速度。

7. iOS 端 wkWebview 没有 API 支持直接拦截网页的请求，该如何实现离线包方案呢？

笔者询问了下云音乐的 iOS 端离线包方案，是通过私有 API -- registerSchemeForCustomProtocol 注册了 http(s) scheme，进而可以获取到所有的 http(s) 请求，更多信息可参考下面这篇文章：

http://nanhuacoder.top/2019/04/11/iOS-WKWebView02/

文中提到因为WKWebView 在独立于主进程 NSURLProtocol 进程 Network Process 里执行网络请求，正常情况 NSURLProtocol 进程是无法拦截到 webview 中网页发起的请求的。（注：UIWebView 发出的 request，NSURLProtocol 是可以拦截到的）

如果通过 registerSchemeForCustomProtocol 注册了 http(s) scheme, 那么由 WKWebView 发起的所有 http(s)请求都会通过 IPC 从网络进程 Network Process 传给主进程 NSURLProtocol 处理，就可以拦截所有的网络请求了。

但是进程之间的通信使用了 MessageQueue，网络进程 Network Process 会将请求 encode 成一个 Message，然后通过 IPC（进程间通信）发送给主进程 NSURLProtocol。出于性能的原因，encode 的时候将 HTTPBody 和 HTTPBodyStream 这两个字段丢弃掉。

文中提到里一个解决办法，如下所示：

但是还是会遇到一个问题，那就是 http 的 header 本身的大小会有限制，导致例如上传图片等场景会失败。笔者这里提一个可以走通的方式：

在初始化 wkWebview 的时候，注入并执行一段 js，这段 js 主要逻辑是复写挂载在全局上的 XMLHttpRequest 原型上的 open 和 send 方法。

在 open 方法里基于时间戳生成一串字符串 identifier，挂载到 XMLHttpRequest 的实例对象上，同时添加到第二个参数 Url 上，然后再执行原有的 open 方法。

至于 send 方法，主要是拿到 http 请求的 body，以及 open 方法中挂载到实例对象的 identifier 属性，组合成一个对象并调用原生方法保存到客户端的存储中。

当在主进程 NSURLProtocol 中拦截到 XHR 请求时，先从请求的 Url 获取到 identifier，然后根据 identifier 从客户端的存储中找到之前保存的 body。这样就解决了 body 丢失的问题。

当然如果项目中用到了浏览器原生提供的 fetch 方法的话，记得也要将 fetch 方法复写下哦。

结束语

至此整个方案的大致原理已经阐述完了，更多细节问题读者可以参考文中提供的项目链接，所有端的代码都已经托管到了我的 github 上了。

这也算完成了我一个夙愿：实现一套离线包方案并且完全开源出来。最后希望对大家有所帮助～

The text was updated successfully, but these errors were encountered:

cllemon · 2019-12-30T08:02:52Z

👍

zhangrunhao · 2020-03-24T08:53:10Z

你好, 我想询问下, 项目中是否缓存了HTML文件?

mcuking · 2020-03-24T13:34:06Z

@zhangrunhao 没有缓存 html，所以还没有做到页面秒开

Map-Hacker · 2020-05-08T12:06:17Z

请教一下不缓存HTML是出于什么考虑呢？

mcuking · 2020-05-11T03:46:29Z

请教一下不缓存HTML是出于什么考虑呢？

因为当时并没有想好如何在缓存HTML的同时还可以避免HTML不更新，目前在新公司已经找到了类似的解决方案，后面有时间会把我的这个方案完善好

Zjieke · 2020-05-13T13:40:07Z

您好，好像没有看到管理平台数据库方面是怎么部署的？

mcuking · 2020-05-14T08:21:44Z

您好，好像没有看到管理平台数据库方面是怎么部署的？

离线包管理平台源码在这里 https://github.com/mcuking/offline-package-admin
我个人是采用 docker 部署的，里面会有相关配置，数据库用的是 mysql，当然你也可以采用其它方式

NelsonXu · 2020-05-15T09:30:11Z

我想问一下有没有具体部署的步骤，有文档指导一下吗，谢谢

mcuking · 2020-05-26T01:35:21Z

我想问一下有没有具体部署的步骤，有文档指导一下吗，谢谢

后面我在离线包管理平台项目里写下具体的部署步骤吧，最近没有太多时间。

Colinhongle · 2020-06-14T13:03:00Z

不知道如何结合到自己的项目里

mcuking · 2020-06-17T06:41:45Z

不知道如何结合到自己的项目里

主要是三部分：

前端部分只需要集成一个 webpack 插件到项目中，用来打包离线包；
客户端也是只需要集成一个插件，用来管理离线包版本、根据规则拦截前端资源等；
在服务器上部署一个离线包平台，用来管理离线包，并向客户端提供最新的离线包信息。

这三部分我都有开源，可以在上面定制哦～

zhangrunhao · 2020-07-01T12:55:06Z

不知道如何结合到自己的项目里

主要是三部分：

前端部分只需要集成一个 webpack 插件到项目中，用来打包离线包；

客户端也是只需要集成一个插件，用来管理离线包版本、根据规则拦截前端资源等；

在服务器上部署一个离线包平台，用来管理离线包，并向客户端提供最新的离线包信息。

这三部分我都有开源，可以在上面定制哦～

已开始定制... 之前一遍写着业务,一遍学习java, 终于又开始了..

li9269391 · 2020-07-24T05:04:21Z

很好的项目，期待更新，已经跑起来，发现后台服务部分还没

ronniegong · 2020-07-31T10:52:54Z

请教一下不缓存HTML是出于什么考虑呢？

因为当时并没有想好如何在缓存HTML的同时还可以避免HTML不更新，目前在新公司已经找到了类似的解决方案，后面有时间会把我的这个方案完善好

请问现在对这里HTML的新的解决方案大致是怎么处理

Damocs0921 · 2020-08-22T15:20:28Z

有没iOS版本的demo~?

tcstory · 2020-08-26T07:42:54Z

请问, 侵入性比较大, 也比较复杂....

你们自己使用的话, 有统计过这一套技术的收益吗?

mcuking · 2020-09-01T02:40:42Z

有没iOS版本的demo~?

是的，暂时没有 iOS 版本

mcuking · 2020-09-01T02:44:58Z

请问, 侵入性比较大, 也比较复杂....

你们自己使用的话, 有统计过这一套技术的收益吗?

侵入性是指对客户端的侵入性吗？

1.对于客户端来说，离线包是一个独立的插件。

2.而对于前端项目来说，也只需要在前端项目中安装一个用于打包离线包的 webpack 插件。

3.离线包上传到离线包管理平台，也可以做到自动上传。

所以并不是很清楚侵入性指的是什么。。。

mcuking · 2020-09-01T02:46:08Z

请教一下不缓存HTML是出于什么考虑呢？

因为当时并没有想好如何在缓存HTML的同时还可以避免HTML不更新，目前在新公司已经找到了类似的解决方案，后面有时间会把我的这个方案完善好

请问现在对这里HTML的新的解决方案大致是怎么处理

抱歉，来这里后并没有接触离线包方面的工作，所以还没来得及整理～

tcstory · 2020-09-18T07:30:08Z

ios 现在一般用的是 wkwebview ,好像没法直接向 uiwebview 一样拦截静态资源请求吧?

mcuking · 2020-09-18T12:18:17Z

ios 现在一般用的是 wkwebview ,好像没法直接向 uiwebview 一样拦截静态资源请求吧?

是的，不过 iOS 会有一些 hack 的方式来实现这功能的，你可以找一找

mcuking · 2020-09-21T06:42:13Z

@tcstory @Damocs0921
由于 wkWebiew 不支持直接拦截请求资源，云音乐这边的 iOS 端做法是通过 registerSchemeForCustomProtocol 注册了 http(s) scheme，进而可以获取到所有的 http(s) 请求，更多信息可参考下面这篇文章：

http://nanhuacoder.top/2019/04/11/iOS-WKWebView02/

不过这篇文章提到的解决办法有坑，解决办法可以参考我的这篇文章的结尾部分。

mcuking · 2020-09-25T02:30:01Z

关于是否离线 html 的问题，已经在文中补充，欢迎查阅～

tcstory · 2020-09-25T06:13:27Z

其实, 我更倾向于我个人认为的更轻量的方案.
就是app客户端, 实现一个类似于浏览器的 service worker(下面简称 sw) 的方案.
所以, 关于是否缓存 html 文件的话, 可以采用 sw 的 cache first 的策略, 就是优先使用缓存中的 html, 然后, 在后台去查询是否有新的 html. 如果有的话, 就下载下来, 这样, 用户下次打开 html 的时候, 就能拿到最新的文件.

有人之前已经实现了一个 ios 版本的 sw, 所以, 我觉得这个方案是可行的. 参考文章 https://zhuanlan.zhihu.com/p/148931732

我大概的思路如下:

构建完毕后, 把需要离线访问的页面记录在一个 json 文件里, app 在某个时机会去获取这个json文件, 拿到这个文件后, 就后台下载这些页面所依赖的资源( html, js 和 css 等, 不过我不想把这些资源打包成一个压缩包, 就直接普通的单文件下载就行了)
后续的访问中, 如果页面有更新, 那么可以参考我上面提到的 cache first 的策略来实现更新

这个方案, 我个人觉得好处是, 是不需要离线包的管理, 更不需要离线包的管理后台等等. 页面的发布流程也基本保持原先的不变

mcuking · 2020-09-25T07:58:56Z

@tcstory 很不错，其实离线化方式有很多，离线包只是其中一种。你提的方案其实美团两年前应该就已经做了，可以看下面这张截图和文章链接。

https://tech.meituan.com/2018/03/16/front-end-web-architecture.html

tcstory · 2020-10-27T03:20:23Z

补充一点, html 的及时更新是否很重要.

我司遇到的一个场景, 一个购买会员的页面, 在某次活动中, 把购买的入口给开放出来了, 之前的代码提交导致用户无法进行购买, 然后活动被临时下掉, 如果 html 文件无法得到即使更新, 那么, 我该如何让用户进行购买呢? 提示用户重启 app? 还是等待 app 的下一次轮询?

你可能会说, 这个功能没有验收吗? 为什么会上线.
其实是这样的, 这个购买能力的功能, 很早之前就上线了, 后面有新的需求要开发, 但是没有想到新需求的修改, 会影响到别的功能, 所以自然就没有发现引入了 bug.

所以, 我挺好奇的, 你们公司的 h5 页面, 承载的是什么业务?

mcuking · 2020-11-03T01:42:04Z

@tcstory
嗯，据我所知离线包的确会有更新不及时问题。
至于这里目前用到离线包的基本上都是独立的活动页面，彼此之间关联不是很大。

guojiabin · 2020-12-09T09:07:39Z

请问你的联系方式可以发我一个吗？微信号，我有些问题请教您

guojiabin · 2020-12-09T09:12:46Z

这个截图的代码是不是有问题服务器返回的版本号赋值给本地保存的版本号然后在进行比较这个逻辑不通吧

mcuking · 2021-02-03T02:14:32Z

这个截图的代码是不是有问题服务器返回的版本号赋值给本地保存的版本号然后在进行比较这个逻辑不通吧

最近有空看了下，确实有问题，应该是在比较之后，再去更新本地 package 的信息。已经更正，并添加了一些注释，感谢指出问题。

hxkuc · 2021-04-13T09:51:05Z

你好，请问一下离线包拦截资源这块，是可以拦截单个请求呢，还是拦截的整个http协议

mcuking · 2021-04-20T11:40:41Z

你好，请问一下离线包拦截资源这块，是可以拦截单个请求呢，还是拦截的整个http协议

shouldInterceptRequest 是拦截 webview 中所有的资源请求，和是否是 http 协议无关。

如果 shouldInterceptRequest 方法返回 null，则WebView将照常继续加载资源。否则，将使用 shouldInterceptRequest 返回的数据。

可以参考下官方文档中的说明哦：

https://developer.android.com/reference/android/webkit/WebViewClient#shouldInterceptRequest(android.webkit.WebView,%20android.webkit.WebResourceRequest)

hxkuc · 2021-05-31T12:17:51Z

你好，请问一下离线包拦截资源这块，是可以拦截单个请求呢，还是拦截的整个http协议

shouldInterceptRequest 是拦截 webview 中所有的资源请求，和是否是 http 协议无关。

如果 shouldInterceptRequest 方法返回 null，则WebView将照常继续加载资源。否则，将使用 shouldInterceptRequest 返回的数据。

可以参考下官方文档中的说明哦：

https://developer.android.com/reference/android/webkit/WebViewClient#shouldInterceptRequest(android.webkit.WebView,%20android.webkit.WebResourceRequest)

我理解下来，这个api是和electron的这个api是一样的吗，https://www.electronjs.org/docs/api/web-request#webrequestonbeforesendheadersfilter-listener ，这个方法是拦截某个请求可以设置callback进行重定向，效果就是资源会被307重定向，不知道安卓的这个api拦截后效果也是307重定向吗

mcuking · 2021-09-10T12:17:03Z

你好，请问一下离线包拦截资源这块，是可以拦截单个请求呢，还是拦截的整个http协议

shouldInterceptRequest 是拦截 webview 中所有的资源请求，和是否是 http 协议无关。
如果 shouldInterceptRequest 方法返回 null，则WebView将照常继续加载资源。否则，将使用 shouldInterceptRequest 返回的数据。
可以参考下官方文档中的说明哦：
https://developer.android.com/reference/android/webkit/WebViewClient#shouldInterceptRequest(android.webkit.WebView,%20android.webkit.WebResourceRequest)

我理解下来，这个api是和electron的这个api是一样的吗，https://www.electronjs.org/docs/api/web-request#webrequestonbeforesendheadersfilter-listener ，这个方法是拦截某个请求可以设置callback进行重定向，效果就是资源会被307重定向，不知道安卓的这个api拦截后效果也是307重定向吗

应该没有 307 重定向效果的

123456dengting · 2021-12-13T08:13:31Z

你好,web打包完上传到离线包管理平台,这块是需要自己写吗,看你这里面好像没有写到

mcuking · 2021-12-14T13:51:59Z

你好,web打包完上传到离线包管理平台,这块是需要自己写吗,看你这里面好像没有写到

@123456dengting
离线包平台代码在这里 https://github.com/mcuking/offline-package-admin
从打包出构建物，到上传构建物需要手动上传，你可以结合你们的实际情况将这个步骤自动化。

shihpeng · 2021-12-15T02:30:26Z

非常優秀，感謝你的分享

ZhouShowfew · 2021-12-30T12:08:32Z

你好，请教下React项目通过webpack打包后能在Android上用webview离线运行吗

mcuking · 2022-04-28T06:17:50Z

你好，请教下React项目通过webpack打包后能在Android上用webview离线运行吗

@ZhouShowfew 抱歉目前才看到，如果要完全离线的话，应该是需要拦截 html 的请求，应该是可行的。但要确保整个方案的稳定性，因为如果缓存 html，一旦出问题 html 如果更新到最新代码，则整个页面都不会更新了。

1QQ6 · 2022-06-24T07:09:02Z

您好，我理解的意思是，在Android上面，首次先把离线包放到assets目录下，之后都不需要了对吗，只是下载差分包对吧

mcuking · 2022-07-16T12:20:19Z

您好，我理解的意思是，在Android上面，首次先把离线包放到assets目录下，之后都不需要了对吗，只是下载差分包对吧

是的只是初次打包安装包的时候需要

zhuoyancaomei · 2023-04-20T12:09:01Z

很有用，感谢。

zhouatie · 2023-08-31T06:07:16Z

老唐nb

mcuking changed the title ~~Hybrid 离线包方案实践~~ Hybrid App 离线包方案实践 Dec 24, 2019

mcuking added hybrid and removed hybrid labels Sep 20, 2020

Hybrid App 离线包方案实践 #63

Hybrid App 离线包方案实践 #63

Comments

mcuking commented Dec 24, 2019 • edited Loading

背景

技术方案

前端部分

离线包管理平台

客户端

部分问题解答

1. 离线包是否可以自动更新？

2. 多 App 情况下如何区分离线包属于哪个 App？

3. 一定要在 App 启动的时候下载离线包吗？

4. 如果客户端离线包还没有下载完成，而静态资源服务器已经部署了最新的版本，那么是否会出现客户端展示的页面仍然是旧的版本呢？如果这次改动的是接口请求的变动，那岂不是还会引起接口报错？

5. 如果客户端离线包版本为 1，而离线包平台的对应的离线包最新版本为 4，即版本相差大于 1 时，也是通过下载差分包然后本地进行 patch 合并吗？

6. 如果离线包除了离线 js、css 等资源，还离线 html，会有什么问题么？

7. iOS 端 wkWebview 没有 API 支持直接拦截网页的请求，该如何实现离线包方案呢？

结束语

cllemon commented Dec 30, 2019

zhangrunhao commented Mar 24, 2020

mcuking commented Mar 24, 2020

Map-Hacker commented May 8, 2020

mcuking commented May 11, 2020

Zjieke commented May 13, 2020

mcuking commented May 14, 2020

NelsonXu commented May 15, 2020

mcuking commented May 26, 2020

Colinhongle commented Jun 14, 2020

mcuking commented Jun 17, 2020

zhangrunhao commented Jul 1, 2020

li9269391 commented Jul 24, 2020

ronniegong commented Jul 31, 2020

Damocs0921 commented Aug 22, 2020

tcstory commented Aug 26, 2020

mcuking commented Sep 1, 2020

mcuking commented Sep 1, 2020

mcuking commented Sep 1, 2020

tcstory commented Sep 18, 2020

mcuking commented Sep 18, 2020

mcuking commented Sep 21, 2020 • edited Loading

mcuking commented Sep 25, 2020

tcstory commented Sep 25, 2020

mcuking commented Sep 25, 2020

tcstory commented Oct 27, 2020

mcuking commented Nov 3, 2020

guojiabin commented Dec 9, 2020

guojiabin commented Dec 9, 2020

mcuking commented Feb 3, 2021 • edited Loading

hxkuc commented Apr 13, 2021

mcuking commented Apr 20, 2021

hxkuc commented May 31, 2021 • edited Loading

mcuking commented Sep 10, 2021

123456dengting commented Dec 13, 2021

mcuking commented Dec 14, 2021

shihpeng commented Dec 15, 2021

ZhouShowfew commented Dec 30, 2021

mcuking commented Apr 28, 2022

1QQ6 commented Jun 24, 2022

mcuking commented Jul 16, 2022

zhuoyancaomei commented Apr 20, 2023

zhouatie commented Aug 31, 2023

mcuking commented Dec 24, 2019 •

edited

Loading

mcuking commented Sep 21, 2020 •

edited

Loading

mcuking commented Feb 3, 2021 •

edited

Loading

hxkuc commented May 31, 2021 •

edited

Loading