Skip to content

Latest commit

 

History

History
416 lines (338 loc) · 33.4 KB

初探富文本之CRDT协同实例.md

File metadata and controls

416 lines (338 loc) · 33.4 KB

初探富文本之CRDT协同实例

在前边初探富文本之CRDT协同算法一文中我们探讨了为什么需要协同、分布式的最终一致性理论、偏序集与半格的概念、为什么需要有偏序关系、如何通过数据结构避免冲突、分布式系统如何进行同步调度等等,这些属于完成协同所需要了解的基础知识,实际上当前有很多成熟的协同实现,例如automergeyjs等等,本文就是关注于以yjsCRDT协同框架来实现协同的实例。

描述

接入协同框架实际上并不是一件简单的事情,当然相对于接入OT协同而言接入CRDT协同已经是比较简单的了,因为我们只需要聚焦于数据结构的使用就好,而不需要对变换有过多的关注。当前我们更加关注的是Op-based CRDT,本文所说的CRDT也是特指的Op-based CRDT,毕竟State-baed CRDT需要将全量数据进行传输,每次都要完整传输状态来完成同步让它比较难变成通用的解决方案。

因此与OT算法一样,我们依然需要Operation,在富文本领域,最经典的Operationquilldelta模型,通过retaininsertdelete三个操作完成整篇文档的描述与操作,还有slateJSON模型,通过insert_textsplit_noderemove_text等等操作来完成整篇文档的描述与操作。

假如此时是OT的话,接下来我们就要聊到变换Transformation了.但是使用CRDT算法的情况下,我们的关注点变了,我们需要做的是关注于如何将我们现在的数据结构转换为CRDT框架的数据结构,比如通过框架提供的ArrayMapText等类型构建我们自己的JSON数据,并且我们的Op也需要映射到对框架提供的数据结构进行的操作,这样框架便可以帮我们进行协同。当框架完成协同之后把框架的数据结构的改变返回,此时我们需要再将这部分改变映射到我们自己的Op,然后我们只需要在本地应用这些远程同步并在本地转换的Op,就可以做到协同了。

上边这个数据转换听起来是不是有点耳熟,在前边初探富文本之OT协同实例中,我们介绍了json0。我们也提到了一个可行的操作,我们让变换Transformation这部分让json0去做,我们需要关注的是从我们自己定义的数据结构转换到json0,在json0进行变换操作之后我们同样地将Op转换后应用到我们本地的数据就好。

虽然原理是完全不同的,但是我们在已有成熟框架的情况下似乎并不需要关注这点,我们更侧重于使用,实际上在使用起来是很像的。此时假设我们有一个自研的思维导图功能需要实现协同,而保存的数据结构都是自定义的,没有直接可以调用的实现方案,我们就需要进行转换适配,那么如果使用OT的话,并且借助json0做变换,那么我们需要做的是把Op转换为json0Op,发送的数据也将会是这个json0Op,那么如果直接使用CRDT的话,我们更像是通过框架定义的数据结构将Op应用到数据结构上,发送的数据是框架定义的数据,类似于将Op应用到数据结构上了,其他的操作都由框架给予完整的支持了。

实际上通过框架提供的例子后,接入CRDT协同就主要是理解并且实现的问题了,这样就有一个大体的实现方向了,而不是毫无头绪不知道应该从哪里开始做协同。另外还是那个宗旨,合适的才是最好的,要考虑到实现的成本问题,没有必要硬套数据结构的实现,OTOT的优点,CRDTCRDT的优点,CRDT这类方法相比OT还比较年轻,还是在不断发展过程中的,实际上有些问题例如内存占用、速度等问题最近几年才被比较好的解决,ShareDB作者在关注CRDT不断发展的过程中也说了CRDTs are the future。此外从技术上讲,CRDT类型是OT类型的子集,也就是说,CRDT实际上是不需要转换函数的OT类型,因此任何可以处理这些OT类型的东西也应该能够使用CRDT

或许上边的一些概念可能一时间让人难以理解,所以下面的CounterQuill两个实例就是介绍了如何使用yjs实现协同,究竟如何通过数据结构完成协同的接入工作,当然具体的API调用还是还是需要看yjs的文档,本文只涉及到最基本的协同操作,所有的代码都在https://github.com/WindrunnerMax/Collab中,注意这是个pnpmworkspace monorepo项目,要注意使用pnpm安装依赖。

Counter

首先我们运行一个基础的协同实例Counter,实现的主要功能是在多个客户端可以+1的情况下我们可以维护同一份计数器总数,该实例的地址是https://github.com/WindrunnerMax/Collab/tree/master/packages/crdt-counter,首先简单看一下目录结构(tree --dirsfirst -I node_modules):

crdt-counter
├── public
│   ├── favicon.ico
│   └── index.html
├── server
│   └── index.ts
├── src
│   ├── client.ts
│   ├── counter.tsx
│   └── index.tsx
├── babel.config.js
├── package.json
├── rollup.config.js
├── rollup.server.js
└── tsconfig.json

先简略说明下各个文件夹和文件的作用,public存储了静态资源文件,在客户端打包时将会把内容移动到build文件夹,server文件夹中存储了CRDT服务端的实现,在运行时同样会编译为js文件放置于build文件夹下,src文件夹是客户端的代码,主要是视图与CRDT客户端的实现,babel.config.jsbabel的配置信息,rollup.config.js是打包客户端的配置文件,rollup.server.js是打包服务端的配置文件,package.jsontsconfig.json大家都懂,就不赘述了。

在前边CRDT协同算法实现一文中,我们经常提到的就是无需中央服务器的分布式协同,那么在这个例子中我们就来实现一个peer-to-peer的实例。yjs提供了一个y-webrtc的信令服务器,甚至还有公共的信令服务器可以用,当然可能因为网络的关系这个公共的信令服务器在国内不是很适用。在继续完成协同之前,我们还需要了解一下WebRTC以及信令的相关概念。

WebRTC是一种实时通信技术,重点在于可以点对点即P2P通信,其允许浏览器和应用程序直接在互联网上传输音频、视频和数据流,无需使用中间服务器进行中转。WebRTC利用浏览器内置的标准API和协议来提供这些功能,并且支持多种编解码器和平台,WebRTC可以用于开发各种实时通信应用,例如在线会议、远程协作、实时广播、在线游戏和IoT应用等。但是在多级NAT网络环境下,P2P连接可能会受到限制,简单来说就是一台设备无法直接发现另一台设备,自然也就没有办法进行P2P通信,这时需要使用特殊的技术来绕过NAT并建立P2P连接。

NAT Network Address Translation网络地址转换是一种在IP网络中广泛使用的技术,主要是将一个IP地址转换为另一个IP地址,具体来说其工作原理是将一个私有IP地址(如在家庭网络或企业内部网络中使用的地址)映射到一个公共IP地址(如互联网上的IP地址)。当一个设备从私有网络向公共网络发送数据包时,NAT设备会将源IP地址从私有地址转换为公共地址,并且在返回数据包时将目标IP地址从公共地址转换为私有地址。NAT可以通过多种方式实现,例如静态NAT、动态NAT和端口地址转换PAT等,静态NAT将一个私有IP地址映射到一个公共IP地址,而动态NAT则动态地为每个私有地址分配一个公共地址,PAT是一种特殊的动态NAT,在将私有IP地址转换为公共IP地址时,还会将源端口号或目标端口号转换为不同的端口号,以支持多个设备使用同一个公共IP地址。NAT最初是为了解决IPv4地址空间的短缺而设计的,后来也为提高网络安全性并简化网络管理提供了基础。

在互联网上大多数设备都是通过路由器或防火墙连接到网络的,这些设备通常使用网络地址转换NAT将内部IP地址映射到一个公共的IP地址上,这个公共IP地址可以被其他设备用来访问,但是这些设备内部的IP地址是隐藏的,其他的设备不能直接通过它们的内部IP地址建立P2P连接。因此,直接进行P2P连接可能会受到网络地址转换NAT的限制,导致连接无法建立。为了解决这个问题,需要使用一些技术来绕过NAT并建立P2P连接。另外,P2P连接也需要一些控制和协调机制,以确保连接的可靠性和安全性。

信令可以用来解决多级NAT环境下的P2P连接问题,当两个设备尝试建立P2P连接时,可以使用信令服务器来交换网络信息,例如IP地址、端口和协议类型等,以便设备之间可以彼此发现并建立连接。当然信令服务器并不是绕过NAT的唯一解决方案,STUNTURNICE等技术也可以帮助解决这个问题。信令服务器的主要作用是协调不同设备之间的连接,以确保设备可以正确地发现和通信。在实际应用中,通常需要同时使用多种技术和工具来解决多级NAT环境下的P2P连接问题。

那么回到WebRTC,我们即使是使用了P2P的技术,但是不可避免的需要一个信令服务器来交换WebRTC会话描述和控制信息。当然这些信息不包括实际通信的数据流本身,而是用于描述和控制这些流的方式和参数,这些数据流本身是通过对等连接在两个浏览器之间直接传输的。主要数据流的通信不经过中央服务器,这就使得WebRTC有着低延迟和高带宽等优点,但是同样的因为每个对等点相互连接,不适合单个文档上的大量协作者。

接下来我们要进行数据结构的设计,目前在yjs中是没有Y.Number这个数据结构的,也就是说yjs没有自增自减的操作,这点就与前边OT实例不一样了,所以在这里我们需要设计数据结构。网络是不可靠的,我们不能够在本地模拟+1的操作,就是说本地先取得值,然后进行+1操作之后再把值推到其他的客户端上,这样的设计虽然在本地测试应该是可行的,但是由于网络不可靠,我们不能保证本地取值的时候获得的是最新的值,所以这个方案是不可靠的。

那么我们思考几种方案来实现这一点,有一种可行的方案是类似于我们之前介绍的CRDT数据结构,我们可以构造一个集合Y.Array,当我们点+1的时候,就向集合中push一个新的值,这样再取和的时候直接取集合长度即可。

Y.Array: [] => +1 => [1] => +1 => [1, 1] => ...
Counter: [1, 1].size = N

另一种方案是使用Y.Map来完成,当用户加入我们的P2P组的时候,我们通过其身份信息为其分配一个id,然后这个id只记录与自增自己的值,也就是说当某个客户端点击+1的时候,操作的只有其id对应的数,而不能影响组网内其他的用户的值。

Y.Map: {} => +1 => {"id": 1} => +1 => {"id": 2} => ...
Counter: Object.values({"id": 2}).reduce((a, b) => a + b) = N

在这里我们使用的是Y.Map的方案,毕竟如果是Y.Array的话占用资源会是比较大的,当然因为实例中并没有身份信息,每次进入的时候都是会随机分配id的,当然这不会影响到我们的Counter。此外还有比较重要的一点是,因为我们是直接进行P2P通信的,当所有的设备都离线的时候,由于没有设计实际的数据存储机制,所以数据会丢失,这点也是需要注意的。

接下来我们看看代码的实现,首先我们来看看服务端,这里主要实现是调用了一下y-webrtc-signaling来启动一个信令服务器,这是y-webrtc给予的开箱即用的功能,也可以基于这些内容进行改写,不过因为是信令服务器,除非有着很高的稳定性、定制化等要求,否则直接当作开箱即用的信令服务器就好。后边主要是使用了express启动了一个静态资源服务器,因为直接在浏览器打开文件的file协议有很多的安全限制,所以需要一个HTTP Server

import { exec } from "child_process";
import express from "express";

// https://github.com/yjs/y-webrtc/blob/master/bin/server.js
exec("PORT=3001 npx y-webrtc-signaling", (err, stdout, stderr) => { // 调用`y-webrtc-signaling`
  console.log(stdout, stderr);
});

const app = express(); // 实例化`express`
app.use(express.static("build")); // 客户端打包过后的静态资源路径
app.listen(3000);
console.log("Listening on http://localhost:3000");

在客户端方面主要是定义了一个定义了一个共用的链接,通过id来加入我们的P2P组,并且还有密码的保护,这里需要链接的信令服务器也就是上边启动的y-webrtc3001端口的信令服务。之后我们通过observe定义的Y.Map数据结构的变化来执行回调,在这里实际上就是将回调过后的整个Map数据传回回调函数,然后在视图层进行Counter的计算,这里还有一个transaction.origin判断是为了防止我们本地的调用触发回调。最后我们定义了一个increase函数,在这里我们通过transact作为事务来执行set操作,因为我们之前的设计只会处理我们当前客户端对应的id的那个值,本地的值是可信的,直接自增即可,transact最后一个参数也就是上边提到了的transaction.origin,可以用来判断事件的来源。

import { Doc, Map as YMap } from "yjs";
import { WebrtcProvider } from "y-webrtc";

const getRandomId = () => Math.floor(Math.random() * 10000).toString();
export type ClientCallback = (record: Record<string, number>) => void;

class Connection {
  private doc: Doc;
  private map: YMap<number>;
  public id: string = getRandomId(); // 当前客户端生成的唯一`id`
  public counter = 0; // 当前客户端的初始值

  constructor() {
    const doc = new Doc();
    new WebrtcProvider("crdt-example", doc, { // `P2P`组名称 // `Y.Doc`实例
      password: "room-password", // `P2P`组密码
      signaling: ["ws://localhost:3001"], // 信令服务器
    });
    const yMapDoc = doc.getMap<number>("counter"); // 获取数据结构
    this.doc = doc;
    this.map = yMapDoc;
  }

  bind(cb: ClientCallback) {
    this.map.observe(event => { // 监听数据结构变化 // 如果是多层嵌套需要`observeDeep`
      if (event.transaction.origin !== this) { // 防止本地修改时触发
        const record = [...this.map.entries()].reduce( // 获取`Y.Map`定义中的所有数据
          (cur, [key, value]) => ({ ...cur, [key]: value }),
          {} as Record<string, number>
        );
        cb(record); // 执行回调
      }
    });
  }

  public increase() {
    this.doc.transact(() => { // 事务
      this.map.set(this.id, ++this.counter); // 自增本地`id`对应的值
    }, this); // 来源
  }
}

export default new Connection();

Quill

在运行富文本的实例Quill之前,我们不妨先来简单讨论一下是如何在富文本上应用的CRDT,在前文CRDT协同算法中主要讨论的是分布式与CRDT的原理,并没有涉及具体的富文本该如何设计数据结构,那么在这里我们简单讨论下yjs在富文本上应用CRDT的设计。看之前描述那一节的时候我们可能会产生一些有趣的想法,或许我们可以这么来做,可以通过底层来实现OT,之后在上层封装一层数据结构供外部使用的方式,从而对外看起来像是CRDT。当然原理上是不会这么做的,因为这样失去了拥抱CRDT的意义,可能会有部分借鉴实现的思路,但是不会直接这么做的。

首先我们可以回忆一下CRDT在集合这个数据结构上的设计,我们主要考虑到了集合的添加和删除如何完整的保证交换律、结合律、幂等律,那么现在在富文本的实现上,我们不仅需要考虑到插入和删除,需要考虑到顺序的问题,并且我们还需要保证CCI,即最终一致性、因果一致性、意图一致性,当然还需要考虑到Undo/Redo、光标同步等相关的问题。

那么我们首先来看看如何保证插入数据的顺序,对于OT而言是通过索引得知用户要操作的位置,并且通过变换来确保最终一致性,那么CRDT是不需要这么做的,上边也提到过完全靠OT的话可能就失去了拥抱CRDT的意义,那么如何确保要插入的位置正确呢,CRDT不靠索引的话就需要靠数据结构来完成这点,我们可以通过相对位置来完成,例如我们目前有AB字符串,此时在中间插入了C字符,那么这个字符就需要被标记为在A之后,在B之前,那么很显然,我们需要为每个字符都分配唯一的id,否则我们是无法做到这一点的,当然这块实际上还有优化空间,在这里就先不谈这点,那么由此我们通过相对位置保证了插入的顺序。

接下来我们再看看删除的问题,在前文的Observed-Remove Set集合数据结构中我们是可以真正的进行删除操作的,而在这里由于我们是通过相对位置来实现完整的顺序,所以实际上我们是不能够真正地将我们标记的Item进行删除的,Item可以理解为插入的字符,也就是所谓的软删除。举个例子,目前我们有AB字符串,其中一个客户端删除了B,另一个客户端同时在AB之间增加了C,那么此时这两个Op同步到了第三个客户端,那么假如增加了C这个操作先到并且执行了,再删除了B,那么没有问题,可是假设我们先删除了B,再增加了C,那么这个C我们就不能够找到他要插入的位置,因为B已经被删除了,我们是要在AB之间去插入C的,那么这样这个操作就无法执行下去了,由此这样其实就导致了操作不满足交换律,那么这就不能真的作为CRDT的数据结构设计了。其实我们可能会想,为什么需要两个位置来保证插入的字符位置,完全可以用B的左侧或者A的右侧来完成,实际上思考一下这是同样的问题,多个客户端来操作的话假如一个删除了A另一个删除了B,那么便无论如何也找不到插入的位置了,这是不满足交换律和结合律的操作,就不能作为CRDT的实现了。因此为了冲突的解决yjs并没有真正的删除Item,而是采用了标记的形式,即删除的Item会被加入一个deleted标记,那么不删除会造成一个明显的问题,空间的占用会无限增长,因此yjs引入了墓碑机制,当确认了内容不会再被干涉之后,将对象的内容替换为空的墓碑对象。

上边也提到了冲突的问题,很明显在设计上是存在冲突的问题的,因为CRDT实际上并不是完全为了协同编辑的场景而专门设计的,其主要是为了解决分布式场景中的一致性问题,所以在应用到协同编辑的场景中,不可避免地会出现冲突的问题,实际上这个冲突主要是为了集合顺序的引入而导致的,要是不关心顺序,那么自然就不会出现冲突问题了。那么为了使数据能够满足三律,在前文我们引入了一个偏序的概念,但是在协同编辑设计中,使用偏序不能够保证数据同步的正确性和一致性,因为其无法处理一些关键的冲突情况,举一个简单的例子,假设我们此时有AB字符串,如果一个客户端在AB中加入了C,另一个加入了D,那么究竟谁在前呢,所以我们需要引入全序的方法,即任意两个Item都是可以比较的。那么很明显的,如果我们为每个Item附加上时间戳的元信息,便可以引入全序了,但是实际上由于不同的客户端可能具有不同的时钟偏差,网络延迟和时钟不同步等问题也可能导致时间戳不可靠。那么相比之下,逻辑时钟或者逻辑时间戳可以使用更简单和可靠的方式来维护事件的顺序:

  • 每次发生本地事件时,clock = clocl + 1
  • 每次接收到远程事件时,clock = max(clock, remoteClock) + 1

看起来依旧会有发生冲突的可能,那么我们可以再引入一个客户端的唯一id,也就是clientID。这种机制看似简单,但实际上使我们获得了数学上性质良好的全序结构,这意味着我们可以在任意两个Item之间对比获得逻辑上的先后关系,这对保证CRDT算法的正确性相当重要。此外,通过这种方式我们也可以保证因果一致性,假如此时我们有两个操作ab如果有因果关系,那么a.clock一定大于b.clock,这样的得到的顺序一定是满足因果关系的,当然如果没有因果关系,就可以取任意的顺序执行了。举个例子,我们有三个客户端ABC以及字符串SEASE中间添加了a字符,此时这个操作同步到了BBa字符给删除了,假设此时C先收到了B的删除操作,因为这个操作依赖于A的操作,需要进行因果依赖关系的检查,这个操作的逻辑时钟和位移大于C本地文档中已经应用的操作的逻辑时钟和位移,需要等待先前的操作被应用后再应用这个操作,当然这并不是在yjs中的实现,因为yjs不会存在真正的删除操作,并且在删除操作的时候实际上并不会导致时钟的增加,只是增加一个标记,上边这个例子其实可以换个说法,两个相同的插入操作,因为我们是相对位置,所以后一个插入操作是依赖前一个插入操作的,因此就需要因果检查,其实这也是件有意思的事情,当收到在同一个位置编辑的不同客户端操作时候,如果时钟相同就是冲突操作,不相同就是因果关系。

那么由此我们通过CRDT数据结构与算法设计解决了最终一致性和因果一致性,对于意图一致性的问题,当不存在冲突的时候我们是能够保证意图的,即插入文档的Item的顺序,在冲突的时候我们实际上会比较clientID决定究竟谁在前在后,其实实际上无论谁在前还是在后都可以认为是一种乌龙,我们在冲突的时候只保证最终一致性,对于意图一致性则需要做额外的设计才可以实现,在这里就不做过多探讨了。实际上yjs还有大量的设计与优化操作,以及基于YATA的冲突解决算法等,比如通过双向链表来保存文档结构顺序,通过Map为每个客户端保存的扁平的 Item数组,优化本地插入的速度而设计的缓存机制(链表的查找O(N)与跟随光标的位置缓存),倾向于State-based的删除,Undo/Redo,光标同步,压缩数据网络传输等等,还是很值得研究的。

我们再回到富文本的实例Quill中,实现的主要功能是在quill富文本编辑器中接入协同,并支持编辑光标的同步,该实例的地址是https://github.com/WindrunnerMax/Collab/tree/master/packages/crdt-quill,首先简单看一下目录结构(tree --dirsfirst -I node_modules):

crdt-quill
├── public
│   └── favicon.ico
├── server
│   └── index.ts
├── src
│   ├── client.ts
│   ├── index.css
│   ├── index.ts
│   └── quill.ts
├── package.json
├── rollup.config.js
├── rollup.server.js
└── tsconfig.json

依旧简略说明下各个文件夹和文件的作用,public存储了静态资源文件,在客户端打包时将会把内容移动到build文件夹,server文件夹中存储了CRDT服务端的实现,在运行时同样会编译为js文件放置于build文件夹下,src文件夹是客户端的代码,主要是视图与CRDT客户端的实现,rollup.config.js是打包客户端的配置文件,rollup.server.js是打包服务端的配置文件,package.jsontsconfig.json大家都懂,就不赘述了。

quill的数据结构并不是JSON而是DeltaDelta是通过retaininsertdelete三个操作完成整篇文档的描述与操作,我们试想一下描述一段字符串的操作需要什么,是不是通过这三种操作就能够完全覆盖了,所以通过Delta来描述文本增删改是完全可行的,而且12quill的开源可以说是富文本发展的一个里程碑,于是yjs是直接原生支持Delta数据结构的。

接下来我们看看来看看服务端,这里主要实现是调用了一下y-websocket来启动一个websocket服务器,这是y-websocket给予的开箱即用的功能,也可以基于这些内容进行改写,yjs还提供了y-mongodb-provider等服务端服务可以使用。后边主要是使用了express启动了一个静态资源服务器,因为直接在浏览器打开文件的file协议有很多的安全限制,所以需要一个HTTP Server

import { exec } from "child_process";
import express from "express";

// https://github.com/yjs/y-websocket/blob/master/bin/server.js
exec("PORT=3001 npx y-websocket", (err, stdout, stderr) => { // 调用`y-websocket`
  console.log(stdout, stderr);
});

const app = express(); // 实例化`express`
app.use(express.static("build")); // 客户端打包过后的静态资源路径
app.use(express.static("node_modules/quill/dist")); // `quill`静态资源路径
app.listen(3000);
console.log("Listening on http://localhost:3000");

在客户端方面主要是定义了一个定义了一个共用的链接,通过crdt-quill作为RoomName进入组,这里需要链接的websocket服务器也就是上边启动的y-websocket3001端口的服务。之后我们定义了顶层的数据结构为YText数据结构的变化来执行回调,并且将一些信息暴露了出去,doc就是这需要使用的yjs实例,type是我们定义的顶层数据结构,awareness意为感知,只要是用来完成实时数据同步,在这里是用来同步光标选区。

import { Doc, Text as YText } from "yjs";
import { WebsocketProvider } from "y-websocket";

class Connection {
  public doc: Doc; // `yjs`实例
  public type: YText; // 顶层数据结构
  private connection: WebsocketProvider; // `WebSocket`链接
  public awareness: WebsocketProvider["awareness"]; // 数据实时同步

  constructor() {
    const doc = new Doc(); // 实例化
    const provider = new WebsocketProvider("ws://localhost:3001", "crdt-quill", doc); // 链接`WebSocket`服务器
    provider.on("status", (e: { status: string }) => {
      console.log("WebSocket", e.status); // 链接状态
    });
    this.doc = doc; // `yjs`实例
    this.type = doc.getText("quill"); // 获取顶层数据结构
    this.connection = provider; // 链接
    this.awareness = provider.awareness; // 数据实时同步
  }

  reconnect() {
    this.connection.connect(); // 重连
  }

  disconnect() {
    this.connection.disconnect(); // 断线
  }
}

export default new Connection();

在客户端主要分为了两部分,分别是实例化quill的实例,以及quillyjs客户端通信的实现。在quill的实现中主要是将quill实例化,注册光标的插件,随机生成id的方法,通过id获取随机颜色的方法,以及光标同步的位置转换。在quillyjs客户端通信的实现中,主要是完成了对于quilldoc的事件监听,主要是远程数据变更的回调,本地数据变化的回调,光标同步事件感知的回调。

import Quill from "quill";
import QuillCursors from "quill-cursors";
import tinyColor from "tinycolor2";
import { Awareness } from "y-protocols/awareness.js";
import {
  Doc,
  Text as YText,
  createAbsolutePositionFromRelativePosition,
  createRelativePositionFromJSON,
} from "yjs";
export type { Sources } from "quill";

Quill.register("modules/cursors", QuillCursors); // 注册光标插件

export default new Quill("#editor", { // 实例化`quill`
  theme: "snow",
  modules: { cursors: true },
});

const COLOR_MAP: Record<string, string> = {}; // `id => color`

export const getRandomId = () => Math.floor(Math.random() * 10000).toString(); // 随机生成用户`id`

export const getCursorColor = (id: string) => { // 根据`id`获取颜色
  COLOR_MAP[id] = COLOR_MAP[id] || tinyColor.random().toHexString();
  return COLOR_MAP[id];
};

export const updateCursor = (
  cursor: QuillCursors,
  state: Awareness["states"] extends Map<number, infer I> ? I : never,
  clientId: number,
  doc: Doc,
  type: YText
) => {
  try {
    // 从`Awareness`中取得状态
    if (state && state.cursor && clientId !== doc.clientID) {
      const user = state.user || {};
      const color = user.color || "#aaa";
      const name = user.name || `User: ${clientId}`;
      // 根据`clientId`创建光标
      cursor.createCursor(clientId.toString(), name, color);
      // 相对位置转换为绝对位置 // 选区为`focus --- anchor`
      const focus = createAbsolutePositionFromRelativePosition(
        createRelativePositionFromJSON(state.cursor.focus),
        doc
      );
      const anchor = createAbsolutePositionFromRelativePosition(
        createRelativePositionFromJSON(state.cursor.anchor),
        doc
      );
      if (focus && anchor && focus.type === type) {
        // 移动光标位置
        cursor.moveCursor(clientId.toString(), {
          index: focus.index,
          length: anchor.index - focus.index,
        });
      }
    } else {
      // 根据`clientId`移除光标
      cursor.removeCursor(clientId.toString());
    }
  } catch (err) {
    console.error(err);
  }
};
import "./index.css";
import quill, { getRandomId, updateCursor, Sources, getCursorColor } from "./quill";
import client from "./client";
import Delta from "quill-delta";
import QuillCursors from "quill-cursors";
import { compareRelativePositions, createRelativePositionFromTypeIndex } from "yjs";

const userId = getRandomId(); // 本地客户端的`id` 或者使用`awareness.clientID`
const doc = client.doc; // `yjs`实例
const type = client.type; // 顶层类型
const cursors = quill.getModule("cursors") as QuillCursors; // `quill`光标模块
const awareness = client.awareness; // 实时通信感知模块

// 设置当前客户端的信息 `State`的数据结构类似于`Record<string, unknown>`
awareness.setLocalStateField("user", {
  name: "User: " + userId,
  color: getCursorColor(userId),
});

// 页面显示的用户信息
const userNode = document.getElementById("user") as HTMLInputElement;
userNode && (userNode.value = "User: " + userId);

type.observe(event => {
  // 来源信息 // 本地`UpdateContents`不应该再触发`ApplyDelta'
  if (event.transaction.origin !== userId) {
    const delta = event.delta;
    quill.updateContents(new Delta(delta), "api"); // 应用远程数据, 来源
  }
});

quill.on("editor-change", (_: string, delta: Delta, state: Delta, origin: Sources) => {
  if (delta && delta.ops) {
    // 来源信息 // 本地`ApplyDelta`不应该再触发`UpdateContents`
    if (origin !== "api") {
      doc.transact(() => {
        type.applyDelta(delta.ops); // 应用`Ops`到`yjs`
      }, userId); // 来源
    }
  }

  const sel = quill.getSelection(); // 选区
  const aw = awareness.getLocalState(); // 实时通信状态数据
  if (sel === null) { // 失去焦点
    if (awareness.getLocalState() !== null) {
      awareness.setLocalStateField("cursor", null); // 清除选区状态
    }
  } else {
    // 卷对位置转换为相对位置 // 选区为`focus --- anchor`
    const focus = createRelativePositionFromTypeIndex(type, sel.index);
    const anchor = createRelativePositionFromTypeIndex(type, sel.index + sel.length);
    if (
      !aw ||
      !aw.cursor ||
      !compareRelativePositions(focus, aw.cursor.focus) ||
      !compareRelativePositions(anchor, aw.cursor.anchor)
    ) {
      // 选区位置发生变化 设置位置信息
      awareness.setLocalStateField("cursor", { focus, anchor });
    }
  }
  // 更新所有光标状态到本地
  awareness.getStates().forEach((aw, clientId) => {
    updateCursor(cursors, aw, clientId, doc, type);
  });
});

// 初始化更新所有远程光标状态到本地
awareness.getStates().forEach((state, clientId) => {
  updateCursor(cursors, state, clientId, doc, type);
});
// 监听远程状态变化的回调
awareness.on(
  "change",
  ({ added, removed, updated }: { added: number[]; removed: number[]; updated: number[] }) => {
    const states = awareness.getStates();
    added.forEach(id => {
      const state = states.get(id);
      state && updateCursor(cursors, state, id, doc, type);
    });
    updated.forEach(id => {
      const state = states.get(id);
      state && updateCursor(cursors, state, id, doc, type);
    });
    removed.forEach(id => {
      cursors.removeCursor(id.toString());
    });
  }
);

每日一题

https://github.com/WindrunnerMax/EveryDay

参考

https://docs.yjs.dev/
https://github.com/yjs/yjs
https://github.com/automerge/automerge
https://zhuanlan.zhihu.com/p/425265438
https://zhuanlan.zhihu.com/p/452980520
https://josephg.com/blog/crdts-go-brrr/
https://www.npmjs.com/package/quill-delta
https://josephg.com/blog/crdts-are-the-future/
https://github.com/yjs/yjs/blob/main/INTERNALS.md
https://cloud.tencent.com/developer/article/2081651