doc: 阅读redis pipeline/transaction相关文档

2025-09-04 20:08:56 +08:00
parent 57507cc3af
commit 42dbfbac36
1 changed files with 377 additions and 0 deletions
--- a/中间件/redis/redis.md
+++ b/中间件/redis/redis.md
@@ -0,0 +1,377 @@
 - [redis](#redis)
  - [Using Command](#using-command)
    - [Keys and values](#keys-and-values)
      - [Content of Keys](#content-of-keys)
      - [Hashtags](#hashtags)
      - [altering and querying the key space](#altering-and-querying-the-key-space)
      - [key expiration](#key-expiration)
      - [Navigating the keyspace](#navigating-the-keyspace)
        - [Scan](#scan)
        - [keys](#keys)
    - [pipelining](#pipelining)
      - [Request/Response protocols and round-trip time(RTT)](#requestresponse-protocols-and-round-trip-timertt)
      - [redis pipelining](#redis-pipelining)
      - [Performance Imporvement](#performance-imporvement)
      - [pipelining vs scripting](#pipelining-vs-scripting)
    - [Transactions](#transactions)
      - [Usage](#usage)
      - [Errors inside transaction](#errors-inside-transaction)
      - [rollback for redis Transaction](#rollback-for-redis-transaction)
      - [Discard the command queue](#discard-the-command-queue)
      - [Optimistic locking using check-and-set](#optimistic-locking-using-check-and-set)
      - [WATCH](#watch)
      - [UNWATCH](#unwatch)
      - [Using WATCH to implement ZPOP](#using-watch-to-implement-zpop)
 # redis
 ## Using Command
 ### Keys and values
 #### Content of Keys
 key为data model中`拥有含义的文本名称`。Redis key在命名格式方面几乎没有限制，故而key name中可以包含空格或标点符号。`redis key并不支持namespace或categories`，故而在命名时应当避免命名冲突。
 通常，会使用`:`符号来将redis的命名分割为多个sections，例如`office:London`，可以使用该命名规范来实现类似`categories`的效果。
 尽管keys通常是文本的，redis中也实现了`binary-safe` key。可以使用任何`byte sequence`来作为有效的key，并且，在redis中`empty string`也可以作为有效的key。
 redis key在命名时存在如下规范：
 - 不推荐使用长度很长的key，会在存储和key-comparisions方面带来负面影响
 - 不推荐使用长度非常短的key，其会减少可读性，通常`user:1000:followers`的可读性相较`u1000flw`来说可读性要更好，并且前者带来的额外存储开销也较小
 - 应在命名时使用统一的命名模式，例如`object-type:id`，在section中包含多个单词时，可以使用`.`或`-`符号来进行分隔，例如`comment:4321:reply.to`或`comment:4321:reply-to`
 - key size的最大允许大小为512MB
 #### Hashtags
 redis通过hashing来获取`key`关联的value。
 通常，整个key都会被用作hash index的计算，但是，在部分场景下，开发者可能只希望使用key中的一部分来计算hash index。此时，可以通过`{}`包围key中`想要计算hash index的部分`，该部分被称为hash-tag`。
 例如，`person:1`和`person:2`这两个key会计算出不同的hash index；但是`{persion}:1`和`{person}:2`这两个key计算出的hash index却是相同的，因为只有`person`会被用于计算hash index。
 通常，hashtag的应用场景是`在集群场景下进行multi-key operations`。在集群场景下，除非所有key计算出的hash index相同，否则集群并不允许执行multi-key操作。
 例如，`SINTER`命令用于查询两个不同`set values`的交集，可以接收多个key。在集群场景下：
 ```redis
 SINTER group:1 group:2
 ```
 上述命名并无法成功执行，因为`group:1`和`group:2`两个key的hash index不同。
 但是，如下命令在集群环境下则是可以正常执行：
 ```redis
 SINTER {group}:1 {group}:2
 ```
 hashtag让两个key产生相同的hash值。
 虽然hashtag在上述场景下有效，但是，不应该过度的使用hashtag。因为hashtag相同的key其hash index都相同，故而会被散列到同一个slot中，当同一slot中元素过多时，会导致redis的性能下降。
 #### altering and querying the key space
 存在部分命令，其并不针对特定的类型，而是用于和key space进行交互，其可以被用于所有类型的key。
 例如，`EXISTS`命令会返回0和1，代表给定key在redis中是否存在；而`DEL`命令则是用于删除key和key关联的value，无论value是什么类型。
 示例如下：
 ```bash
 > set mykey hello
 OK
 > exists mykey
 (integer) 1
 > del mykey
 (integer) 1
 > exists mykey
 (integer) 0
 ```
 在上述示例中，`DEL`命令返回的值为1或0，代表要被删除的值在redis中是否存在。
 `TYPE`命令则是可以返回`key所关联value的类型`:
 ```bash
 > set mykey x
 OK
 > type mykey
 string
 > del mykey
 (integer) 1
 > type mykey
 none
 ```
 #### key expiration
 在redis中，不管key对应的value为何种类型，都支持`key expiration`特性。`key exipiration`支持为key设置超时，`key expiration`也被称为`time to live`/`TTL`，当`ttl`指定的时间过去后，key将会被自动移除。
 对于key expiration：
 - 在对key设置key expiration时，可以按照秒或毫秒的精度进行设置
 - 但是，`expire time`在解析时单位永远为毫秒
 - expire相关的信息会被`replicated`并存储在磁盘中，即使在redis宕机时，`time virtually passes`（即redis key其expire若为1天，宕机4小时后恢复，其expire会变为8小时，宕机并不会导致key expire停止计算）
 可以通过`EXPIRE`命令来设置key expiration：
 ```bash
 > set key some-value
 OK
 > expire key 5
 (integer) 1
 > get key (immediately)
 "some-value"
 > get key (after some time)
 (nil)
 ```
 在第二次调用时，delay超过5s，key已经不存在。
 上述示例中，`expire key 5`将key的超时时间设置为了5s，`EXPIRE`用于为key指定不同的超时时间。
 类似的，可以通过`PERSIST`命令来取消key的超时设置，让key永久被保留。
 除了使用`expire`来设置超时外，在创建时也能会key指定expiration：
 ```bash
 > set key 100 ex 10
 OK
 > ttl key
 (integer) 9
 ```
 上述示例中，使用`ttl`命令来检查key的超时时间。
 如果想要按照毫秒来设置超时，可以使用`PEXPIRE`和`PTTL`命令。
 #### Navigating the keyspace
 ##### Scan
 `SCAN`命令支持对redis中key的增量迭代，在每次调用时只会返回一小部分数据。该命令可以在生产中使用，并不会像`keys`或`smembers`等命令一样，在处理大量elements或keys时可能产生长时间的阻塞。
 scan使用实例如下：
 ```bash
 > scan 0
 1) "17"
 2)  1) "key:12"
    2) "key:8"
    3) "key:4"
    4) "key:14"
    5) "key:16"
    6) "key:17"
    7) "key:15"
    8) "key:10"
    9) "key:3"
   10) "key:7"
   11) "key:1"
 > scan 17
 1) "0"
 2) 1) "key:5"
   2) "key:18"
   3) "key:0"
   4) "key:2"
   5) "key:19"
   6) "key:13"
   7) "key:6"
   8) "key:9"
   9) "key:11"
 ```
 scan是一个cursor based iterator，每次在调用scan命令时，都会返回一个`update cursor`，并且在下次调用scan时需要使用上次返回的cursor。
 当cursor被设置为0时，iteration将会开始，并且当server返回的cursor为0时，iteration结束。
 ##### keys
 除了scan外，还可以通过keys命令来迭代redis中所有的key。但是，和`scan`的增量迭代不同的是，keys会一次性返回所有的key，在返回前会阻塞redis-server。
 keys命令支持glob-style pattern：
 - `h?llo`：`?`用于匹配单个字符
 - `h*llo`: `*`用于匹配除`/`外的任何内容
 - `h[ae]llo`: 匹配`hallo`和`hello`
 - `h[^e]llo`: [^e]匹配除`e`外的任何字符
 - `h[a-b]llo`: 匹配`hallo`和`hbllo`
 global-style pattern中转义符为`\`
 ### pipelining
 redis pipelining支持一次发送多条命令，而非`逐条发送命令，并且发送后一条命令之前必须要等待前一条请求执行完成`。pipelining被绝大多数redis client支持，能够提高性能。
 #### Request/Response protocols and round-trip time(RTT)
 redis是一个使用`client-server model`的tcp server，在请求完成前，会经历如下步骤：
 - client向server发送query，并且阻塞的从socket中读取server的响应
 - server接收到client的请求后，处理命令，并且将处理结果返回给client
 例如，包含4条命令的命令序列如下：
 1. client: incr x
 2. server: 1
 3. client: incr x
 4. server: 2
 5. client: incr x
 6. server: 3
 7. client: incr x
 8. server: 4
 client和server之间通过网络进行连接，每次client和server的请求/响应，都需要经历`client发送请求，server发送响应`的过程，该过程会经过网络来传输，带来传输延迟。
 该延迟被称为`RTT`(round trip time), 如果在一次请求中能够发送`n`条命令，那么将能够节省`n-1`次网络传输的往返时间。例如，RTT如果为`250ms`，即使server能够以`100K/s`的速度处理请求，对于同一client，其每秒也只能处理4条命令。
 #### redis pipelining
 在redis server处理命令时，其处理新请求前并不要求client接收到旧请求，并且client在发送多条命令后，会一次性统一读取执行结果。
 该技术被称为`Pipelining`，在其他协议中也有广泛使用，例如`POP3`。
 pipelining在redis的所有版本中都被支持，示例如下：
 ```bash
 $ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379
 +PONG
 +PONG
 +PONG
 ```
 通过pipelining，并不需要对每个命令都花费RTT用于网络传输，而是在一次网络传输时就包含3条命令。
 > 当client使用pipelining发送commands时，server会在内存中对replies进行排队。故而，在client需要使用pipeline向server发送大量的请求时，其需要分批发送，每批中包含合适数量的命令。
 > pipeline会积累多条命令并一次性发送给server。
 #### Performance Imporvement
 pipeline不仅能够减少RTT的次数，其也能够增加redis server在每秒的执行操作数。
 在redis server处理command时，实际的处理逻辑开销很小，但是和socket io的交互开销却很大。在进行socket io时，会进行`write`和`read`的系统调用，其涉及到用户态和内核态的切换，这将带来巨大的开销。
 如果使用pipeline，多条指令只需要调用一次`read`系统调用，并且多条执行的执行结果只需要通过一次`write`系统调用即能够执行。通过使用pipeline，能够有效降低redis server的系统调用次数，这将减少socket io带来的开销，故而redis server能够在一秒内执行更多的commands。
 #### pipelining vs scripting
 相比于pipelining，scripting可以在`read, compute, write`的场景下带来更高的性能。pipelining并无法处理`read, compute, write`的场景，因为在执行write command之前，需要先获取read command的执行结果，故而无法将read和write命令通过pipeline同时发送给server。
 ### Transactions
 redis transaction支持`execute a group of commands in a single step`，其涉及到`multi, exec, discard, watch`命令。
 - 在redis事务中，所有命令都会被串行、按顺序执行，在redis transaction执行时，其他client发送的请求永远不会插入到redis transaction中间。在redis transaction中，所有命令都会`executed as a single siolated operation`，事务执行的过程中不会被其他命令打断
 - `EXEC`命令会触发事务中所有命令的执行，故而，当client在`事务上下文中exec命令调用之前`，失去了与server的连接，事务中的命令都不会被执行。只有当exec被调用后，事务中的命令才会实际开始执行
 #### Usage
 可以通过`multi`命令来进入redis事务，该命令总会返回`ok`。在进入事务后，可以向事务中添加多条命令，这些命令并不会被立马执行，而是被排队。只有当发送`EXEC`命令后，之前排队的命令才会被实际执行。
 `DISCARD`命令可以清空被排队的命令，并且退出事务的上下文。
 如下示例展示了如何通过事务原子的执行一系列命令：
 ```bash
 > MULTI
 OK
 > INCR foo
 QUEUED
 > INCR bar
 QUEUED
 > EXEC
 1) (integer) 1
 2) (integer) 1
 ```
 `EXEC`命令会返回一个数组，数组中元素为之前QUEUED COMMANDS的返回结果，顺序和命令被添加到队列中的顺序相同。
 在事务上下文中，所有命令（`EXEC`除外）都会返回`QUEUED`。
 #### Errors inside transaction
 在使用事务时，可能遇到如下两种errors：
 - 将命令添加到queue中时可能发生失败，该时机在`EXEC`被执行之前。例如，command可能存在语法错误，或是存在内存错误等，都可能导致命令添加到queue失败
 - 调用`EXEC`对入队的命令实际执行时，可能发生异常，例如在实际执行command时，对string类型的value执行了list操作
 对于`EXEC`时产生的错误，并没有特殊处理：`即使事务中部分命令实际执行失败，其他的命令也都会被执行`。
 示例如下所示：
 ```redis
 Trying 127.0.0.1...
 Connected to localhost.
 Escape character is '^]'.
 MULTI
 +OK
 SET a abc
 +QUEUED
 LPOP a
 +QUEUED
 EXEC
 *2
 +OK
 -WRONGTYPE Operation against a key holding the wrong kind of value
 ```
 上述示例中执行了两个命令，其中命令1执行成功而命令2执行失败。
 需要注意的是，`事务中即使某个命令执行失败，queue中的其他命令仍然会被执行`，redis在执行某条命令失败时，并不会对别的命令执行造成影响。
 #### rollback for redis Transaction
 对于redis transaction，其并不对`rollback`做支持，rollback会对redis的性能造成巨大影响，也会影响redis的易用性。
 #### Discard the command queue
 如果想要对事务进行abort，可以调用`DISCARD`命令，在该场景下，并不会有命令被实际执行，并且连接状态也会恢复为正常：
 ```redis
 > SET foo 1
 OK
 > MULTI
 OK
 > INCR foo
 QUEUED
 > DISCARD
 OK
 > GET foo
 "1"
 ```
 #### Optimistic locking using check-and-set
 在redis transaction中，`WATCH`命令用于提供`CAS`行为。`watched keys`将会被监控，并探知其是否发生变化。
 在执行`EXEC`命令前，如果存在任一key发生过修改，那么整个事务都会发生`abort`，并且会返回`NULL`，用以提示事务失败。
 如下是一个`read, compute, write`的示例：
 ```
 val = GET mykey
 val = val + 1
 SET mykey val
 ```
 上述逻辑在`只存在一个客户端`的场景下工作正常，但是当存在多个客户端时，将会发生竞争。由于上述逻辑并不是原子的，故而可能出现如下场景：
 1. client A read old value
 2. client B read old value
 3. client A compute `old value + 1`
 4. client B compute `old value + 1`
 5. client A set new value with `old value + 1`
 6. client B set new value with `old value + 1`
 故而，在多client场景下，假设old value为10，即使client A和client B都对value进行了incr，最后new value的值仍有可能为11而不是12
 通过WATCH机制能够解决该问题
 ```
 WATCH mykey
 val = GET mykey
 val = val + 1
 MULTI
 SET mykey $val
 EXEC
 ```
 在上述示例中，在进入事务上下文前，client对mykey进行了watch并完成新值的计算，之后，进入事务上下文后，用new value设置mykey，并调用`EXEC`命令。
 如果WATCH和EXEC之间，存在其他client修改了mykey的值，那么当前事务将会失败。
 只需要在发生竞争时重新执行上述流程，那么其即是乐观锁。
 #### WATCH
 `WATCH`命令会让`EXEC`是条件的：
 - 只有当所有watched keys都未修改的前提下，才会让redis实际执行transaction
 `watched keys`可能发生如下的修改：
 - watched keys可能被其他client修改
 - watched keys可能被redis本身修改，redis本身的修改包含如下场景
  - expiration
  - eviction
 如果在`对keys进行watch`和实际调用`exec`之间，keys发生的变化，整个transaction都会被abort。
 > 在redis 6.0.9之前，expired keys并不会造成redis transaction被abort
 > 在本事务内的命令并不会造成WATCH condition被触发，因为WATCH机制的时间范围为keys watched的时间点到exec调用前的时间点，而queued commands在调用exec后才会实际执行
 `watch`命令可以被多次调用，所有的watch命令都会生效，并且在watch被调用后就开始监控key的变化，监控一直到`EXEC`被调用后才结束。
 对于`WATCH`命令，可以传递任意数量的参数。
 在`EXEC`命令被调用后，所有的watched keys都会被`unwatched`，不管事务是否被aborted。并且，当client连接关闭后，所有keys都会被unwatched。
 #### UNWATCH
 可以通过`UNWATCH`命令（无参数）来清空所有的watched keys。
 通常，在调用`MULTI`进入事务前，会执行如下操作：
 - `WATCH mykey`
 - `GET mykey`
 如果`在GET mykey`后，`调用MULTI`之前，如果在读取mykey的值后不再想执行后续事务了，那么可以直接调用`UNWATCH`，对先前监视的所有key取消监视。
 #### Using WATCH to implement ZPOP
 如下是一个使用WATCH的示例
 ```redis
 WATCH zset
 element = ZRANGE zset 0 0
 MULTI
 ZREM zset element
 EXEC
 ```