doc: 阅读redis pipeline/transaction相关文档

2025-09-04 20:08:56 +08:00
parent 57507cc3af
commit 42dbfbac36
1 changed files with 377 additions and 0 deletions
--- a/中间件/redis/redis.md
+++ b/中间件/redis/redis.md
@@ -0,0 +1,377 @@
+- [redis](#redis)
+  - [Using Command](#using-command)
+    - [Keys and values](#keys-and-values)
+      - [Content of Keys](#content-of-keys)
+      - [Hashtags](#hashtags)
+      - [altering and querying the key space](#altering-and-querying-the-key-space)
+      - [key expiration](#key-expiration)
+      - [Navigating the keyspace](#navigating-the-keyspace)
+        - [Scan](#scan)
+        - [keys](#keys)
+    - [pipelining](#pipelining)
+      - [Request/Response protocols and round-trip time(RTT)](#requestresponse-protocols-and-round-trip-timertt)
+      - [redis pipelining](#redis-pipelining)
+      - [Performance Imporvement](#performance-imporvement)
+      - [pipelining vs scripting](#pipelining-vs-scripting)
+    - [Transactions](#transactions)
+      - [Usage](#usage)
+      - [Errors inside transaction](#errors-inside-transaction)
+      - [rollback for redis Transaction](#rollback-for-redis-transaction)
+      - [Discard the command queue](#discard-the-command-queue)
+      - [Optimistic locking using check-and-set](#optimistic-locking-using-check-and-set)
+      - [WATCH](#watch)
+      - [UNWATCH](#unwatch)
+      - [Using WATCH to implement ZPOP](#using-watch-to-implement-zpop)
+
+
+# redis
+## Using Command
+### Keys and values
+#### Content of Keys
+key为data model中`拥有含义的文本名称`。Redis key在命名格式方面几乎没有限制，故而key name中可以包含空格或标点符号。`redis key并不支持namespace或categories`，故而在命名时应当避免命名冲突。
+
+通常，会使用`:`符号来将redis的命名分割为多个sections，例如`office:London`，可以使用该命名规范来实现类似`categories`的效果。
+
+尽管keys通常是文本的，redis中也实现了`binary-safe` key。可以使用任何`byte sequence`来作为有效的key，并且，在redis中`empty string`也可以作为有效的key。
+
+redis key在命名时存在如下规范：
+- 不推荐使用长度很长的key，会在存储和key-comparisions方面带来负面影响
+- 不推荐使用长度非常短的key，其会减少可读性，通常`user:1000:followers`的可读性相较`u1000flw`来说可读性要更好，并且前者带来的额外存储开销也较小
+- 应在命名时使用统一的命名模式，例如`object-type:id`，在section中包含多个单词时，可以使用`.`或`-`符号来进行分隔，例如`comment:4321:reply.to`或`comment:4321:reply-to`
+- key size的最大允许大小为512MB
+
+#### Hashtags
+redis通过hashing来获取`key`关联的value。
+
+通常，整个key都会被用作hash index的计算，但是，在部分场景下，开发者可能只希望使用key中的一部分来计算hash index。此时，可以通过`{}`包围key中`想要计算hash index的部分`，该部分被称为hash-tag`。
+
+例如，`person:1`和`person:2`这两个key会计算出不同的hash index；但是`{persion}:1`和`{person}:2`这两个key计算出的hash index却是相同的，因为只有`person`会被用于计算hash index。
+
+通常，hashtag的应用场景是`在集群场景下进行multi-key operations`。在集群场景下，除非所有key计算出的hash index相同，否则集群并不允许执行multi-key操作。
+
+例如，`SINTER`命令用于查询两个不同`set values`的交集，可以接收多个key。在集群场景下：
+```redis
+SINTER group:1 group:2
+```
+上述命名并无法成功执行，因为`group:1`和`group:2`两个key的hash index不同。
+
+但是，如下命令在集群环境下则是可以正常执行：
+```redis
+SINTER {group}:1 {group}:2
+```
+hashtag让两个key产生相同的hash值。
+
+虽然hashtag在上述场景下有效，但是，不应该过度的使用hashtag。因为hashtag相同的key其hash index都相同，故而会被散列到同一个slot中，当同一slot中元素过多时，会导致redis的性能下降。
+
+#### altering and querying the key space
+存在部分命令，其并不针对特定的类型，而是用于和key space进行交互，其可以被用于所有类型的key。
+
+例如，`EXISTS`命令会返回0和1，代表给定key在redis中是否存在；而`DEL`命令则是用于删除key和key关联的value，无论value是什么类型。
+
+示例如下：
+```bash
+> set mykey hello
+OK
+> exists mykey
+(integer) 1
+> del mykey
+(integer) 1
+> exists mykey
+(integer) 0
+```
+在上述示例中，`DEL`命令返回的值为1或0，代表要被删除的值在redis中是否存在。
+
+`TYPE`命令则是可以返回`key所关联value的类型`:
+```bash
+> set mykey x
+OK
+> type mykey
+string
+> del mykey
+(integer) 1
+> type mykey
+none
+```
+
+#### key expiration
+在redis中，不管key对应的value为何种类型，都支持`key expiration`特性。`key exipiration`支持为key设置超时，`key expiration`也被称为`time to live`/`TTL`，当`ttl`指定的时间过去后，key将会被自动移除。
+
+对于key expiration：
+- 在对key设置key expiration时，可以按照秒或毫秒的精度进行设置
+- 但是，`expire time`在解析时单位永远为毫秒
+- expire相关的信息会被`replicated`并存储在磁盘中，即使在redis宕机时，`time virtually passes`（即redis key其expire若为1天，宕机4小时后恢复，其expire会变为8小时，宕机并不会导致key expire停止计算）
+
+可以通过`EXPIRE`命令来设置key expiration：
+```bash
+> set key some-value
+OK
+> expire key 5
+(integer) 1
+> get key (immediately)
+"some-value"
+> get key (after some time)
+(nil)
+```
+
+在第二次调用时，delay超过5s，key已经不存在。
+
+上述示例中，`expire key 5`将key的超时时间设置为了5s，`EXPIRE`用于为key指定不同的超时时间。
+
+类似的，可以通过`PERSIST`命令来取消key的超时设置，让key永久被保留。
+
+除了使用`expire`来设置超时外，在创建时也能会key指定expiration：
+```bash
+> set key 100 ex 10
+OK
+> ttl key
+(integer) 9
+```
+上述示例中，使用`ttl`命令来检查key的超时时间。
+
+如果想要按照毫秒来设置超时，可以使用`PEXPIRE`和`PTTL`命令。
+
+#### Navigating the keyspace
+##### Scan
+`SCAN`命令支持对redis中key的增量迭代，在每次调用时只会返回一小部分数据。该命令可以在生产中使用，并不会像`keys`或`smembers`等命令一样，在处理大量elements或keys时可能产生长时间的阻塞。
+
+scan使用实例如下：
+```bash
+> scan 0
+1) "17"
+2)  1) "key:12"
+    2) "key:8"
+    3) "key:4"
+    4) "key:14"
+    5) "key:16"
+    6) "key:17"
+    7) "key:15"
+    8) "key:10"
+    9) "key:3"
+   10) "key:7"
+   11) "key:1"
+> scan 17
+1) "0"
+2) 1) "key:5"
+   2) "key:18"
+   3) "key:0"
+   4) "key:2"
+   5) "key:19"
+   6) "key:13"
+   7) "key:6"
+   8) "key:9"
+   9) "key:11"
+```
+scan是一个cursor based iterator，每次在调用scan命令时，都会返回一个`update cursor`，并且在下次调用scan时需要使用上次返回的cursor。
+
+当cursor被设置为0时，iteration将会开始，并且当server返回的cursor为0时，iteration结束。
+
+##### keys
+除了scan外，还可以通过keys命令来迭代redis中所有的key。但是，和`scan`的增量迭代不同的是，keys会一次性返回所有的key，在返回前会阻塞redis-server。
+
+keys命令支持glob-style pattern：
+- `h?llo`：`?`用于匹配单个字符
+- `h*llo`: `*`用于匹配除`/`外的任何内容
+- `h[ae]llo`: 匹配`hallo`和`hello`
+- `h[^e]llo`: [^e]匹配除`e`外的任何字符
+- `h[a-b]llo`: 匹配`hallo`和`hbllo`
+
+global-style pattern中转义符为`\`
+
+### pipelining
+redis pipelining支持一次发送多条命令，而非`逐条发送命令，并且发送后一条命令之前必须要等待前一条请求执行完成`。pipelining被绝大多数redis client支持，能够提高性能。
+
+#### Request/Response protocols and round-trip time(RTT)
+redis是一个使用`client-server model`的tcp server，在请求完成前，会经历如下步骤：
+- client向server发送query，并且阻塞的从socket中读取server的响应
+- server接收到client的请求后，处理命令，并且将处理结果返回给client
+
+例如，包含4条命令的命令序列如下：
+1. client: incr x
+2. server: 1
+3. client: incr x
+4. server: 2
+5. client: incr x
+6. server: 3
+7. client: incr x
+8. server: 4
+
+client和server之间通过网络进行连接，每次client和server的请求/响应，都需要经历`client发送请求，server发送响应`的过程，该过程会经过网络来传输，带来传输延迟。
+
+该延迟被称为`RTT`(round trip time), 如果在一次请求中能够发送`n`条命令，那么将能够节省`n-1`次网络传输的往返时间。例如，RTT如果为`250ms`，即使server能够以`100K/s`的速度处理请求，对于同一client，其每秒也只能处理4条命令。
+
+#### redis pipelining
+在redis server处理命令时，其处理新请求前并不要求client接收到旧请求，并且client在发送多条命令后，会一次性统一读取执行结果。
+
+该技术被称为`Pipelining`，在其他协议中也有广泛使用，例如`POP3`。
+
+pipelining在redis的所有版本中都被支持，示例如下：
+```bash
+$ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379
+PONG
+PONG
+PONG
+```
+通过pipelining，并不需要对每个命令都花费RTT用于网络传输，而是在一次网络传输时就包含3条命令。
+
+> 当client使用pipelining发送commands时，server会在内存中对replies进行排队。故而，在client需要使用pipeline向server发送大量的请求时，其需要分批发送，每批中包含合适数量的命令。
+
+> pipeline会积累多条命令并一次性发送给server。
+
+#### Performance Imporvement
+pipeline不仅能够减少RTT的次数，其也能够增加redis server在每秒的执行操作数。
+
+在redis server处理command时，实际的处理逻辑开销很小，但是和socket io的交互开销却很大。在进行socket io时，会进行`write`和`read`的系统调用，其涉及到用户态和内核态的切换，这将带来巨大的开销。
+
+如果使用pipeline，多条指令只需要调用一次`read`系统调用，并且多条执行的执行结果只需要通过一次`write`系统调用即能够执行。通过使用pipeline，能够有效降低redis server的系统调用次数，这将减少socket io带来的开销，故而redis server能够在一秒内执行更多的commands。
+
+#### pipelining vs scripting
+相比于pipelining，scripting可以在`read, compute, write`的场景下带来更高的性能。pipelining并无法处理`read, compute, write`的场景，因为在执行write command之前，需要先获取read command的执行结果，故而无法将read和write命令通过pipeline同时发送给server。
+
+### Transactions
+redis transaction支持`execute a group of commands in a single step`，其涉及到`multi, exec, discard, watch`命令。
+
+- 在redis事务中，所有命令都会被串行、按顺序执行，在redis transaction执行时，其他client发送的请求永远不会插入到redis transaction中间。在redis transaction中，所有命令都会`executed as a single siolated operation`，事务执行的过程中不会被其他命令打断
+- `EXEC`命令会触发事务中所有命令的执行，故而，当client在`事务上下文中exec命令调用之前`，失去了与server的连接，事务中的命令都不会被执行。只有当exec被调用后，事务中的命令才会实际开始执行
+
+#### Usage
+可以通过`multi`命令来进入redis事务，该命令总会返回`ok`。在进入事务后，可以向事务中添加多条命令，这些命令并不会被立马执行，而是被排队。只有当发送`EXEC`命令后，之前排队的命令才会被实际执行。
+
+`DISCARD`命令可以清空被排队的命令，并且退出事务的上下文。
+
+如下示例展示了如何通过事务原子的执行一系列命令：
+```bash
+> MULTI
+OK
+> INCR foo
+QUEUED
+> INCR bar
+QUEUED
+> EXEC
+1) (integer) 1
+2) (integer) 1
+```
+
+`EXEC`命令会返回一个数组，数组中元素为之前QUEUED COMMANDS的返回结果，顺序和命令被添加到队列中的顺序相同。
+
+在事务上下文中，所有命令（`EXEC`除外）都会返回`QUEUED`。
+
+#### Errors inside transaction
+在使用事务时，可能遇到如下两种errors：
+- 将命令添加到queue中时可能发生失败，该时机在`EXEC`被执行之前。例如，command可能存在语法错误，或是存在内存错误等，都可能导致命令添加到queue失败
+- 调用`EXEC`对入队的命令实际执行时，可能发生异常，例如在实际执行command时，对string类型的value执行了list操作
+
+对于`EXEC`时产生的错误，并没有特殊处理：`即使事务中部分命令实际执行失败，其他的命令也都会被执行`。
+
+示例如下所示：
+```redis
+Trying 127.0.0.1...
+Connected to localhost.
+Escape character is '^]'.
+MULTI
+OK
+SET a abc
+QUEUED
+LPOP a
+QUEUED
+EXEC
+*2
+OK
+-WRONGTYPE Operation against a key holding the wrong kind of value
+```
+上述示例中执行了两个命令，其中命令1执行成功而命令2执行失败。
+
+需要注意的是，`事务中即使某个命令执行失败，queue中的其他命令仍然会被执行`，redis在执行某条命令失败时，并不会对别的命令执行造成影响。
+
+#### rollback for redis Transaction
+对于redis transaction，其并不对`rollback`做支持，rollback会对redis的性能造成巨大影响，也会影响redis的易用性。
+
+#### Discard the command queue
+如果想要对事务进行abort，可以调用`DISCARD`命令，在该场景下，并不会有命令被实际执行，并且连接状态也会恢复为正常：
+```redis
+> SET foo 1
+OK
+> MULTI
+OK
+> INCR foo
+QUEUED
+> DISCARD
+OK
+> GET foo
+"1"
+```
+#### Optimistic locking using check-and-set
+在redis transaction中，`WATCH`命令用于提供`CAS`行为。`watched keys`将会被监控，并探知其是否发生变化。
+
+在执行`EXEC`命令前，如果存在任一key发生过修改，那么整个事务都会发生`abort`，并且会返回`NULL`，用以提示事务失败。
+
+如下是一个`read, compute, write`的示例：
+```
+val = GET mykey
+val = val + 1
+SET mykey val
+```
+上述逻辑在`只存在一个客户端`的场景下工作正常，但是当存在多个客户端时，将会发生竞争。由于上述逻辑并不是原子的，故而可能出现如下场景：
+1. client A read old value
+2. client B read old value
+3. client A compute `old value + 1`
+4. client B compute `old value + 1`
+5. client A set new value with `old value + 1`
+6. client B set new value with `old value + 1`
+
+故而，在多client场景下，假设old value为10，即使client A和client B都对value进行了incr，最后new value的值仍有可能为11而不是12
+
+通过WATCH机制能够解决该问题
+```
+WATCH mykey
+val = GET mykey
+val = val + 1
+MULTI
+SET mykey $val
+EXEC
+```
+在上述示例中，在进入事务上下文前，client对mykey进行了watch并完成新值的计算，之后，进入事务上下文后，用new value设置mykey，并调用`EXEC`命令。
+
+如果WATCH和EXEC之间，存在其他client修改了mykey的值，那么当前事务将会失败。
+
+只需要在发生竞争时重新执行上述流程，那么其即是乐观锁。
+
+#### WATCH
+`WATCH`命令会让`EXEC`是条件的：
+- 只有当所有watched keys都未修改的前提下，才会让redis实际执行transaction
+
+`watched keys`可能发生如下的修改：
+- watched keys可能被其他client修改
+- watched keys可能被redis本身修改，redis本身的修改包含如下场景
+  - expiration
+  - eviction
+
+如果在`对keys进行watch`和实际调用`exec`之间，keys发生的变化，整个transaction都会被abort。
+
+> 在redis 6.0.9之前，expired keys并不会造成redis transaction被abort
+
+> 在本事务内的命令并不会造成WATCH condition被触发，因为WATCH机制的时间范围为keys watched的时间点到exec调用前的时间点，而queued commands在调用exec后才会实际执行
+
+`watch`命令可以被多次调用，所有的watch命令都会生效，并且在watch被调用后就开始监控key的变化，监控一直到`EXEC`被调用后才结束。
+
+对于`WATCH`命令，可以传递任意数量的参数。
+
+在`EXEC`命令被调用后，所有的watched keys都会被`unwatched`，不管事务是否被aborted。并且，当client连接关闭后，所有keys都会被unwatched。
+
+#### UNWATCH
+可以通过`UNWATCH`命令（无参数）来清空所有的watched keys。
+
+通常，在调用`MULTI`进入事务前，会执行如下操作：
+- `WATCH mykey`
+- `GET mykey`
+
+如果`在GET mykey`后，`调用MULTI`之前，如果在读取mykey的值后不再想执行后续事务了，那么可以直接调用`UNWATCH`，对先前监视的所有key取消监视。
+
+#### Using WATCH to implement ZPOP
+如下是一个使用WATCH的示例
+```redis
+WATCH zset
+element = ZRANGE zset 0 0
+MULTI
+ZREM zset element
+EXEC
+```