Redis 数据备份与恢复
数据备份
Redis save
命令用于创建当前数据库的备份。该命令将在 redis 安装目录中创建dump.rdb文件。
创建 redis 备份文件也可以使用命令 bgsave
,该命令在后台执行。
语法
save
实例
1 | 127.0.0.1:6379> save |
恢复数据
如果需要恢复数据,只需将备份文件 (dump.rdb) 移动到 redis 安装目录并启动服务即可。获取 redis 目录可以使用config
命令,如下所示:
1 | 127.0.0.1:6379> config get dir |
Redis 安全
我们可以通过 redis 的配置文件设置密码参数,这样客户端连接到 redis 服务就需要密码验证,这样可以让你的 redis 服务更安全。
默认情况下 requirepass 参数是空的,这就意味着你无需通过密码验证就可以连接到 redis 服务。
语法
auth password
实例
1 | 127.0.0.1:6379> config get requirepass |
Redis 性能测试
Redis 性能测试是通过同时执行多个命令实现的。
语法
redis-benchmark [option] [option value]
注意:该命令是在 redis 的目录下执行的,而不是 redis
客户端的内部指令。
实例
同时执行 10000 个请求来检测性能:
1 | $ ./redis-benchmark -n 10000 -q |
序号 | 选项 | 描述 | 默认值 |
---|---|---|---|
1 | -h | 指定服务器主机名 | 127.0.0.1 |
2 | -p | 指定服务器端口 | 6379 |
3 | -s | 指定服务器 socket | |
4 | -c | 指定并发连接数 | 50 |
5 | -n | 指定请求数 | 10000 |
6 | -d | 以字节的形式指定 SET/GET 值的数据大小 | 2 |
7 | -k | 1=keep alive 0=reconnect | 1 |
8 | -r | SET/GET/INCR 使用随机 key, SADD 使用随机值 | |
9 | -P | 通过管道传输<numreq> 请求 | 1 |
10 | -q | 强制退出 redis。仅显示 query/sec 值 | |
11 | –csv | 以 CSV 格式输出 | |
12 | -l | 生成循环,永久执行测试 | |
13 | -t | 仅运行以逗号分隔的测试命令列表。 | |
14 | -I | Idle 模式。仅打开 N 个 idle 连接并等待。 |
1 | $ ./redis-benchmark -h 127.0.0.1 -p 6379 -t set,lpush -n 10000 -q |
以上实例中主机为 127.0.0.1,端口号为 6379,执行的命令为 set,lpush,请求数为 10000,通过 -q 参数让结果只显示每秒执行的请求数。
Redis 客户端连接
Redis 通过监听一个 TCP 端口或者 Unix socket 的方式来接收来自客户端的连接,当一个连接建立后,Redis 内部会进行以下一些操作:
- 首先,客户端 socket 会被设置为非阻塞模式,因为 Redis 在网络事件处理上采用的是非阻塞多路复用模型。
- 然后为这个 socket 设置 TCP_NODELAY 属性,禁用 Nagle 算法
- 然后创建一个可读的文件事件用于监听这个客户端 socket 的数据发送
Socket编程中,TCP_NODELAY选项是用来控制是否开启Nagle算法,该算法是为了提高较慢的广域网传输效率,减小小分组的报文个数,完整描述:
该算法要求一个TCP连接上最多只能有一个未被确认的小分组,在该小分组的确认到来之前,不能发送其他小分组。
最大连接数
在 Redis2.4 中,最大连接数是被直接硬编码在代码里面的,而在2.6版本中这个值变成可配置的。
maxclients 的默认值是 10000,你也可以在 redis.conf 中对这个值进行修改。
1 | 127.0.0.1:6379> config get maxclients |
1 | ./redis-server --maxclients 100000 # 在服务启动时设置最大连接数为 100000 |
客户端命令
序号 | 命令 | 描述 | 可用版本 | 时间复杂度 |
---|---|---|---|---|
1 | client list | 以人类可读的格式,返回所有连接到服务器的客户端信息和统计数据。返回的信息含义参见 | >=2.4.0 | O(N), N 为连接到服务器的客户端数量。 |
2 | client setname | 1. 为当前连接分配一个名字。这个名字会显示在client list 命令的结果中, 用于识别当前正在与服务器进行连接的客户端。获取通过client setname 命令设置的服务名称。2. 名字使用 Redis 的字符串类型来保存, 最大可以占用 512 MB 。 3. 另外, 为了避免和 client list 命令的输出格式发生冲突, 名字里不允许使用空格。4. 要移除一个连接的名字, 可以将连接的名字设为空字符串 "" 。5. 新创建的连接默认是没有名字的。在 Redis 应用程序发生连接泄漏时,为连接设置名字是一种很好的 debug 手段。 | >=2.6.9 | O(1) |
3 | client getname | 返回client getname 命令为连接设置的名字。因为新创建的连接默认是没有名字的, 对于没有名字的连接, client getname 返回空白回复。 | >=2.6.9 | O(1) |
4 | client pause | 挂起客户端连接,指定挂起的时间以毫秒计 | >=2.9.5 | O(1) |
5 | client kill | 当指定的客户端存在,且被成功关闭时,返回 OK 。关闭地址为 ip:port 的客户端。ip:port 应该和client-list) 命令输出的其中一行匹配。因为 Redis 使用单线程设计,所以当 Redis 正在执行命令的时候,不会有客户端被断开连接。 | >=2.4.0 | O(N) , N 为已连接的客户端数量。 |
6 | client id | 返回当前连接的id | >=5.0.0 | O(1) |
实例
1 | 127.0.0.1:6379> client getname |
1 | 127.0.0.1:6379> client setname # 只用空格是不行的! |
Redis client list
命令返回值
命令返回多行字符串,这些字符串按以下形式被格式化:
- 每个已连接客户端对应一行(以 LF 分割)
- 每行字符串由一系列 属性=值 形式的域组成,每个域之间以空格分开
以下是域的含义:
域 | 含义 |
---|---|
addr | 客户端的地址和端口 |
fd | 套接字所使用的文件描述符 |
age | 以秒计算的已连接时长 |
idle | 以秒计算的空闲时长 |
flags | 客户端flag(见下表) |
db | 该客户端正在使用的数据库ID |
sub | 已订阅频道的数量 |
psub | 已订阅模式的数量 |
multi | 在事务中被执行的命令数量 |
qbuf | 查询缓存的长度(0 表示没有查询在等待) |
qbuf-free | 查询缓存的剩余空间(0 表示没有剩余空间) |
obl | 输出缓存的长度 |
oll | 输出列表的长度(当输出缓存没有剩余空间时,回复被入队到这个队列里) |
omem | 输出缓存的内存占用量 |
events | 文件描述符事件(见下文) |
cmd | 最近一次执行的命令 |
客户端 flag 可以由以下部分组成:
域 | 含义 |
---|---|
O | 客户端是 monitor 模式下的附属节点 (slave) |
S | 客户端是一般模式下 (normal) 的附属节点 |
M | 客户端是主节点 (master) |
x | 小写x ,客户端正在执行事务 |
b | 客户端正在等待阻塞事件 |
i | 客户端正在等待 VM I/O 操作 (已废弃) |
d | 一个受监控 (watched) 的键已被修改, exec 命令将失败 |
c | 在将回复完整写出来之后,关闭连接 |
u | 客户端未被阻塞 (unblocked) |
A | 尽可能快地关闭连接 |
N | 未设置任何 flag |
文件描述符事件
文件描述符事件 | 含义 |
---|---|
r | 客户端套接字(在事件 loop 中)是可读的(readable) |
w | 客户端套接字(在事件 loop 中)是可写的(writeable) |
注意
为了 debug 的需要,经常会对域进行添加和删除,一个安全的 Redis 客户端应该可以对 CLIENT LIST 的输出进行相应的处理(parse),比如忽略不存在的域,跳过未知域,诸如此类。
实例
1 | 127.0.0.1:6379> client list |
Redis 管道技术
Redis是一种基于客户端-服务端模型以及请求/响应协议的TCP服务。这意味着通常情况下一个请求会遵循以下步骤:
- 客户端向服务端发送一个查询请求,并监听Socket返回,通常是以阻塞模式,等待服务端响应。
- 服务端处理命令,并将结果返回给客户端。
Redis 管道技术可以在服务端未响应时,客户端可以继续向服务端发送请求,并最终一次性读取所有服务端的响应。
实例
1 | $ (echo -en "auth pwd\r\n PING\r\n SET freya redis\r\nGET freya\r\nINCR visitor\r\nINCR visitor\r\nINCR visitor\r\n"; sleep 10) | nc localhost 6379 |
以上命令采用auth pwd
授权,采用PING
命令查看redis服务是否可用, 之后我们设置了 freya 的值为 redis,然后我们获取 freya 的值并使得 visitor 自增 3 次。
管道技术的优势
管道技术最显著的优势是提高了 redis 服务的性能。
Redis 分区
分区是分割数据到多个Redis实例的处理过程,因此每个实例只保存key的一个子集。
分区的优势
- 通过利用多台计算机内存的和值,允许我们构造更大的数据库。
- 通过多核和多台计算机,允许我们扩展计算能力;通过多台计算机和网络适配器,允许我们扩展网络带宽。
分区的不足
- 涉及多个key的操作通常是不被支持的。举例来说,当两个set映射到不同的redis实例上时,你就不能对这两个set执行交集操作。
- 涉及多个key的redis事务不能使用。
- 当使用分区时,数据处理较为复杂,比如你需要处理多个rdb/aof文件,并且从多个实例和主机备份持久化文件。
- 增加或删除容量也比较复杂。redis集群大多数支持在运行时增加、删除节点的透明数据平衡的能力,但是类似于客户端分区、代理等其他系统则不支持这项特性。然而,一种叫做presharding的技术对此是有帮助的。
分区类型
Redis 有两种类型分区。 假设有4个Redis实例 R0,R1,R2,R3,和类似user:1,user:2这样的表示用户的多个key,对既定的key有多种不同方式来选择这个key存放在哪个实例中。也就是说,有不同的系统来映射某个key到某个Redis服务。
范围分区
最简单的分区方式是按范围分区,就是映射一定范围的对象到特定的Redis实例。
比如,ID从0到10000的用户会保存到实例R0,ID从10001到 20000的用户会保存到R1,以此类推。
这种方式是可行的,并且在实际中使用,不足就是要有一个区间范围到实例的映射表。这个表要被管理,同时还需要各种对象的映射表,通常对Redis来说并非是好的方法。
哈希分区
另外一种分区方法是hash分区。这对任何key都适用,也无需是object_name:这种形式,像下面描述的一样简单:
- 用一个hash函数将key转换为一个数字,比如使用crc32 hash函数。对key foobar执行crc32(foobar)会输出类似93024922的整数。
- 对这个整数取模,将其转化为0-3之间的数字,就可以将这个整数映射到4个Redis实例中的一个了。93024922 % 4 = 2,就是说key foobar应该被存到R2实例中。注意:取模操作是取除的余数,通常在多种编程语言中用%操作符实现。
Java 使用 Redis
安装
开始在 Java 中使用 Redis 前, 我们需要确保已经安装了 redis 服务及 Java redis 驱动,且你的机器上能正常使用 Java。
连接到 redis 服务
1 | import redis.clients.jedis.Jedis; |