Redis如何删除数量过万以上Key而不影响业务

需求

有时候因为 Redis Key 没有设置过期时间或者因为业务需求或者Redis内存不足或者修改Redis Key值等需求，并且这些Key是有规律的，可以通过正则表达式来匹配。

解决方法一

一般通过网上搜索，会告诉你使用下面方法，Redis 提供了一个简单暴力的指令 keys用来列出所有满足特定正则字符串规则的 key。

$ redis-cli --raw keys "testkey-*" | xargs redis-cli del

通过 Redis keys 来匹配你需要删除的key，再使用 xargs 把结果传给 redis-cli del ，这样看似完美，实则有很大风险。

上面命令使用非常简单，提供一个简单的正则字符串即可，但是有很明显的两个缺点。

没有 offset、limit 参数，一次性吐出所有满足条件的 key，万一实例中有几百 w 个 key 满足条件，当你看到满屏的字符串刷的没有尽头时，你就知道难受了。
keys 算法是遍历算法，复杂度是 O(n)，如果实例中有千万级以上的 key，这个指令就会导致 Redis 服务卡顿，所有读写 Redis 的其它的指令都会被延后甚至会超时报错，因为 Redis 6 版本以下都是单线程程序，顺序执行所有指令，其它指令必须等到当前的 keys 指令执行完了才可以继续，这样就会导致业务不可用，甚至造成redis宕机的风险。

注意：这种方法不推荐，建议生产环境屏蔽keys命令。那大家会问，有没有更好的方法来解决这个问题?答案是当然用，请接着看下文。

解决方法二

Redis从2.8版本开始支持 scan 命令，SCAN命令的基本用法如下：

SCAN cursor [MATCH pattern] [COUNT count]

cursor：游标，SCAN命令是一个基于游标的迭代器，SCAN命令每次被调用之后，都会向用户返回一个新的游标，用户在下次迭代时需要使用这个新游标作为SCAN命令的游标参数，以此来延续之前的迭代过程，直到服务器向用户返回值为0的游标时，一次完整的遍历过程就结束了。
MATCH：匹配规则，例如遍历以 testkey- 开头的所有key可以写成 testkey-*。
COUNT：COUNT选项的作用就是让用户告知迭代命令，在每次迭代中应该从数据集里返回多少元素，COUNT只是对增量式迭代命令的一种提示，并不代表真正返回的数量，例如你COUNT设置为2有可能会返回3个元素，但返回的元素数据会与COUNT设置的正相关，COUNT的默认值是10。

例子：

$ scan 0 MATCH testkey-*

1) "34"

2)  1) "testkey-2"

    2) "testkey-49"

    3) "testkey-20"

    4) "testkey-19"

    5) "testkey-93"

    6) "testkey-8"

    7) "testkey-34"

    8) "testkey-76"

    9) "testkey-13"

   10) "testkey-18"

   11) "testkey-10"

$ scan 34 MATCH testkey-* COUNT 1000

1) "0"

2)  1) "ops-coffee-16"

    2) "ops-coffee-19"

    3) "ops-coffee-23"

    4) "ops-coffee-21"

    5) "ops-coffee-40"

    6) "ops-coffee-22"

    7) "ops-coffee-1"

    8) "ops-coffee-11"

    9) "ops-coffee-28"

   10) "ops-coffee-3"

   11) "ops-coffee-26"

   12) "ops-coffee-4"

   13) "ops-coffee-31"

   ...

scan 命令返回的是一个包含两个元素的数组，第一个数组元素是用于进行下一次迭代的新游标，而第二个数组元素则是一个数组，这个数组中包含了所有被迭代的元素。

上面这个例子的意思是扫描所有前缀为testkey-的key。第一次迭代使用0作为游标，表示开始一次新的迭代，同时使用了MATCH匹配前缀为testkey-的key，返回了游标值34以及遍历到的数据。第二次迭代使用的是第一次迭代时返回的游标，也即是命令回复第一个元素的值34，同时通过将COUNT选项的参数设置为1000，强制命令为本次迭代扫描更多元素。在第二次调用SCAN命令时，命令返回了游标0，这表示迭代已经结束，整个数据集已经被完整遍历过了。

Redis scan 命令就是基于游标的迭代器，意味着命令每次被调用都需要使用上一次这个调用返回的游标作为该次调用的游标参数，以此来延续之前的迭代过程。当SCAN命令的游标参数被设置为0时，服务器将开始一次新的迭代，而当redis服务器向用户返回值为0的游标时，表示迭代已结束，这是唯一迭代结束的判定方式，而不能通过返回结果集是否为空判断迭代结束。

上面的需求，最终可以使用下面命令来解决：