❒ redis提供了哨兵(sentinel)机制来实现主从集群的自动故障恢复。
✔ 监控:sentinel会不断检查您的master和slave是否按预期工作。
✔ 自动故障恢复:如果master故障,sentinel会将一个slave提升为master。当故障实例恢复后也以新的master为主。
✔ 通知:sentinel充当redis客户端的服务发现来源,当集群发生故障转移时,会将最新信息推送给redis的客户端。
❒ sentinel基于心跳机制监测服务状态,每隔1秒向集群的每个实例发送ping命令。
✔ 主观下线: 如果某sentinel节点发现某实例未在规定时间响应,则认为该实例主观下线。
✔ 客观下线: 若超过指定数量(quorum)的sentinel都认为该实例主观下线,则该实例客观下线,quorum值最好超过sentinel实例数量的一半。
❒ 哨兵选主规则
✔ 首先判断主与从节点断开时间长短,如超过指定值就排该从节点
✔ 然后判断从节点的slave-priority值,越小优先级越高如果slave-prority一样,
✔ 则判断slave节点的offset值,越大优先级越高
✔ 最后是判断slave节点的运行id大小,越小优先级越高。