docs(redis): 7편 replication, failover, slowlog, monitoring 운영 실험

## 상위 이슈

- Parent: #127

## 목적

Redis를 운영할 때 필요한 관측 지표와 고가용성의 한계를 이해한다. replication/failover가 모든 write를 보장하지 않는다는 점을 실험/문서화한다.

## 다룰 질문

- master-replica replication은 비동기인가?
- failover 중 write 유실 가능성은 언제 생기는가?
- Sentinel과 Cluster는 해결하는 문제가 어떻게 다른가?
- slowlog는 언제 봐야 하는가?
- Redis에서 CPU, memory, connected_clients, keyspace hit ratio를 어떻게 해석하는가?
- 운영 알람은 어떤 지표를 기준으로 걸어야 하는가?

## 실험 산출물

- local replication 구성 기록
- failover 또는 replica lag 관찰 기록
- `SLOWLOG GET`, `INFO stats`, `INFO replication`, `INFO commandstats` 결과
- 운영 알람 후보 지표표

## 완료 조건

- replication/failover의 보장 한계를 설명한다.
- 장애 분석 시 먼저 볼 Redis 지표를 정리한다.
- 운영 환경에서 Redis를 신뢰할 수 있는 범위와 없는 범위를 구분한다.

## 다음 세션 시작 지점

`INFO`/slowlog 결과와 알람 후보 지표를 먼저 확인한다.


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

docs(redis): 7편 replication, failover, slowlog, monitoring 운영 실험 #154

상위 이슈

목적

다룰 질문

실험 산출물

완료 조건

다음 세션 시작 지점

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

docs(redis): 7편 replication, failover, slowlog, monitoring 운영 실험 #154

Description

상위 이슈

목적

다룰 질문

실험 산출물

완료 조건

다음 세션 시작 지점

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions