Skip to content

docs(redis): 7편 replication, failover, slowlog, monitoring 운영 실험 #154

Description

@devy1540

상위 이슈

목적

Redis를 운영할 때 필요한 관측 지표와 고가용성의 한계를 이해한다. replication/failover가 모든 write를 보장하지 않는다는 점을 실험/문서화한다.

다룰 질문

  • master-replica replication은 비동기인가?
  • failover 중 write 유실 가능성은 언제 생기는가?
  • Sentinel과 Cluster는 해결하는 문제가 어떻게 다른가?
  • slowlog는 언제 봐야 하는가?
  • Redis에서 CPU, memory, connected_clients, keyspace hit ratio를 어떻게 해석하는가?
  • 운영 알람은 어떤 지표를 기준으로 걸어야 하는가?

실험 산출물

  • local replication 구성 기록
  • failover 또는 replica lag 관찰 기록
  • SLOWLOG GET, INFO stats, INFO replication, INFO commandstats 결과
  • 운영 알람 후보 지표표

완료 조건

  • replication/failover의 보장 한계를 설명한다.
  • 장애 분석 시 먼저 볼 Redis 지표를 정리한다.
  • 운영 환경에서 Redis를 신뢰할 수 있는 범위와 없는 범위를 구분한다.

다음 세션 시작 지점

INFO/slowlog 결과와 알람 후보 지표를 먼저 확인한다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    area: blogBlog listing, post rendering, search, tags, or seriesarea: contentBlog post content changesdocumentationImprovements or additions to documentationtrack: redisRedis learning and mastery tracktype: experimentHands-on experiment or verification task

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions