책의 내용을 요약하면
- 장애 발생시에는 개발자의 경험에 전적으로 의지해 디버깅하는 게 아니라, 장애에 대한 더 확실하고 다양한 정보를 드러낼 수 있도록 모니터링 해야한다.
- 그러므로 모니터링 메트릭과 스판 등 다양한 정보를 엮어 말 그대로 여러 각도에서 시스템을 관찰할 수 있는 가능성을 높여야 한다
- 즉, 관찰 가능성의 필요성과 관찰 가능성을 높이기 위한 몇가지 모델과 툴을 알려주는 내용이었다.
SLO, 카디널리티, 디멘셔널리티, ROI 같은 용어들을 알게 되었고, CI에 대한 span을 계측한다는 슬랙의 사례도 흥미로웠다. 인턴 때 만들었던 DORA 메트릭 대시보드도 장애 비율, 회복력을 확인하기 위한 거라 좀 더 관심을 가지고 봤다.
하지만 실무에 관찰 가능성을 도입하고자 할 떄 어떻게 활용할 수 있을지에 대한 감은 아직 안 잡힌다. 책이 너무 이론적인 내용 위주기도 하고 하나의 이상적인 세계에 대한 두루뭉술한 이야기를 듣는 기분만 들었다. 이론을 어디부터 배워야 할 지 모르는 주제에 대해선 책을 읽으며 공부하는 게 효율적이었는데, 그렇지 않은 경우엔 책이 재미없게 느껴지는 경우가 많은 것 같다. 그래도 관찰 가능성에 관련한 기본 지식과 사고 방식을 미리 깔아놓을 수 있다는 관점에선 유익한 책이었다.