관찰가능성과 모니터링

관찰가능성

관찰가능성(Observability)이라는 용어는 루돌프 E. 칼만(Rudolf E. Kálmán)이 1960년대에 제어 이론 분야에서 처음 사용했습니다. 관찰가능성은 시스템 내부 상태의 외부 출력(output)을 통한 추론 가능성에 대한 개념이라고 볼 수 있어요. 

관찰가능성과 모니터링

오늘날 IT의 관찰가능성은 칼만의 기본 정의를 확장해서 사용하고 있죠. 시스템 모니터링과 혼재되어 사용되는 경우가 있지만, 사실 그 둘은 근본적인 차이가 있습니다. 모니터링이 건강 검진의 기본적인 항목 확인과 같다면, 관찰가능성은 MRI나 CT 촬영처럼 더 상세한 의존 정보를 준비하고 이들의 상관분석을 통해 문제의 근본 원인을 찾고 또 예측하는 것을 이야기합니다. 단순한 지표 정의 및 관찰을 넘어 시스템 전체의 동작 방식과 숨겨진 연관성을 이해하는 것이 핵심이겠죠. 

도구 전에 개념의 이해가 먼저

다양한 observability 도구들이 존재하지만, 그 화려함에 매몰되어서는 안 됩니다. 진정으로 중요한 것은 시스템의 핵심 기능이 어떻게 작동하는지에 대한 명확한 가시성을 확보하는 것입니다. 이를 위해서는 운영팀과 개발팀이 긴밀하게 협력하여 데이터의 흐름을 설계하고, 각 컴포넌트에서 필요한 관찰 데이터를 정의해야 합니다. 무분별한 도구 도입은 오히려 복잡성을 가중시키기만 할 수도 있으니, 시스템의 가장 중요한 프로세스를 중심으로 관찰가능성 확보 방안에 대해 먼저 고민할 필요가 있다는 거에요.

어쨌든 시스템을 설계하고 이행할 때, 관찰가능성에 대한 고민을 하며 적절한 SLI Service Level Indicator를 준비하고, 의미 있는 SLO Service Level Objective를 정의/운영하실 수 있게 되기를 바랍니다. 뭐… 도구를 쓰시던가요.

글을 쓰고, 그림을 그립니다. 멍하니 있는 걸 더 좋아하긴 하지만...
Posts created 542

Related Posts

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

Begin typing your search term above and press enter to search. Press ESC to cancel.

Back To Top