본문 바로가기
엑셈 경쟁력/엑.기.스

엑기스 | InterMax의 변화

by EXEM 2020. 5. 15.






많은 사랑을 받고 있는 엑셈의 InterMax가 한단계 더 진화했습니다.

고객이 조금 더 편리하게 사용할 수 있도록 개선된 내용을 소개합니다.




1. APM의 효율적인 Application 병목 분석을 위한 콜트리 표현 개선안


APM 에서 Application 병목 현상을 분석하기 위해 콜트리(Class & Method)를 수집합니다. 콜트리를 수집하는 방법은 통계 기반 콜트리와 시계열 기반 콜트리의 2가지 유형으로 분류 가능하고, 유형별 장단점이 있습니다. (아래 [콜트리 유형 및 장단점 비교] 참고)


통계 기반 콜트리 표현의 장점이 많긴 하지만, 시계열 기준으로 분석을 꼭 해야만 장애분석이 가능한 경우가 분명 존재 하기 때문에 (특히 금융 거래 패턴 업무) 두 가지 유형을 모두 APM 에서 제공하는 것이 바람직합니다. 


<콜트리 유형 및 장단점 비교>


InterMax 의 관련 처리 개선 내용


- 통계 or 시계열 콜트리를 선택적으로 사용 할 수 있게 개선

  특히 모니터링 대상(Agent) 별로 통계 or 시계열 콜트리를 선택적으로 사용 할 수 있게 함으로써 해당 모니터링 대상 분석에 적합한 것을 선택해서 사용하도록 처리

- 보통 사이트 장애 분석 시 시계열 분석이 필요 없는 Agent는 별도의 설정 없이 Application의 중요 내용을 상세하게 모니터링 할 수 있는 통계 기반 콜트리로 Setting 하고, 장애 분석 시 꼭 시계열 기준의 분석이 필요한 Agent에 대해서는 시계열 콜트리로 설정해서 분석 진행하는 하는 것이 바람직하다고 판단


<통계 or 시계열 콜트리 선택적 적용>



2. 업무별 방문자 수 Validation의 중요성


시스템을 사용하는 사용자가 얼마나 많은지에 대한 판단 기준이 되는 방문자 수는 보통 주기적으로 업무 보고에 사용되는 APM 수집 주요 성능 지표 중에 하나입니다. 업무 담당자는 방문자 수의 추이로 어떤 업무에 방문자가 몰리고 있는지, 그리고 인프라 담당은 시스템의 증설 판단 기준으로 활용할 수 있습니다. 


그래서 이 값의 Validation이 정확치 않으면 업무담당 or 인프라담당의 의사 결정에 CRITICAL한 실수를 유발 시킬 수 있습니다. 방문자 수는 보통 개별 Agent 기준이 아닌 Agent 의 Group으로 대표 되는 업무 기준으로 정확히 추출하는 것이 중요한데요. 


웹 환경을 예로 들어서 설명 드리면 Web Browser에서 서비스 요청 시 동일 사용자의 요청은 여러 Agent(WAS)에서 처리가 될 수 있어 Agent 기준으로 방문자 수를 unique하게 산출하여 Agent 그룹인 업무로 SUM을 하게 되면 Agent 개수 만큼 동일 사용자수가 중복 될 수 있기 때문에 정확한 업무별 unique 방문자 수 산출을 위해서는 업무에 속한 Agent 대상 모두를 바라보고 unique 한 방문자수 처리를 해야 합니다.


▶ InterMax 의 관련 처리 개선 내용


모든 업무별 방문자 수 추이를 볼 수 있는 방문자 통계 화면을 제공

기존 방문자 통계는 업무별 Unique한 방문자 수가 아니었으나, 업무 기준으로 Unique한 데이터를 추출하여 제공하는
  업무별 방문자 수 분석 결과를 제시하도록 개선 
(시간, 일 단위로 업무별 방문자 통계 분석이 가능하도록 추가 개선)


<방문자 통계 - 업무 기준 통계 개선>




3. 사용자 정의형 – Query 통계 기반 보고서 생성 필요성


APM Solution 을 포함한 기타 SMS, NMS, DPM etc 의 모든 모니터링 Solution 들은 보고서 기능을 포함하고 있습니다. Solution에 따라서 Reporting tool 과 연계하여 상대적으로 보고서 기능이 강한 제품도 있고 상대적으로 보고서 기능이 약한 Solution 도 있습니다. 보고서 기능이 아무리 뛰어나더라도 고객의 모든 사용자 보고서를 자동으로 만족시킬 수 없는 한계는 존재 합니다. 그래서 사용자가 직접 통계 정보 추출용 쿼리를 생성하여 데이터를 추출해서 보고서화 할 수 있는 기능이 있으면 사용자가 얼마든지 쿼리 기준으로 본인이 원하는 항목에 대해 값을 추출 할 수 있습니다. 


또한 성능 테스트 과정에서도 참조하기 위한 값을 실시간으로 추출한다던지, 활용 범위가 많아 쿼리 베이스의 데이터 추출 기능은 여러 가지 업무에 도움을 줄 수 있습니다. 일단 어떤 상황에서든 필요에 의해 임시로 만들어둔 쿼리 베이스의 추출 데이터를 정기 보고서로 사용하길 원한다면 해당 쿼리 기준으로 고객이 원하는 화면을 추후 제공하는데 참조 할 수도 있습니다.


InterMax 의 관련 처리 내용


- 이미 Script Manager를 통하여 통계 추출을 위한 사용자 정의형 쿼리를 작성하여 저장하고, 보고서 생성 화면에서 해당 사용자 정의형 쿼리를 선택하여 리포트를 자동 생성할 수 있는 방향으로 기능을 개선

- 기존 보고서는 내부적으로 정형화(고정된) 항목내에서만 보고서 작성이 가능하였으나, 사용자 정의형에서는 작성/등록된 사용자 쿼리를 선택하여 원하는 통계 정보를 리포트로 생성할 수 있게 추가/개선


<쿼리 베이스의 보고서 제공>




4. 트랜잭션 처리 시간에 대한 패턴 분석의 의미


Application 장애가 발생 전 정상적인 트랜잭션 처리 응답시간이 나오지 않고 가로, 세로 줄을 서는 패턴을 종종 보게 됩니다. 이 패턴이 보이면 추후 업무가 되지 않는 큰 장애와 연관될 확률이 높아 이 패턴을 최대한 빠르게 인지 할 수 있으면 장애 전 사전 대응이 가능해짐으로 인해 업무의 안정성을 확보하는데 도움이 됩니다. 가로, 세로 줄서는 패턴이 보이는 CASE에 대한 Application 처리 상황을 간단히 정리하면 아래와 같습니다.


<가로, 세로 줄서는 패턴이 보이는 CASE에 대한 주요 원인>


위와 같은 트랜잭션 응답 시간 처리 패턴에 대한 분석을 AI(머신러닝)기반으로 한 차원 더 깊게 분석이 가능하게 되면 좀 더 다양한 트랜잭션 응답 처리 시간 패턴에 대해 세분화된 장애 징후를 미리 인지 할 수 있을 것으로 판단됩니다.


InterMax 의 관련 처리 내용


- 트랜잭션 모니터의 가로 세로 패턴 감지를 통한 알람 발생 기능 추가


<트랜잭션 이상 징후 탐지 - 트랜잭션 가로 세로 분석>




앞으로도 지속적으로 고객에게 최고의 솔루션을 제공할 수 있도록 노력하겠습니다.











기고 | 신기술본부 장일홍
편집 | 사업기획팀 박예영


댓글