본문 바로가기
엑셈 경쟁력/제품 스포트라이트

엑셈 인사이트 | '관찰 가능성(Observability)'을 확보하는 싸이옵스의 IT 운영 전략

by EXEM 2021. 3. 24.

 

디지털 전환(Digital Transformation) 가속화는 산업 전반에 불고 있는 바람이다. 특히 국내 IT 혁신을 주도하고 있는 금융권에서는 디지털 전환을 올해 가장 중요한 경영 키워드로 설정하고, 은행 업무의 핵심 경쟁력을 디지털화하는 데 박차를 가하고 있다. 기업들이 디지털 전환을 실현하고 그에 따른 비즈니스 모델 변화를 지원하기 위해서 IT 환경은 더욱 복잡해지고 있다. 따라서 IT 운영 전략과 방향성을 전면 재구성하면서 AIOps를 더욱 주목하고 있다.

 

“AIOps2021년 트렌드가 될 것이다, 모니터링이 점점 더 어려워지는 복잡한 환경에 직면한 IT 리더는 아직 계획 단계에 있거나 이미 배포를 시작했는지에 관계없이 AIOps를 주시해야 할 것이다
(AIOps in the enterprise: 6 trends to watch in 2021, TechBeacon)

기업에서 AIOps 채택이 증가할 것
(TOP AIOPS TRENDS BUSINESSES SHOULD WATCH OUT IN 2021, Analytics Insight)

 

이와 함께 IT 운영과 AIOps에서 관찰 가능성(Observability)을 확보하는 것이 더욱 중요해지고 있다. 관찰 가능성(Observability)이란 실행 가능한 데이터를 수집하고, 시스템 내에서 진행되고 있는 작업들에 대해서 무슨 일이 발생하고 있는지, 어디에서 발생하는지를 이해하고 답변할 수 있는 능력을 말한다. 엑셈의 싸이옵스(XAIOps)’ IT 운영 관리에서 보다 관찰 가능성을 확보할 수 있는 방안을 제시하며 최근 제1금융권 세 곳에서 AIOps 구축 사업을 진행하며 국내 AIOps 시장에서 리딩을 공고히 하고 있다.

 

싸이옵스는 어떻게 관찰 가능성을 확보하고 있을까?

먼저, 관찰 가능성을 높이는 관건은 사일로화된 여러 유형의 IT 운영 데이터를 수렴하여 상관 관계를 도출하고 결합된 데이터의 차이를 식별하도록 AI 알고리즘을 설계하는 것이다. ‘싸이옵스에는 60종 이상의 데이터 파서가 내장되고, 실시간 처리와 배치성 처리를 하나의 엔진에서 수행 가능한 빅데이터 처리 엔진을 탑재했다. 실시간 처리 이후 수집된 대용량의 데이터들을 고속 검색하고 분석할 수 있는 고속 인덱스 기술과 전사 시스템, 애플리케이션 로그 형태의 데이터를 Columnar로 다룰 수 있도록 하여 장기간 분석도 상당히 빠른 시간 내에 처리가 가능한 컬럼 스토리지 기술도 적용했다. 그뿐만 아니라 JIT 쿼리 컴파일 기술을 적용, 빅데이터 쿼리 분석 시 최상의 성능을 도출하고 AI로 학습데이터를 가공하는 데이터 탐색의 시간을 최소화할 수 있다. 이를 통해 대용량 데이터, 어떠한 상황이 오더라도 빠르고 정확한 결과를 도출할 수 있도록 한다.

 

또한 관찰 가능성에는 IT 운영 시스템과 모니터링 해당 영역에 대한 높은 이해도가 필수다. 엑셈은 DBPM, APM/E2E(거래 추적) 솔루션을 20여 년간 연구 개발하고 국내외 인더스트리 섹터별로 리딩 중인 500여 개 기업에 성능 관리 솔루션을 구축하고 컨설팅을 제공하며 IT 운영 데이터에 대한 높은 이해도를 쌓았다. 여기에 다양한 산업 분야에서 솔루션을 구축한 경험에서 나온 IT 운영의 노하우를 싸이옵스에 집대성했다.

 

기에 최적의 AI 기술을 결합, 부하를 예측하고 이상을 탐지하며 신속하게 문제를 진단한다.싸이옵스는 딥러닝 모델을 사용하여 여러 input 지표들에 대해 다차원 hidden layer간의 연관 분석을 통해 결과 지표를 도출하는 예측 모델과 별도의 잔차(residual) 예측 모델을 추가하여 신뢰도(default:95%) 기준의 범위로 최종 예측 결과를 도출하는 방식을 도입하였다. 이를 통해 일반적인 수학적 통계 방식이나 머신러닝 기술을 적용한 타 솔루션 대비 훨씬 높은 예측 정확도를 보장하고 있다. 또한 IT 운영에서 발생되는 시계열 성능 데이터는 데이터 발생 유형과 성격에 따라 특정한 모델 하나로 학습할 경우 이상 탐지 여부의 정확도에서 신뢰도가 떨어진다. 따라서 XAIOps각 지표별로 최적의 성능을 제시할 수 있도록 지표별 정확도가 높은 최적의 모델을 추천하는 방향으로 고도화 했다.

 

또한 근본원인 분석과 핵심 알람을 통해 AI 기반 성능/운영 예측과 선제적인 장애 예방과 대응을 위한 신속하고 직관적인 인사이트를 제공한다. 근본원인 분석 대시보드에서 장애 발생 시 최단 시간내에 장애 인지와 동시에 장애 근본 원인을 요약 제공하며, 각 영역별(Transaction, WAS, DB, OS ) 해당 시점의 문제 포인트를 함께 상세하게 제공하여 빠른 장애 판단이 가능하도록 한다. 또한 정상 시와 장애 발생 시 조건에 따른 Color 표시를 통해 더욱 직관적으로 판단할 수 있다. 그뿐만 아니라 사용자 정의 대시보드를 통해 실시간 모니터링의 상호 직관적인 가시화가 가능하다.

 

조건에 따른 정상/장애 발생 시 직관적 Color 구분 표시

 

기존 정상 부하 패턴에 따라 이상치 탐지 시 지능형 알람을 제공한다. 획일적이고 고정된 임계치 설정이 아닌 Dynamic Alert 설정을 통한 능동적으로 대응할 수 있다. 이외에도 고객사 시스템 부하 유형에 대한 정확한 부하 패턴 분석, 비정상 문제 발생 시에 해당 문제에 대해 연관 지표 학습을 통해 문제에 대한 증상/징후를 찾아주는 기능으로 관리자의 인사이트를 향상시킨다.

 

이렇게 엑셈의 싸이옵스데이터 수집, 빅데이터 처리, AI 기반 분석, 대시보드 가시성 모든 면에서 IT 운영의 관찰 가능성을 확보하고 능동적인 사전 대응 체계를 마련하는 데 고도화되어 있다.

 

'싸이옵스' 구조도

 

이것이 특히 디지털 전환이 생존 화두로 떠오른 금융권에서 지능형 IT 운영 관리 시스템 구축을 위한 솔루션으로 선택받은 이유이자, 앞으로 전 산업 분야의 디지털 전환의 가속화에 있어서 싸이옵스의 역할이 기대되는 이유이다.

 

싸이옵스 IT 운영 관리 역량을 더욱 혁신하기 위해 다양한 머신러닝/딥러닝 모델을 확대 적용하고 다양한 이벤트 예측 기술과 장애 예측 모델 등을 지속적으로 연구개발 중이다. ‘싸이옵스IT 시스템 운영의 ROI를 더욱 극대화할 수 있도록 더욱 강력하게 지원하여 상상 이상으로 복잡해지는 IT 환경을 맞이한 기업들의 비즈니스 혁신의 동반자가 될 것이다.

 

 

 

 

기획 및 글 | 사업기획팀

 

 

 

 

 

 

 

 

 

댓글