OO 서비스에서 중요 인시던트(Incident)가 발생하여, 운영자 A씨는 서비스 영향 유무는 물론, exemONE을 통해 서비스와 관련된 IT 전 영역에 특이사항이 있는지 살펴봅니다. 과거 사례로부터 향후 서비스 장애로 이어질 가능성이 있어, DB 전문가 B씨에게 에스컬레이션 하여 개선 검토 및 조치를 의뢰합니다. 정기 미팅에서 서비스 책임자 C씨와 관계자에게 해당 이슈를 공유합니다. DB 전문가 B씨는 이슈 발생 시각의 상세 데이터를 exemONE에서 확인하고 운영자 그룹에 분석 및 대응 결과를 회신합니다.
어떠신가요. 머지않아 exemONE이 불러올 일상의 변화가요?
통합 모니터링의 필요성을 여러 관점(링크)으로 소개한 데 이어, 이번 화에서는 일본 IT 산업의 특징과 현장의 실제 운영 사례 및 exemONE의 앞으로의 역할에 대해 소개합니다.
먼저 최근 몇 년간의 일본 IT 현장의 실제 사례를 공유합니다.
에너지사 사례
에너지 대기업 A사 IT 부문에서는, 현재 데이타센터의 계약종료 시점에 맞춰, 그간의 검토사항을 토대로 온프레 환경의 기간 시스템 및 주변 시스템을 클라우드 환경으로의 리프트업을 수행하고 있다. Azure PaaS 환경을 표준 가이드로, 각 시스템의 제약조건에 따라 IaaS으로의 이행도 예외사항으로 인정하고 있다. 이행 검토 결과, 온프레 플랫폼을 유지・갱신하는 시스템도, AWS PaaS를 계속 이용하는 시스템도 일부 존재한다.
IT 서비스사 사례
엔터테인먼트 이벤트 관련 B2C 서비스를 제공하고 있는 중견기업 B사는, 기간 시스템은 온프레 환경에서, 프론트엔드 서비스는 AWS 플랫폼을 활용하여, 변화무쌍한 이벤트 요건에 빈번하고 발빠른 릴리즈로 대응하고 있다. 단일 시스템 장애의 영향이 서비스 장애로 이어지지 않게 하는 다중구성 등의 표준 설계를 적용한다. 또한 「개발 / 테스트 / 스테이징 / 운영」 환경으로 단계별 릴리즈에도 불구하고 발생하는 장애에 대해서는 패치(회피책) 적용을 우선하여 대응하고, 근본 원인 분석은 필수에 한해 최소한으로 진행하는 식으로, 비지니스 효율성을 추구하고 있다.
제조 및 유통사 사례
유명 브랜드를 제조・판매하고 있는 기업 C사의 정보 시스템 부문에서는, 차기 기간 시스템의 검토 결과, 현행 시스템의 애플리케이션 개발 업체의 시스템 일체 운영과 시스템의 최소 변경을 우선시 하여, 클라우드로의 이행을 단념하고 유지보수 기간이 종료되는 VM 환경의 호스트 서버의 갱신만을 진행하기로 하였다.
IT 서비스사 사례
고객 시스템 구축 및 운영을 대행하고 있는 SIer D사는, 「Oracle@온프레 ⇒ Amazon Aurora PostgreSQL」이행 후 몇 달째 운영중으로, 새로운 환경에 대한 충분하지 않은 지식과 경험 부족을 시행착오와 고군분투로 메워가고 있다.
글로벌 제조사 사례
글로벌 제조기업 E사는 국내외를 커버하는 1,000여 개의 서비스와 데이타베이스를 운영 중으로, 전문인력 부족과 서비스별 운영 품질의 심한 편차를 당면 과제로 고민하고 있다.
이렇듯 IT 비즈니스 전체를 주도하는 기술 흐름이 실제함에도, 각 현장에서는 전체 트렌드보다는 각자의 상황에 맞는 솔루션을 판단하고 적용하고 있습니다.
일본 IT 현장의 특징
어느 지역이나 집단도 장기간 축적되어 온 노하우와 효율성이 실적으로 검증되어온 나름의 문화와 방식이 존재합니다. 일본은 다른 지역과 비교해서 기득권을 존중하는 경향이 강한 사회로, 비즈니스 현장에도 자연스럽게 녹아들어 있습니다. 이러한 산업 체계는 안정과 기존 체계를 중시하며, 변화를 신중하게 고민하고 받아들여 다시 탄탄하게 만들어가는 태도를 취합니다. 다른 한편, 신속하고 유연한 판단과 움직임이 무기가 되는 급변하는 과도기에는 새로운 기회의 가능성을 흘려 보내게 됩니다.
또 하나의 경향으로, IT 의사결정이 정보 시스템 부문의 중심보다는 강력한 파트너 SIer사에 의해 주도되는 경우가 일반적입니다. 참고로 한국에서 SI(System Integrator)라고 불리는 개념이 일본에서는 SIer(エスアイアー)로 표현합니다. 시스템별로 다른 파트너사가 대부분이고, 시스템간의 보이지 않는 높은 벽으로 인해 좋은 솔루션을 다른 시스템에 전파시키는 게 상상이상으로 간단치가 않습니다. 최근 10여 년간의 IT 트렌드와 맞지 않을 수 있습니다만, 전문가 집단에 대한 존중으로 시작되어 잘 발달된 분업의 형태로 보는 관점도 있습니다.
일본 IT 현장도 비즈니스 환경과 기술 트렌트에 맞춰 변화해 왔습니다. 각 시스템과 담당 부문의 조건, 특징 및 상황을 고려한 결과로, 각자는 현실과 이상 사이에서 균형을 취하고 있는 형태입니다. '어떤 조직 구성이 최적일까요?' 정답은 없습니다. 시스템 요구사항과 주변 환경에 따라 달라집니다. 크게 변화하지 않는 어플리케이션 및 환경 요건에 한정된 사용자라면 위와 같이 'IT 서비스 역할 모델 A'가 최적일 수 있습니다. 그러나 다양하고 변화무쌍한 서비스 요구를 만족시키기 위해서는 아래와 같이 'IT 서비스 역할 모델 X'에 가까울수록 앞으로의 비즈니스 환경에 더 잘 적응할 수 있다는 것은 확실해 보입니다.
조직변화의 계기, 커뮤니케이션 도구로서의 exemONE의 역할
일본 시장에서는 옵저버빌리티 솔루션의 일반적인 효과에 더하여 '유용한 커뮤니케이션 도구이자 공통 언어'로서, '멀티 플랫폼 통합 옵저버빌리티 exemONE'의 활약을 기대하고 있습니다. 어플리케이션, 인프라, 운영의 관점이 모두 녹아 있기에 개별 시스템간, 업무 영역간의 소통을 손쉽게 하며, 지금까지 간헐적이었던 각 조직간의 협업을 일상화하게끔 하는데 촉매제와 윤활유 역할을 합니다.
또한 매뉴얼 등으로 루틴화된 운영 작업자의 인식 범위를 확장시켜, 관리 포인트와 기술적인 측면에서 한 걸음 더 넓고 깊은 시야를 갖게 하고, 스킬업의 효과를 가져옵니다. 정보 부문은 다양한 시스템 전반에 대한 시각화와 이해도가 높아지게 되어, 파트너사에 대한 의존도를 낮추고 IT 자산에 대한 자체 역량 강화로 이어갈 수 있게 됩니다.
따라서 커뮤니케이션 도구로서의 통합 옵저버빌리티 솔루션은 '직관적인 UI', '시스템 간, IT 구성요소 간의 연결성'을 기본으로 제공해야 합니다.
엑셈 비즈니스 초기부터 대표 솔루션인 MaxGauge를 무척이나 잘 활용하고 있는 현장이 있습니다. 30분 이내에 장애 상황 및 대응 항목에 대해 효율적으로 소통하고 대응이 이루어지는 좋은 예시입니다.
"서비스에 영향이 있는 장애가 실시간으로 발생하는 경우, 우선 장애 대응본부라는 이름으로 서비스 책임자, 개발 담당자, 인프라 담당자를 포함한 모든 주요 관계자들이 소집됩니다. 운영 담당으로부터 현상에 관한 브리핑이 있습니다. 이후 DB 담당자가 대형 스크린에 MaxGauge 화면을 띄우고, 그 자리에서 조작을 통해 초동 분석을 진행합니다. 문제 발생의 원인이 되는 영역에 대해 논의하고 각자의 액션 사항을 정리하고 해산합니다."
많은 전문가들이 언급하는 문제 조기 발견 및 예방, 효율적인 문제 해결, 운영 비용 절감, 서비스 품질 향상, 데이터 기반 의사 결정, 보안 강화, 규제 준수 등의 효과는 조직 혁신 및 활성화의 덤으로 얻어지는 결과라 할 수 있습니다. 새로운 도구가 비즈니스 조직을 변화시키는 시작점이 될 수 있고, 이번에는 'IT 현장의 소통 인프라' exemONE이 그 변화의 마중물이 되기를 희망합니다.
글 | 엑셈 일본법인 기술 총괄 김규복님
'엑셈 경쟁력 > 제품 스포트라이트' 카테고리의 다른 글
복잡한 인프라 구성없이 시작하는 AI 분석 플랫폼, 우드페커 (0) | 2024.11.28 |
---|---|
엑셈 원 Pick | 8월의 exemONE (1) | 2024.08.29 |
exemONE 론칭 | 엑셈의 신작 'exemONE'을 소개합니다. (1) | 2024.04.25 |
개발자 관점에서 본 통합 모니터링의 필요성 (0) | 2024.04.25 |
APM 관점에서 본 통합 모니터링의 필요성 (0) | 2024.03.27 |
댓글