요즘에는 웹 서비스 및 전자상거래 등 모든 비즈니스에서 IT화가 필수적인 요소로 자리매김하고 있습니다. 휴일이나 심야를 막론하고 비즈니스가 가능해진 반면, 시스템을 항상 안정적으로 운영해야 하는 필요성이 증가하고 있습니다. 시스템 장애 등의 문제가 발생하면 기회 손실뿐만 아니라 사회적 이미지와 신뢰도까지 하락시킬 수 있습니다. 이러한 상황을 예방하기 위해서는 시스템을 24시간 365일 체제로 항시 감시할 필요가 있습니다. 본 기사에서는 24/365 운용의 개요 및 시스템의 안정적인 운영을 위해 수행해야 할 사항, 과제 및 아웃소싱의 장점에 대해 설명하겠습니다.
- 24/365란?
- 시스템을 안정적으로 운영하기 위한 운용 및 유지보수 업무
- 24/365 운용 및 유지보수 업무를 자사에서 하는 경우의 과제
- 24/365 운용 및 유지보수 업무를 아웃소싱하는 메리트
- 요약
24/365란?
24/365는 24시간 365일을 나타내며, 시스템의 운용 및 유지보수 업무에서 자주 사용되는 용어입니다. “24/365 운용”은 시스템을 24시간 365일 동안 안정적으로 운영하는 것을 의미합니다. 시스템 장애는 언제든지 발생할 수 있기 때문에, 항상 대기 상태로 유지하고, 필요한 경우 신속하게 대응해야 합니다.
업무 시스템의 경우에는 직원이 사용하는 주중 주간 시간대만 가동되어도 문제가 없을 수 있습니다. 그러나 공개된 웹 사이트나 BtoC 웹 서비스와 같은 경우는 오히려 휴일이나 야간에 사용될 가능성이 높을 것입니다. 고객에게 제공하는 시스템에 장애가 발생하면 서비스 제공이 중단되어 매출 손실 및 신용 하락으로 이어질 수 있습니다. 장애를 감지하는 데 걸리는 시간이 길어질수록 영향 범위가 확대되며, 복구까지의 시간이 오래 걸리면 손해가 커질 수 있습니다. 따라서 특히 웹 서비스를 제공하는 기업에게는 시스템의 운용 및 유지보수 업무를 24/365 체제로 수행하는 것이 필수적입니다.
시스템을 안정적으로 운영하기 위한 운용 및 유지보수 업무
시스템을 안정적으로 운영하기 위해 필요한 운용 및 유지보수 업무에 대해 구체적으로 설명하겠습니다.
시스템 감시
시스템을 구성하는 서버, 네트워크, 응용 프로그램 등이 정상적으로 가동되는지 항상 감시합니다. 장애가 발생할 경우 신속한 감지를 위해 필요한 감시 항목을 식별하고, 적절한 트리거로 알림을 설정하는 것이 중요합니다. CPU, 메모리, 저장소 등의 리소스 부족이 장애를 유발할 수 있으므로 리소스 사용 상태와 성능을 모니터링하여 필요 시 강화가 필요한지를 판단하는 데 도움이 됩니다.
장애 대응
시스템 트러블을 감지한 경우 신속하게 대응하여 해결해야 합니다. 시스템의 성격, 규모, 대응 멤버 구성에 따라 다를 수 있지만, 일반적인 장애 발생 시 대응 절차는 다음과 같습니다.
먼저 감시 시스템이 보고한 알림을 담당자가 확인하고 내용을 검토합니다. 알림의 내용에 따라 사전에 대응 절차가 정해져 있으면 그에 따라 대응합니다. 그럼에도 복구되지 않거나 알려지지 않은 장애인 경우 고급 엔지니어에게 에스컬레이션을 진행합니다. 대규모 장애의 경우 영향 범위와 상황을 확인하고 관계자에게 연락이 필요할 수 있습니다. 복구 작업 완료 후에는 상황을 정리하고 장애 원인 조사 및 향후 재발 방지 조치 등을 고려하는 것이 중요합니다.
보안 대책
최근에는 기업을 겨냥한 사이버 공격이 활발해지고 있어, 시스템의 안정적인 운영을 위해서는 보안 대책도 필수적입니다. 네트워크 보안과 같은 액세스 제한뿐만 아니라, 공개된 웹 서버에 대한 WAF, IDS/IPS와 같은 보안 대책 솔루션 도입 및 운용, OS, 미들웨어, 응용 프로그램의 취약점 대응 등 다양한 대응이 필요합니다.
백업 대책
장애나 인적 오류로부터 데이터 손실을 방지하려면 정기적으로 백업을 수행해야 합니다. 데이터베이스에 저장된 데이터나 공유 폴더에 저장된 파일을 백업하는 데이터 백업을 진행합니다. 이에 더해 OS부터 응용 프로그램까지 시스템 전체를 백업하는 시스템 백업을 수행하면 복구 작업이 보다 원활해질 것입니다.
시스템 개선
현재 시스템이 가지는 과제를 분석하고 가용성, 신뢰성, 내고장성 향상을 위한 개선 작업을 수행합니다. 리소스 강화나 성능 튜닝과 같이 시스템 처리 효율을 높이는 작업을 목표로 합니다. 정기적인 유지보수 작업으로 시스템 업데이트도 포함됩니다.
24/365 운용·유지보수를 자사에서 하는 경우의 과제
자사에서 24/365 운용·유지보수를 수행하는 경우, 기밀성을 유지하기 쉽고 운용 이외의 업무도 담당할 수 있는 것이 장점입니다. 그러나 이에 반하는 단점도 많기 때문에 여기에서는 구체적으로 어떤 과제가 발생하는지 설명하겠습니다.
인적 리소스 및 노하우 부족
IT 인력은 모든 산업에서 요구되고 있으며, 현재는 지속적으로 부족한 상태입니다. 특히 최근에는 인력 확보가 더욱 어려워지고 있습니다.
인건비 및 교육비 부담
24/365 운용을 하려면 일반적으로 1일 8시간, 월 20일 정도의 근무 시간으로 생각하면 최소 5명 정도가 필요할 것입니다. 자사 내에서 5명 이상의 운용 담당자를 고용하는 것은 채용과 교육 비용을 포함하여 상당한 부담이 될 것으로 예상됩니다.
이직률의 증가
24/365 운용은 휴일과 야간을 물어가지 않는 불규칙한 근무 형태입니다. 담당자의 부담은 매우 크며, 이로 인해 이직으로 이어질 가능성이 높습니다. 만일 인원이 부족하다면 신속하게 채용활동을 진행해야 합니다. 신규 채용과 교육이 필요할 때마다 비용과 인력 투입이 발생하여 부담이 될 것입니다.
24/365 운용 및 유지보수 업무를 아웃소싱하는 메리트
자사 운용의 과제를 해결하는 수단으로, 24/365 운용·유지보수 업무를 전문 업체에 아웃소싱하는 것도 효과적입니다. 구체적인 메리트에 대해 설명하겠습니다.
핵심 업무에 전념 가능
자사의 시스템 담당자들은 24/365 체제의 감시 업무에서 해방됩니다. 실제로 장애가 발생할 확률이 낮더라도 “언제 일어날지 모른다”는 상태에서 대비해야 하는 상황은 큰 스트레스가 될 것입니다. 이러한 심리적 부담을 없애면서 기업 전체의 생산성 향상과 업무 효율화에 집중할 수 있게 됩니다.
장애 발생 시의 빠른 대응
최선의 노력이 아니라 24/365의 감시 체제와 장애 발생 시의 매뉴얼 및 노하우가 갖춰져 있기 때문에, 장애가 휴일이나 심야에 발생하더라도 신속한 대응이 가능합니다. 초기 대응으로 시스템 다운타임을 최소화할 수 있습니다. 기업의 손실이나 기회 손실을 예방하고, 비즈니스에 미치는 영향을 경감시킬 수 있는 것은 큰 장점입니다.
운용 비용의 절감
자사에서 24/365 체제를 구축하는 경우의 인건비와 교육비와 비교하면, 아웃소싱하는 쪽이 비용을 절감할 수 있는 가능성이 높습니다. 전문 업체는 풍부한 지식과 경험을 갖춘 팀이기 때문에 고품질이면서 안정된 서비스를 기대할 수 있습니다. 24/365 체제를 구축하지 않고 자사 엔지니어가 최선을 다해 대응하고 있는 경우에도, 장애 발생 시의 손실이나 자사 엔지니어에게 가하는 부담을 고려하면 효과적인 투자라고 생각될 것입니다.
토요컨설턴시서비시스코리아는 24/365 체제에서 고객 시스템의 감시 및 장애 대응을 대행합니다.
요약
기업에게 시스템을 안정적으로 운영하는 것은 현재로서는 사회적인 신뢰로 이어집니다. 이를 위해서는 24/365 체제로 시스템을 계속해서 감시하는 것이 필수적이지만, 자사에서 진행하려면 많은 어려움이 있습니다. 이러한 어려움을 해결하는 수단으로 운용·유지보수 업무를 아웃소싱하는 것은 매우 효과적입니다. 전문 업체의 서비스를 활용하면 더 안정적인 시스템 운영이 가능하며, 자사 엔지니어의 부담을 줄이거나 코어 업무에 집중할 수 있는 등 여러 이점이 있을 것입니다. 운용·유지보수 업무를 아웃소싱하는 것을 고려해 보시는 것은 어떨까요?
토요컨설턴시서비시스코리아에서는 감시 운영뿐만 아니라 인프라의 초기 구축, 감시 설계·도입, 보안 솔루션의 도입 및 운용 등 다양한 서비스를 제공하므로 인프라 운영과 관련된 모든 문의 사항에 대해 상담이 가능합니다. IT 인프라에 관련된 어려움이 있다면 언제든지 부담 없이 상담해 주세요.