Processo de Gestão de Incidentes Zabbix

Um guia visual para a operação do NOC, garantindo uma resposta rápida, padronizada e rastreável a todos os alertas.

Rotina Diária: O Pulso do Ambiente

No início de cada expediente, o operador do NOC deve executar esta checagem proativa para garantir o controle e o acompanhamento de todos os problemas em andamento.

1️⃣

Acessar Painel

Navegar para `Monitoring -> Problems` no Zabbix.

2️⃣

Verificar Não Reconhecidos

Identificar e iniciar o tratamento de alertas sem "Acknowledge".

3️⃣

Revisar Abertos

Analisar o status dos chamados Pai/Filho para cada alerta ativo.

4️⃣

Registrar e Comunicar

Documentar o resumo e pontuar em cada Ticket.

Ciclo de Vida do Alerta: Do Início à Resolução

Este é o fluxo reativo executado sempre que um novo alerta é gerado, detalhando cada passo desde a detecção até o fechamento validado do incidente.

NOC

1. Detecção do Alerta

Zabbix gera um novo "Problema" e notifica.

NOC

2. Reconhecimento (Acknowledge)

Ação IMEDIATA. Comentar: "Análise iniciada pelo NOC".

NOC

3. Análise e Diagnóstico N1

Investigar gráficos, correlação e base de conhecimento.

NOC

É possível resolver em N1?

Baseado em procedimento documentado e de baixo risco.

SIM
NÃO
NOC

4a. Resolução N1

Executar ação corretiva e validar a solução.

Problema Resolvido

Processo encerrado.

NOC

4b. Escalonamento Estruturado

Iniciar criação de chamados.

NOC

5. Criar Chamado PAI

Tipo: Incidente. Proprietário: NOC. Detalhar o problema.

NOC

6. Criar e Vincular Chamado FILHO

Tipo: Tarefa. Proprietário: Time de Suporte (N2/N3).

SUPORTE

7. Resolução N2/N3

Time de Suporte atua e documenta no chamado Filho.

NOC

8. Validação da Solução

NOC confirma se o alerta no Zabbix foi resolvido.

9. Fechamento do Incidente

NOC fecha o chamado Pai. Processo encerrado.

Matriz de Responsabilidades

NOC (N1)

  • Detectar e Reconhecer Alertas
  • Realizar Análise Inicial
  • Tentar Resolução N1
  • Abrir Chamado Pai (Incidente)
  • Abrir Chamado Filho (Tarefa)
  • Acompanhar o Incidente (Follow-up)
  • Validar Solução e Fechar Incidente

Time de Suporte (N2/N3)

  • Receber e Atuar no Chamado Filho
  • Executar Análise Profunda
  • Aplicar Correção Definitiva
  • Documentar Causa Raiz e Solução
  • Fechar o Chamado Filho (Tarefa)