Gestão Intermediário

Indicadores de TI (KPIs) que Realmente Importam

Os KPIs de TI que todo gestor precisa acompanhar. Métricas de disponibilidade, performance, custo e segurança com benchmarks de mercado e como implementar.

14 min de leitura

“Estamos com 99,5% de uptime.” Legal. Mas o CFO quer saber: por que TI precisa de mais R$ 200K no orçamento? E o CEO pergunta: o investimento em TI está dando retorno?

Se os únicos números que você tem são métricas técnicas que ninguém fora da TI entende, a conversa vai ser difícil. KPIs de TI eficazes traduzem operações técnicas em linguagem de negócio.

O Erro Mais Comum: Medir Demais

Dashboards com 50 métricas não são úteis — são decoração. Quando tudo é prioridade, nada é prioridade.

A regra: No máximo 12 KPIs. Desses, 3-4 vão para a diretoria (primários), o resto é gestão operacional (secundários).

Critérios para um bom KPI:

  • É acionável (se o número piorar, sei o que fazer)
  • É comparável (posso medir mês a mês e comparar com benchmarks)
  • É compreensível (stakeholders não técnicos entendem)
  • Está conectado ao negócio (impacta receita, custo ou produtividade)

Os KPIs Primários: O Que a Diretoria Precisa Ver

1. Disponibilidade (Uptime)

O mais fundamental. Quanto tempo os sistemas críticos ficaram disponíveis no período.

Como calcular: (Tempo total - Tempo de downtime) / Tempo total × 100

Benchmarks:

  • 99,0% = 7,3 horas de downtime/mês — Abaixo do aceitável para a maioria
  • 99,5% = 3,6 horas/mês — Aceitável para sistemas internos
  • 99,9% = 43 minutos/mês — Bom para sistemas voltados ao cliente
  • 99,95% = 22 minutos/mês — Excelente, requer investimento significativo em HA
  • 99,99% = 4,3 minutos/mês — Elite, custo alto de infraestrutura

Cuidado: Meça por sistema crítico, não como média geral. Uma média de 99,9% esconde que o ERP ficou fora 8 horas e o sistema de backup nunca caiu. Ferramentas como PRTG automatizam a coleta de uptime por serviço com monitoramento contínuo.

Dica: Diferencie downtime planejado (manutenção) de não planejado (incidentes). A diretoria se importa com o não planejado.

2. MTTR — Tempo Médio de Resolução

Quanto tempo leva da detecção do incidente até a resolução completa.

Como calcular: Soma do tempo de resolução de todos os incidentes / Número de incidentes

Benchmarks por severidade:

  • P1 (Crítico): Meta < 1 hora. Benchmark de mercado: 2-4 horas
  • P2 (Alto): Meta < 4 horas. Benchmark: 4-8 horas
  • P3 (Médio): Meta < 8 horas. Benchmark: 1-2 dias úteis
  • P4 (Baixo): Meta < 3 dias. Benchmark: 3-5 dias úteis

Por que MTTR e não MTBF: Você pode reduzir MTTR com investimento em automação, playbooks de resposta a incidentes e treinamento. Reduzir MTBF exige reengenharia de sistemas inteiros. MTTR é mais acionável.

Decomponha o MTTR em:

  • Tempo de detecção (monitoramento → alerta)
  • Tempo de mobilização (alerta → alguém olhando)
  • Tempo de diagnóstico (olhando → entendeu o problema)
  • Tempo de resolução (entendeu → corrigiu)

Cada fase tem alavancas diferentes de melhoria.

3. Custo por Usuário de TI

Quanto TI custa por funcionário atendido. Conecta operações ao orçamento.

Como calcular: Orçamento total de TI / Número de usuários suportados

Benchmarks (mercado brasileiro, 2025-2026):

  • Empresas de serviços: R$ 800-1.500/usuário/mês
  • Indústria: R$ 500-1.000/usuário/mês
  • Tecnologia: R$ 1.200-2.500/usuário/mês
  • Varejo: R$ 300-700/usuário/mês

Uso estratégico: Se o custo está acima do benchmark, identifique onde está o gap (headcount, licenças como Microsoft 365, infraestrutura). Se está abaixo, valide que não está sub-investindo.

4. Satisfação do Usuário (CSAT Interno)

Percepção dos funcionários sobre a qualidade do suporte e dos serviços de TI.

Como medir:

  • Pesquisa pós-ticket (1-5 estrelas, com comentário opcional)
  • Pesquisa trimestral geral (NPS interno)
  • Taxa de reabertura de tickets (proxy de satisfação)

Benchmarks:

  • CSAT > 4,2/5 — Excelente
  • CSAT 3,5-4,2 — Bom
  • CSAT < 3,5 — Precisa de atenção

Por que importa: É o KPI que a diretoria mais entende intuitivamente. “Nosso NPS interno de TI é 45, acima da média do setor” é mais poderoso que qualquer métrica técnica.

Os KPIs Secundários: Gestão Operacional

5. Volume e Distribuição de Tickets

Quantos tickets entram, por categoria e por canal.

O que observar:

  • Tendência de volume (crescendo, estável, diminuindo)
  • Top 5 categorias (onde concentrar automação)
  • Distribuição por canal (email, chat, portal, telefone)
  • Proporção incidentes vs. solicitações

Ação: Se reset de senha é top 3, implemente self-service. Se problemas de VPN são recorrentes, invista na causa raiz.

6. Taxa de Resolução em Primeiro Contato (FCR)

Percentual de tickets resolvidos sem escalonamento.

Como calcular: Tickets resolvidos no N1 / Total de tickets × 100

Benchmark: 65-80% é considerado bom. Abaixo de 50% indica problemas na base de conhecimento ou no nível de capacitação do N1.

Alavancas de melhoria: Base de conhecimento atualizada, scripts de diagnóstico, automação de tarefas comuns, treinamento contínuo do N1.

7. Taxa de Mudanças com Falha

Percentual de changes que causam incidentes ou precisam de rollback.

Como calcular: Changes com falha / Total de changes implementadas × 100

Benchmark:

  • < 5% — Excelente processo de change management
  • 5-15% — Aceitável, com espaço para melhoria
  • 15% — Processo de changes precisa de revisão urgente

Por que importa: Mede a qualidade do processo de mudanças. Uma taxa alta indica revisão insuficiente, testes inadequados ou falta de procedimento de rollback. O checklist de segurança para CTOs inclui controles de change management.

8. Backlog de Projetos de TI

Número e idade dos projetos/demandas em espera.

O que observar:

  • Quantos projetos no backlog
  • Idade média das demandas em espera
  • Proporção entre capacidade (projetos em andamento) e demanda (novos pedidos)

Ação: Se o backlog só cresce, há um desalinhamento entre demanda e capacidade. Use esse número para justificar contratações ou repriorização.

9. Custo por Ticket

Quanto custa resolver cada ticket em média.

Como calcular: Custo total do service desk / Total de tickets no período

Benchmark:

  • R$ 30-50 por ticket — Service desk eficiente com boa automação
  • R$ 50-100 — Faixa normal para empresas médias
  • R$ 100+ — Indica oportunidade de automação e self-service

Decomponha por nível:

  • N1 (self-service automatizado): R$ 2-5
  • N1 (humano): R$ 20-40
  • N2: R$ 50-100
  • N3: R$ 100-300

O caminho para reduzir o custo médio é mover volume do N2/N3 para N1 e do N1 humano para self-service. Ferramentas de acesso remoto como TeamViewer reduzem o tempo de resolução do N1/N2, e automação de processos repetitivos reduz o volume total.

10. SLA Compliance

Percentual de tickets/serviços entregues dentro do SLA acordado.

Como calcular: Tickets dentro do SLA / Total de tickets × 100

Meta: > 95% para serviços críticos, > 90% para serviços gerais.

Cuidado: SLA compliance de 100% pode indicar SLAs muito frouxos, não excelência operacional. Revise os SLAs periodicamente.

Construindo o Dashboard Executivo

O dashboard para a diretoria deve caber em uma tela com os 4 KPIs primários:

Layout sugerido:

  • Disponibilidade dos sistemas críticos (com tendência)
  • MTTR por severidade (com tendência)
  • Custo por usuário (com comparativo de mercado)
  • Satisfação do usuário (com tendência)

Frequência: Mensal para a diretoria. Semanal para gestão de TI. Diário/real-time para operações.

Regra de ouro: Se o dashboard precisa de explicação verbal para ser entendido, ele está complexo demais. Os números devem falar por si.


Se esse tipo de conteúdo é útil para você, o Briefing do CTO entrega ferramentas, dados e insights práticos sobre infraestrutura, cloud, segurança e IA toda semana no seu email.


Conectando KPIs ao Orçamento

A conversa mais importante que o gestor de TI tem é a de orçamento. KPIs são a munição para essa conversa.

Para pedir mais investimento:

  • “Nosso MTTR para incidentes P1 é 4 horas. Com investimento em automação e monitoramento preditivo, podemos reduzir para 1 hora. Considerando que cada hora de downtime custa R$ X, o ROI é de Y meses.”

Para justificar investimento feito:

  • “No último trimestre, o custo por ticket caiu de R$ 85 para R$ 52 após a implementação do chatbot. Economia anualizada de R$ 120K.”

Para defender o budget atual:

  • “Nosso custo por usuário de R$ 950/mês está 15% abaixo do benchmark do setor, mantendo disponibilidade de 99,9%. Cortar R$ 200K colocaria em risco esse nível de serviço.”

A Calculadora de Downtime ajuda a quantificar o custo de incidentes para fortalecer esses argumentos. E o Assessment de Infraestrutura identifica onde os investimentos terão maior retorno.

O Princípio Final

KPIs não são para decorar dashboards — são para tomar decisões. Se um KPI não muda nenhuma decisão quando piora ou melhora, remova-o. Menos métricas, mais ação. Esse é o diferencial entre gestão de TI operacional e gestão de TI estratégica.

Perguntas frequentes

Quantos KPIs de TI devo acompanhar?

Entre 8 e 12 no máximo. Mais do que isso e ninguém olha para nenhum. Defina 3-4 KPIs primários (os que vão para a diretoria) e 5-8 secundários (os que o time de TI acompanha para gestão operacional). Revise a lista semestralmente.

Qual a diferença entre MTBF e MTTR?

MTBF (Mean Time Between Failures) mede quanto tempo entre falhas — indica confiabilidade. MTTR (Mean Time To Repair/Resolve) mede quanto tempo para resolver — indica capacidade de resposta. Para a maioria das empresas, MTTR é mais acionável: você pode melhorar a velocidade de resposta mais rápido do que eliminar todas as falhas.

Como convencer a diretoria a investir em TI usando KPIs?

Fale a língua do negócio: custo por incidente, custo de downtime por hora, ROI de projetos de automação, e satisfação dos usuários internos. Evite métricas puramente técnicas (IOPS, throughput) — traduzam em impacto financeiro ou de produtividade.

Com que frequência devo revisar os KPIs de TI?

Operacionais (disponibilidade, tickets abertos, MTTR): diariamente ou em tempo real. Táticos (custo por ticket, SLA compliance, backlog): semanalmente. Estratégicos (custo por usuário, satisfação, ROI de projetos): mensalmente. Revisão da lista de KPIs em si: semestralmente.

#kpis #metricas #gestao #itsm #sla #disponibilidade #performance