📈 Tendência — ~7 dias · está piorando ou melhorando?
Último snapshot: 449 erros que pedem ação, 1.105 para acompanhar, 5 sem impacto.ver linha do tempo detalhada — data e hora de cada leitura
🧩 Saúde por módulo — qual área dói mais (24h)
ver mais 8 módulos
ver diagnóstico
ver diagnóstico
ver diagnóstico
+ 1 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).
🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 335) · cor = balde de ação
📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 483)
🧭 Os 26 itens por classificação — contagem de itens (não de volume)
🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%
🕘 Ritmo do dia — maior ofensor — InvalidOperationException… por hora (BRT, 24h)
👀 Maiores em “Acompanhar” — 24h · ainda não atinge cliente / já caindo
🛰 Saúde da frota — 47 clientes por proximidade da versão de produção (16.3.x)
👀 21 p/ acompanhar · 1 sem impacto housekeeping — não atinge cliente
👀 Acompanhar — ainda não atinge cliente, ou já diminuindo
🩹 Ruído — o que vale consertar na fonte
Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 1.561 erros).
🕘 Pico de erros às 23h uso real (9–18) vs infra/agendado
Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).
🔁 3 novos · 1 pararam vs 2026-06-29 14:35 · 18h atrás
⊕ Novos ou que voltaram
👥 32 clientes atingidos · 10 em 3+ ambientes quem e onde
👤 Um cliente só
🌐 Vários ambientes (3 ou mais)
🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)
"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).
Produção · 21 grupos · 2.496 hits
Eng interno (hotfix/release-fix/portal) · 11 grupos · 1.765 hits
Outros (NoWebsite/nós de serviço) · 6 grupos · 2.221 hits
Dev (eng-develop) · 2 grupos · 504 hits
Homolog/UAT · 1 grupo · 10 hits
Demo/trial · 1 grupo · 381 hits
Local · 4 grupos · 823 hits
🏷 Risco por versão taxa por cliente
Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.
| Versão | Linhagem | Erros (não-ruído) | Clientes | Taxa/cliente |
|---|---|---|---|---|
| 16.4.0 | 16.4.x | 892 | 1 | 892 amostra fraca |
| 16.3.25 | 16.3.x | 1.838 | 39 | 47.1 |
| 16.3.24 | 16.3.x | 50 | 1 | 50 amostra fraca |
| 16.3.22 | 16.3.x | 2 | 1 | 2 amostra fraca |
| 16.3.9 | 16.3.x | 216 | 1 | 216 amostra fraca |
| 15.4.16 | 15.4.x | 1 | 1 | 1 amostra fraca |
| 15.4.11 | 15.4.x | 157 | 1 | 157 amostra fraca |
| 14.8.4 | 14.8.x | 6 | 1 | 6 amostra fraca |
📦 Carga por cliente (volume) top por volume
Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (60 de 162 ambientes afetados em 72h). Internos e máquinas de dev fora.
🛰 Frota — versão por cliente 47 clientes
Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.
ver por cliente (47)
| Cliente | Versão dominante | Também vista | Atraso? |
|---|---|---|---|
| app | 14.8.4 | — | ⚠ versão antiga |
| dattos-prod.titulo.net | 15.4.4 | — | ⚠ versão antiga |
| dattos (BTG) | 15.4.11 | — | ⚠ versão antiga |
| dattos-uat (BTG) | 15.4.16 | — | ⚠ versão antiga |
| agibank | 16.3.9 | — | ✓ atual |
| ifoodcorp | 16.3.22 | — | ✓ atual |
| vwfs | 16.3.24 | — | ✓ atual |
| 123milhas | 16.3.25 | — | ✓ atual |
| ache | 16.3.25 | — | ✓ atual |
| allcare | 16.3.25 | — | ✓ atual |
| atlas | 16.3.25 | — | ✓ atual |
| bayer | 16.3.25 | — | ✓ atual |
| brpartners | 16.3.25 | — | ✓ atual |
| bs2 | 16.3.25 | — | ✓ atual |
| ccr | 16.3.25 | — | ✓ atual |
| cea | 16.3.25 | — | ✓ atual |
| celcoin | 16.3.25 | — | ✓ atual |
| cervejariacidadeimperial | 16.3.25 | — | ✓ atual |
| cobasi | 16.3.25 | — | ✓ atual |
| colgate | 16.3.25 | — | ✓ atual |
| conciliadorrm | 16.3.25 | — | ✓ atual |
| csf-qa | 16.3.25 | — | ✓ atual |
| edenred | 16.3.25 | — | ✓ atual |
| embarca | 16.3.25 | — | ✓ atual |
| flagship | 16.3.25 | — | ✓ atual |
| grupomodenaesilva | 16.3.25 | — | ✓ atual |
| holambracoop | 16.3.25 | — | ✓ atual |
| ipiranga | 16.3.25 | — | ✓ atual |
| kryptonbpo | 16.3.25 | — | ✓ atual |
| laponia | 16.3.25 | — | ✓ atual |
| martins | 16.3.25 | — | ✓ atual |
| mrsdp | 16.3.25 | — | ✓ atual |
| natura | 16.3.25 | — | ✓ atual |
| nutrien | 16.3.25 | — | ✓ atual |
| operafidc | 16.3.25 | — | ✓ atual |
| orizon | 16.3.25 | — | ✓ atual |
| pirelli_csa | 16.3.25 | — | ✓ atual |
| protege | 16.3.25 | — | ✓ atual |
| qualicorp | 16.3.25 | — | ✓ atual |
| sales | 16.3.25 | — | ✓ atual |
| simpaul | 16.3.25 | — | ✓ atual |
| solinftec | 16.3.25 | — | ✓ atual |
| travelex | 16.3.25 | — | ✓ atual |
| veneza | 16.3.25 | — | ✓ atual |
| yamaha | 16.3.25 | — | ✓ atual |
| zaffari | 16.3.25 | — | ✓ atual |
| gaspar | 16.4.0 | — | ↑ pré-lançamento |
Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.
| # | Classificação | Tipo de erro | Erro | Sistema | Cliente principal | Nº amb. | Ambientes | Versões | 24h | 72h | Tendência | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | Acompanhar | Falha de conexão do pipeline com o servidor de mensagens (tempo esgotado) | [CALLBACK_HTTP_ERROR] correlation_id=06995a13-59d9-4ef5-acf9-000915882c2e… | Pipeline | NoWebsite | 8 | other, prod, eng-internal | 16.3.25, 16.4.0 | 335 | 798 | ▲ 57% | ↗ |
| 2 | Acompanhar ↩ | Falha no serviço de Consulta (motor de dados) | Exception in ASGI application + Exception Group Traceback (most recent call… | Query | dattos-data-engine-query-aws-16-3 | 6 | other | 16.3.25, 16.4.0 | 234 | 654 | — sem mudança | ↗ |
| 3 | Precisa de ação | Execução de fluxo: parte não roda por status, parte falha ao chamar o pipeline | InvalidOperationException: [SchedulePolling] Error processing rule 26 for… | Back | agibank | 33 | prod, other, eng-internal, local, dev, demo | 15.4.11, 16.3.22 | 271 | 381 | — sem mudança | ↗ |
| 4 | Acompanhar | Erro de código (parâmetro nulo) | ArgumentNullException: Value cannot be null. Parameter name: source Value… | Back | edenred | 6 | prod, eng-internal, local | 16.3.25, 16.4.0 | 4 | 314 | — sem mudança | ↗ |
| 5 | Sem impacto | Gateway/serviço novo falhando | session-init call failed for user=snguser host= Traceback (most recent call… | Dattos-Gateway | NoWebsite | 1 | other | 16.4.0 | 5 | 257 | ▼ 37% | ↗ |
| 6 | Acompanhar | Falha de storage externo | Failed to process the job '723758': an exception occurred. An object or… | Back | qualicorp | 4 | prod | 14.8.4, 16.3.25 | 220 | 226 | — sem mudança | ↗ |
| 7 | Precisa de ação | Erro de banco/SQL (conciliação) | SqlException: Failed to process the job '2020': an exception occurred. An… | Back | agibank | 10 | prod, other, local | 15.4.11, 16.3.24 | 103 | 125 | — sem mudança | ↗ |
| 8 | Acompanhar | Falha ao enviar requisição ao motor de dados | HttpRequestException: IO Error: No files found that match the pattern… | Back | edenred | 12 | prod, eng-internal, dev | 16.3.24, 16.3.25 | 71 | 123 | ▼ 28% | ↗ |
| 9 | Precisa de ação | Erro de tela no controle de licença (propriedade indefinida) | FrontException: An API key with the description provided already exists. An… | Front | veneza | 13 | prod, eng-internal | 16.3.24, 16.3.25 | 69 | 85 | — sem mudança | ↗ |
| 10 | Acompanhar ↩ | Falha transitória de importação (banco) | NpgsqlException: Erro durante importação ID 2472878 Exception while reading… | Back | agibank | 5 | prod | 15.4.11, 16.3.25 | 6 | 73 | — sem mudança | ↗ |
| 11 | Acompanhar | Falha EF/DB (interno) | EntityException: Failed to execute polling task. The underlying provider… | Back | sergio | 3 | prod | 16.3.24, 16.4.0 | 60 | 63 | ▲ 271% | ↗ |
| 12 | Acompanhar | Pasta de importação fora da configuração (autorização) | AuthorizationException: A pasta atual não é válida de acordo com as pastas… | Back | edenred | 1 | prod | 16.3.25 | 0 | 56 | ▼ 32% | ↗ |
| 13 | Acompanhar | Falha de envio de e-mail (limite do servidor) | SmtpException: Erro ao enviar e-mail #210712. Service not available, closing… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 36 | 51 | — sem mudança | ↗ |
| 14 | Acompanhar | Falha ao ler do banco (EF/DB) | EntityCommandExecutionException: An error occurred while reading from the… | Back | edenred | 10 | prod | 15.4.11, 16.3.24 | 25 | 38 | — sem mudança | ↗ |
| 15 | Acompanhar ↩ | Erro de código (referência nula) na amostra | NullReferenceException: Failed to process the job '10343628': an exception… | Back | sales | 8 | prod | 15.4.11, 16.3.24 | 19 | 36 | ▼ 22% | ↗ |
| 16 | Acompanhar | Agente de IA de SQL indisponível e erros de sintaxe no ETL | BusinessException: datasource/from-file failed (analysisId=11) Agent service… | Back | veneza | 5 | prod, eng-internal | 16.3.24, 16.3.25 | 30 | 31 | ▼ 33% | ↗ |
| 17 | Acompanhar | Pasta de importação (SFTP) não encontrada | DirectoryNotFoundException: Could not find a part of the path… | Back | ccr | 1 | prod | 16.3.25 | 12 | 30 | — sem mudança | ↗ |
| 18 | Acompanhar | Arquivo de importação ausente no armazenamento | FileNotFoundException: File not found on storage Ttl. Details: FileName… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 10 | 18 | — sem mudança | ↗ |
| 19 | Acompanhar | Falha ao confirmar arquivo no armazenamento (tempo esgotado) | TaskCanceledException: [SetFileStatusAsync] Failed to set file status for… | Back | csf-qa | 1 | prod | 16.3.25 | 18 | 18 | — sem mudança | ↗ |
| 20 | Acompanhar | Resposta inválida do motor de dados (503) | JsonReaderException: DataEngine returned non-parseable JSON on route… | Back | sales | 4 | prod, eng-internal | 16.3.25, 16.4.0 | 4 | 11 | ▼ 66% | ↗ |
| 21 | Acompanhar | Erro de validação (e-mail sem destinatário) | ArgumentException: Erro ao enviar e-mail #210720. Destinatário do e-mail não… | Back | dattos (BTG) | 3 | prod, eng-internal, hom | 15.4.11, 15.4.16 | 7 | 10 | — sem mudança | ↗ |
| 22 | Acompanhar | DependencyResolutionException (Back) | DependencyResolutionException: An exception was thrown while activating… | Back | NoWebsite | 1 | other | 16.3.25 | 6 | 6 | novo | ↗ |
| 23 | Precisa de ação | HttpException (Back) | HttpException: An error occurred while communicating with the remote host… | Back | eng-release-fix | 3 | eng-internal, prod | 16.3.25, 16.4.0 | 6 | 6 | ▲ 50% | ↗ |
| 24 | Acompanhar ↩ | ComponentNotRegisteredException (Back) | ComponentNotRegisteredException: The requested service 'FlatFile… | Back | internal | 1 | local | 16.4.0 | 3 | 3 | novo | ↗ |
| 25 | Acompanhar | SsrfException (Back) | SsrfException: The URL 'https://sftp://transfer.dattos.com.br' was blocked by… | Back | eng-release-fix | 1 | eng-internal | 16.4.0 | 3 | 3 | novo | ↗ |
| 26 | Acompanhar ↩ | Conciliação: base temporária aberta em modo somente-leitura (DuckDB) | Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"… | Pipeline+Matching | edenred | 2 | prod, eng-internal | 16.3.25, 16.4.0 | 2 | 3 | ▲ 50% | ↗ |
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
- Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
- Acompanhar ainda não atinge cliente, ou já está diminuindo.
- Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
- ⚠ Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.
"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.
Símbolos
- 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
- 🔗 N incidente consolidado de N erros da mesma raiz.
- 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
- 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
- em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
- NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor
vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.