📈 Tendência — ~7 dias · está piorando ou melhorando?
Último snapshot: 385 erros que pedem ação, 699 para acompanhar, 33 sem impacto.ver linha do tempo detalhada — data e hora de cada leitura
🧩 Saúde por módulo — qual área dói mais (24h)
ver mais 8 módulos
ver diagnóstico e possível causa
ver diagnóstico e possível causa
ver diagnóstico
+ 2 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).
🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 471) · cor = balde de ação
📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 555)
🧭 Os 24 itens por classificação — contagem de itens (não de volume)
🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%
🕘 Ritmo do dia — maior ofensor — FrontException: An API key with the… por hora (BRT, 24h)
👀 Maiores em “Acompanhar” — 24h · ainda não atinge cliente / já caindo
🛰 Saúde da frota — 49 clientes por proximidade da versão de produção (16.3.x)
👀 16 p/ acompanhar · 3 sem impacto housekeeping — não atinge cliente
👀 Acompanhar — ainda não atinge cliente, ou já diminuindo
🩹 Ruído — o que vale consertar na fonte
Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 1.121 erros).
🕘 Pico de erros às 10h uso real (9–18) vs infra/agendado
Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).
🔁 1 novos · 1 pararam vs 2026-06-29 08:33 · 6h atrás
✅ Resolvidos (provável) — pararam de aparecer e antes pediam atenção. Parou não é o mesmo que corrigido: confirme a causa.
⊕ Novos ou que voltaram
⊖ Que pararam
Nenhum.
👥 28 clientes atingidos · 10 em 3+ ambientes quem e onde
👤 Um cliente só
🌐 Vários ambientes (3 ou mais)
🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)
"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).
Produção · 21 grupos · 2.288 hits
Eng interno (hotfix/release-fix/portal) · 10 grupos · 1.647 hits
Outros (NoWebsite/nós de serviço) · 6 grupos · 2.066 hits
Dev (eng-develop) · 3 grupos · 529 hits
Homolog/UAT · 2 grupos · 117 hits
Local · 6 grupos · 1.197 hits
🏷 Risco por versão taxa por cliente
Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.
| Versão | Linhagem | Erros (não-ruído) | Clientes | Taxa/cliente |
|---|---|---|---|---|
| 16.4.0 | 16.4.x | 588 | 2 | 294 amostra fraca |
| 16.3.25 | 16.3.x | 1.586 | 33 | 48.1 |
| 16.3.24 | 16.3.x | 202 | 7 | 28.9 |
| 16.3.22 | 16.3.x | 239 | 3 | 79.7 |
| 16.3.20 | 16.3.x | 2 | — | — |
| 16.3.9 | 16.3.x | 184 | 1 | 184 amostra fraca |
| 15.4.16 | 15.4.x | 2 | 1 | 2 amostra fraca |
| 15.4.11 | 15.4.x | 142 | 1 | 142 amostra fraca |
| 14.8.4 | 14.8.x | 8 | 1 | 8 amostra fraca |
📦 Carga por cliente (volume) top por volume
Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (63 de 162 ambientes afetados em 72h). Internos e máquinas de dev fora.
🛰 Frota — versão por cliente 49 clientes
Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.
ver por cliente (49)
| Cliente | Versão dominante | Também vista | Atraso? |
|---|---|---|---|
| app | 14.8.4 | — | ⚠ versão antiga |
| dattos (BTG) | 15.4.11 | — | ⚠ versão antiga |
| dattos-uat (BTG) | 15.4.16 | — | ⚠ versão antiga |
| agibank | 16.3.9 | — | ✓ atual |
| ifoodcorp | 16.3.22 | — | ✓ atual |
| martins | 16.3.22 | 16.3.25 | ✓ atual |
| uniasselvi | 16.3.22 | — | ✓ atual |
| kryptonbpo | 16.3.24 | 16.3.25 | ✓ atual |
| laponia | 16.3.24 | — | ✓ atual |
| opea | 16.3.24 | 16.3.25 | ✓ atual |
| sebraemg | 16.3.24 | — | ✓ atual |
| simpaul | 16.3.24 | 16.3.25 | ✓ atual |
| vwfs | 16.3.24 | — | ✓ atual |
| yamaha | 16.3.24 | 16.3.25 | ✓ atual |
| cea | 16.3.25 | 16.3.20 | ✓ atual |
| brpartners | 16.3.25 | 16.3.22 | ✓ atual |
| qualicorp | 16.3.25 | 16.3.22 | ✓ atual |
| sales | 16.3.25 | 16.3.22 | ✓ atual |
| zaffari | 16.3.25 | 16.3.22 | ✓ atual |
| allcare | 16.3.25 | 16.3.24 | ✓ atual |
| cervejariacidadeimperial | 16.3.25 | 16.3.24 | ✓ atual |
| colgate | 16.3.25 | 16.3.24 | ✓ atual |
| edenred | 16.3.25 | 16.3.24 | ✓ atual |
| natura | 16.3.25 | 16.3.24 | ✓ atual |
| operafidc | 16.3.25 | 16.3.24 | ✓ atual |
| travelex | 16.3.25 | 16.3.24 | ✓ atual |
| 123milhas | 16.3.25 | — | ✓ atual |
| ache | 16.3.25 | — | ✓ atual |
| atlas | 16.3.25 | — | ✓ atual |
| bayer | 16.3.25 | — | ✓ atual |
| bs2 | 16.3.25 | — | ✓ atual |
| ccr | 16.3.25 | — | ✓ atual |
| celcoin | 16.3.25 | — | ✓ atual |
| cobasi | 16.3.25 | — | ✓ atual |
| conciliadorrm | 16.3.25 | — | ✓ atual |
| csf-qa | 16.3.25 | — | ✓ atual |
| embarca | 16.3.25 | — | ✓ atual |
| flagship | 16.3.25 | — | ✓ atual |
| grupomodenaesilva | 16.3.25 | — | ✓ atual |
| holambracoop | 16.3.25 | — | ✓ atual |
| ipiranga | 16.3.25 | — | ✓ atual |
| nutrien | 16.3.25 | — | ✓ atual |
| orizon | 16.3.25 | — | ✓ atual |
| pirelli_csa | 16.3.25 | — | ✓ atual |
| protege | 16.3.25 | — | ✓ atual |
| solinftec | 16.3.25 | — | ✓ atual |
| veneza | 16.3.25 | — | ✓ atual |
| gaspar | 16.4.0 | — | ↑ pré-lançamento |
| local-denis | 16.4.0 | — | ↑ pré-lançamento |
Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.
| # | Classificação | Tipo de erro | Erro | Sistema | Cliente principal | Nº amb. | Ambientes | Versões | 24h | 72h | Tendência | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | Acompanhar ↩ | Falha no serviço de Consulta (motor de dados) | Exception in ASGI application + Exception Group Traceback (most recent call… | Query | dattos-data-engine-query-aws-16-3 | 7 | other | 16.3.25, 16.4.0 | 471 | 717 | — sem mudança | ↗ |
| 2 | Acompanhar | Falha de conexão do pipeline com o servidor de mensagens (tempo esgotado) | [CALLBACK_HTTP_ERROR] correlation_id=06995a13-59d9-4ef5-acf9-000915882c2e… | Pipeline | NoWebsite | 9 | other, prod, eng-internal, local | 16.3.25, 16.4.0 | 19 | 507 | — sem mudança | ↗ |
| 3 | Sem impacto | Gateway/serviço novo falhando | session-init call failed for user=snguser host= Traceback (most recent call… | Dattos-Gateway | NoWebsite | 1 | other | 16.4.0 | 8 | 405 | — sem mudança | ↗ |
| 4 | Acompanhar | Erro de código (parâmetro nulo) | ArgumentNullException: Value cannot be null. Parameter name: source Value… | Back | edenred | 4 | prod, eng-internal | 16.3.24, 16.3.25 | 3 | 376 | ▼ 24% | ↗ |
| 5 | Precisa de ação | Execução de fluxo: parte não roda por status, parte falha ao chamar o pipeline | InvalidOperationException: [SchedulePolling] Error processing rule 26 for… | Back | yamaha | 35 | prod, other, eng-internal, dev, local | 15.4.11, 16.3.20 | 181 | 327 | — sem mudança | ↗ |
| 6 | Acompanhar | Falha de storage externo | Failed to process the job '723758': an exception occurred. An object or… | Back | qualicorp | 2 | prod | 14.8.4, 16.3.22 | 4 | 230 | — sem mudança | ↗ |
| 7 | Acompanhar | Falha ao enviar requisição ao motor de dados | HttpRequestException: IO Error: No files found that match the pattern… | Back | edenred | 14 | prod, eng-internal, dev, local | 16.3.22, 16.3.24 | 97 | 170 | ▼ 30% | ↗ |
| 8 | Precisa de ação | Erro de banco/SQL (conciliação) | SqlException: Failed to process the job '2020': an exception occurred. An… | Back | agibank | 10 | prod, other, hom, local | 15.4.11, 15.4.16 | 84 | 106 | — sem mudança | ↗ |
| 9 | Precisa de ação | Erro de tela no controle de licença (propriedade indefinida) | FrontException: An API key with the description provided already exists. An… | Front | veneza | 17 | prod, eng-internal | 16.3.22, 16.3.24 | 76 | 94 | ▲ 47% | ↗ |
| 10 | Acompanhar | Pasta de importação fora da configuração (autorização) | AuthorizationException: A pasta atual não é válida de acordo com as pastas… | Back | edenred | 2 | prod, eng-internal | 16.3.24, 16.3.25 | 0 | 82 | — sem mudança | ↗ |
| 11 | Acompanhar ↩ | Falha transitória de importação (banco) | NpgsqlException: Erro durante importação ID 2472878 Exception while reading… | Back | agibank | 5 | prod | 15.4.11, 16.3.25 | 26 | 77 | — sem mudança | ↗ |
| 12 | Acompanhar | Falha de envio de e-mail (limite do servidor) | SmtpException: Erro ao enviar e-mail #210712. Service not available, closing… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 23 | 52 | ▲ 27% | ↗ |
| 13 | Precisa de ação | Agente de IA de SQL indisponível e erros de sintaxe no ETL | BusinessException: datasource/from-file failed (analysisId=11) Agent service… | Back | veneza | 9 | prod, eng-internal, local | 16.3.22, 16.3.24 | 26 | 46 | ▲ 70% | ↗ |
| 14 | Precisa de ação ↩ | Erro de código (referência nula) na amostra | NullReferenceException: Failed to process the job '10343628': an exception… | Back | allcare | 7 | prod | 15.4.11, 16.3.24 | 18 | 46 | — sem mudança | ↗ |
| 15 | Sem impacto | Falha ao ler do banco (EF/DB) | EntityCommandExecutionException: An error occurred while reading from the… | Back | edenred | 11 | prod, local | 16.3.24, 16.3.25 | 25 | 41 | — sem mudança | ↗ |
| 16 | Acompanhar | Resposta inválida do motor de dados (503) | JsonReaderException: DataEngine returned non-parseable JSON on route… | Back | eng-release-fix | 5 | eng-internal, dev, prod | 16.3.25, 16.4.0 | 9 | 32 | — sem mudança | ↗ |
| 17 | Acompanhar | Pasta de importação (SFTP) não encontrada | DirectoryNotFoundException: Could not find a part of the path… | Back | ccr | 1 | prod | 16.3.25 | 12 | 30 | — sem mudança | ↗ |
| 18 | Acompanhar | Falha ao confirmar arquivo no armazenamento (tempo esgotado) | TaskCanceledException: [SetFileStatusAsync] Failed to set file status for… | Back | csf-qa | 1 | prod | 16.3.25 | 0 | 20 | — sem mudança | ↗ |
| 19 | Acompanhar | Arquivo de importação ausente no armazenamento | FileNotFoundException: File not found on storage Ttl. Details: FileName… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 10 | 18 | — sem mudança | ↗ |
| 20 | Acompanhar | Falha EF/DB (interno) | EntityException: Failed to execute polling task. The underlying provider… | Back | vwfs | 3 | prod | 16.3.24, 16.4.0 | 17 | 17 | ▲ 183% | ↗ |
| 21 | Acompanhar | Erro de validação (e-mail sem destinatário) | ArgumentException: Erro ao enviar e-mail #210720. Destinatário do e-mail não… | Back | dattos (BTG) | 4 | prod, eng-internal, hom | 15.4.11, 15.4.16 | 4 | 11 | ▼ 27% | ↗ |
| 22 | Acompanhar | HttpException (Back) | HttpException: An error occurred while communicating with the remote host… | Back | travelex | 2 | prod | 16.3.25 | 4 | 4 | novo | ↗ |
| 23 | Sem impacto | Falha ao identificar o ambiente do cliente na requisição | HttpResponseException: Processing of the HTTP request resulted in an… | Back | NoWebsite | 1 | other | 16.4.0 | 0 | 4 | — sem mudança | ↗ |
| 24 | Acompanhar ↩ | Conciliação: base temporária aberta em modo somente-leitura (DuckDB) | Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"… | Pipeline+Matching | edenred | 2 | prod, eng-internal | 16.3.25, 16.4.0 | 0 | 2 | ▼ 50% | ↗ |
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
- Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
- Acompanhar ainda não atinge cliente, ou já está diminuindo.
- Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
- ⚠ Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.
"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.
Símbolos
- 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
- 🔗 N incidente consolidado de N erros da mesma raiz.
- 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
- 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
- em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
- NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor
vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.