❓ Como ler este painel — régua, símbolos e limites (1 toque para fechar)
Os 3 baldes (regra automática, auditável)
- Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
- Acompanhar ainda não atinge cliente, ou já está diminuindo.
- Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
- ⚠ Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.
"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.
Símbolos
- 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
- 🔗 N incidente consolidado de N erros da mesma raiz.
- 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
- 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
- em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
- NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor
vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.
🔴 Precisa de ação · afeta clientes
255
▼ 75% desde o último (23h atrás) · 2 problemas
pico 608 · ~7 dias · 15 snapshots
234Acompanhar · 22 problemas · ainda sem impacto ou já diminuindo
6⚪ Sem impacto no cliente · desenvolvimento ou infraestrutura
👥 Afeta 29 ou mais clientes de produção (estimativa)csf-qa, edenred, afextyc, qualicorp +4
| Cliente | Pedem ação | Total | Pior caso (o que o cliente vê) |
|---|---|---|---|
| csf-qa | 2 | 7 | A tarefa falha e o resultado não é gerado… |
| edenred | 1 | 4 | O processamento da análise falha e o… |
| afextyc | 1 | 4 | O processamento falha e a análise não… |
| qualicorp | 1 | 2 | A tarefa falha e o resultado não é gerado… |
| app | 1 | 1 | A tarefa falha e o resultado não é gerado… |
| bayer | 1 | 1 | A tarefa falha e o resultado não é gerado… |
| dattos (BTG) | · | 8 | A tarefa de conciliação falha; o resultado… |
| conciliadorrm | · | 4 | O processamento da análise falha e o… |
| local | · | 3 | O resultado da conciliação não carrega para… |
| agibank | · | 2 | O processamento da análise falha e o… |
| yamaha | · | 2 | O processamento da análise falha e o… |
| dattos-prod.titulo.net | · | 2 | Quase nenhum em cliente de produção… |
ver diagnóstico
ver diagnóstico
ver mais 4 módulos
🩹 Ruído: o que vale consertar o maior limpa ~1% do painel
Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 495 erros). Itens de 72h abaixo são contexto, não subtraíveis.
Contexto 72h — janela diferente, não soma ao painel de 24h
noise_backlog.json (dono · ação · prazo) — reconhecimento visível, não silenciamento. Sem prazo cumprido, o item volta ao destaque.📈 Forma do volume 15 snapshots · empilhado
Volume de 24h ao longo dos snapshots, empilhado: vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto (ruído). Se o pico é cinza, é ruído de dev — não fogo.
Snapshots anteriores à v6 aparecem em cinza (sem divisão por categoria gravada); o split vermelho/amarelo preenche a partir de agora.
🕘 Ritmo do dia últimas 24h · horário comercial 9–18
Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).
🏷 Risco por versão taxa por cliente
Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.
| Versão | Linhagem | Erros (não-ruído) | Clientes | Taxa/cliente |
|---|---|---|---|---|
| 16.4.0 | 16.4.x | 489 | 2 | 244.5 amostra fraca |
| 16.3.24 | 16.3.x | 694 | 1 | 694 amostra fraca |
| 16.3.23 | 16.3.x | 31 | — | — |
| 16.3.22 | 16.3.x | 2.408 | 46 | 52.3 |
| 16.3.20 | 16.3.x | 85 | 3 | 28.3 |
| 16.3.9 | 16.3.x | 255 | 1 | 255 amostra fraca |
| 16.0.12 | 16.0.x | 1 | 1 | 1 amostra fraca |
| 15.4.15 | 15.4.x | 7 | 1 | 7 amostra fraca |
| 15.4.11 | 15.4.x | 189 | 1 | 189 amostra fraca |
| 15.4.4 | 15.4.x | 46 | 1 | 46 amostra fraca |
| 14.8.4 | 14.8.x | 6 | 1 | 6 amostra fraca |
📦 Carga por cliente (volume) top por volume
Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (73 de 114 ambientes afetados em 72h). Internos e máquinas de dev fora.
🛰 Frota — versão por cliente 58 clientes
Um cliente pode emitir sob várias versões numa janela de 72h (deploy no meio). Mostramos a dominante + a cauda. Esta tabela é o denominador que normaliza o risco por versão. Atraso medido contra a versão de produção mais comum da frota (16.3.x).
| Cliente | Versão dominante | Também vista | Atraso? |
|---|---|---|---|
| app | 14.8.4 | — | ⚠ versão antiga |
| dattos-prod.titulo.net | 15.4.4 | — | ⚠ versão antiga |
| dattos (BTG) | 15.4.11 | — | ⚠ versão antiga |
| dattos-uat (BTG) | 15.4.15 | — | ⚠ versão antiga |
| iugu | 16.0.12 | — | ⚠ versão antiga |
| agibank | 16.3.9 | — | ✓ atual |
| cea | 16.3.20 | 16.3.22 | ✓ atual |
| fiap | 16.3.20 | — | ✓ atual |
| omnicom | 16.3.20 | — | ✓ atual |
| 123milhas | 16.3.22 | — | ✓ atual |
| abc | 16.3.22 | — | ✓ atual |
| ache | 16.3.22 | — | ✓ atual |
| afextyc | 16.3.22 | — | ✓ atual |
| allcare | 16.3.22 | — | ✓ atual |
| auraalmas | 16.3.22 | — | ✓ atual |
| bayer | 16.3.22 | — | ✓ atual |
| brpartners | 16.3.22 | — | ✓ atual |
| bs2 | 16.3.22 | — | ✓ atual |
| ccr | 16.3.22 | — | ✓ atual |
| celcoin | 16.3.22 | — | ✓ atual |
| cobasi | 16.3.22 | — | ✓ atual |
| cofco | 16.3.22 | — | ✓ atual |
| colgate | 16.3.22 | — | ✓ atual |
| conciliadorrm | 16.3.22 | 16.3.24 | ✓ atual |
| csf-qa | 16.3.22 | — | ✓ atual |
| edenred | 16.3.22 | 16.3.24 | ✓ atual |
| elo | 16.3.22 | — | ✓ atual |
| f2jinterlagos | 16.3.22 | — | ✓ atual |
| gruposanta | 16.3.22 | — | ✓ atual |
| harman | 16.3.22 | — | ✓ atual |
| holambracoop | 16.3.22 | — | ✓ atual |
| ipiranga | 16.3.22 | — | ✓ atual |
| isacteep | 16.3.22 | — | ✓ atual |
| kryptonbpo | 16.3.22 | — | ✓ atual |
| laponia | 16.3.22 | — | ✓ atual |
| martins | 16.3.22 | — | ✓ atual |
| mbenz | 16.3.22 | 16.3.24 | ✓ atual |
| natura | 16.3.22 | — | ✓ atual |
| operafidc | 16.3.22 | — | ✓ atual |
| positivosmais | 16.3.22 | — | ✓ atual |
| protege | 16.3.22 | — | ✓ atual |
| pucrs | 16.3.22 | — | ✓ atual |
| qualicorp | 16.3.22 | — | ✓ atual |
| sales | 16.3.22 | 16.3.24 | ✓ atual |
| sbibhae | 16.3.22 | — | ✓ atual |
| sebraemg | 16.3.22 | — | ✓ atual |
| simpaul | 16.3.22 | — | ✓ atual |
| stellantis | 16.3.22 | — | ✓ atual |
| tbmtextil | 16.3.22 | — | ✓ atual |
| uniasselvi | 16.3.22 | — | ✓ atual |
| unimedprudente | 16.3.22 | — | ✓ atual |
| volks | 16.3.22 | — | ✓ atual |
| vwfs | 16.3.22 | — | ✓ atual |
| yamaha | 16.3.22 | — | ✓ atual |
| zaffari | 16.3.22 | — | ✓ atual |
| local | 16.3.24 | 16.3.23 · 16.3.20 | ✓ atual |
| local-denis | 16.4.0 | 16.3.23 | ↑ pré-lançamento |
| local-maiglon | 16.4.0 | — | ↑ pré-lançamento |
🔁 O que mudou desde o último snapshot 2026-06-20 15:35 · 23h atrás
⊕ Novos ou que voltaram
Nenhum grupo novo.
🔬 Diagnóstico por problema (detalhe) 10 grupos
Onde acontece · o que o cliente vê · causa provável. São hipóteses — confirme no Loki antes de agir.
👥 Quem é afetado por cliente / vários ambientes
👤 Um cliente só
🌐 Vários ambientes (3 ou mais)
🌎 Por ambiente
Uma mesma falha pode aparecer em mais de um ambiente — por isso os totais não se somam. "Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).
Produção · 24 grupos · 3.306 hits
Eng interno (hotfix/release-fix/portal) · 10 grupos · 2.489 hits
Outros (NoWebsite/nós de serviço) · 8 grupos · 3.685 hits
Dev (eng-develop) · 1 grupo · 39 hits
Homolog/UAT · 4 grupos · 669 hits
Demo/trial · 1 grupo · 601 hits
Local · 9 grupos · 1.694 hits
🏷 Tipos de erro (classificados por IA) 27
Erro de SQL ao processar tarefa (coluna sem nome) · 1 grupo · 1.122 hits
Falha ao carregar amostra (consulta) · 1 grupo · 923 hits
Conciliação não abre o arquivo de staging (somente-leitura) · 1 grupo · 601 hits
Gateway/serviço novo falhando · 1 grupo · 368 hits
Conciliação: coluna ausente na consulta (binder error) · 1 grupo · 366 hits
Falha no processamento da análise (ETL) · 1 grupo · 250 hits
Erro de banco/SQL (conciliação) · 1 grupo · 208 hits
Falha ao gravar status de arquivo (cancelado) · 1 grupo · 156 hits
Conciliação: falha de conexão com a fila de mensagens · 1 grupo · 153 hits
Erro de frontend (null/undefined) · 1 grupo · 84 hits
Falha de envio de e-mail · 1 grupo · 68 hits
Conexão/infra do motor de dados (dev) · 1 grupo · 60 hits
Falha ao ler resposta do motor de dados (JSON inválido) · 1 grupo · 50 hits
Falha EF/DB (interno) · 1 grupo · 39 hits
Falha EF/DB · 1 grupo · 38 hits
Erro de validação (importação/e-mail) · 1 grupo · 37 hits
Arquivo/pasta de importação ausente (SFTP) · 1 grupo · 30 hits
Erro de negócio (e-mail já processado) · 1 grupo · 26 hits
Erro de código (referência nula) · 1 grupo · 16 hits
Permissão de pasta (validação) · 1 grupo · 16 hits
Arquivo ausente no storage · 1 grupo · 11 hits
Falha transitória de importação (banco) · 1 grupo · 10 hits
Erro de banco na importação (overflow) · 1 grupo · 8 hits
Acesso negado a arquivo (SFTP) · 1 grupo · 5 hits
Erro de código (parâmetro nulo) · 1 grupo · 5 hits
Erro de código (índice fora do limite) · 1 grupo · 4 hits
Falha em tarefa agendada (reflexão) · 1 grupo · 3 hits
📊 Volume total — Top 10 por contagem inclui erros de desenvolvimento
Lista pela contagem total — o #1 quase sempre é erro de desenvolvimento, sem impacto no cliente. Para priorizar, use "Resolver primeiro" acima.
24h
72h
🗂 Tabela completa 27 grupos · filtrável
| # | Classificação | Tipo de erro | Erro | Sistema | Cliente principal | Nº amb. | Ambientes | Versões | 24h | 72h | Tendência | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | Precisa de ação | Erro de SQL ao processar tarefa (coluna sem nome) | (none): Failed to process the job '704639': an exception occurred. An object… | Back | qualicorp | 5 | prod, other | 14.8.4, 16.3.22 | 218 | 1.122 | ▲ 22% | ↗ |
| 2 | Acompanhar | Falha ao carregar amostra (consulta) | (none): Exception in ASGI application + Exception Group Traceback (most… | Query | dattos-data-engine-query-aws-16-3 | 8 | other, eng-internal | 16.3.20, 16.3.22 | 10 | 923 | ▼ 44% | ↗ |
| 3 | Acompanhar | Conciliação não abre o arquivo de staging (somente-leitura) | InvalidOperationException: Error calling service 'pipeline', operation… | Back | agibank | 44 | prod, other, eng-internal, local, demo, hom | 15.4.11, 15.4.15 | 55 | 601 | ▼ 33% | ↗ |
| 4 | Sem impacto | Gateway/serviço novo falhando | (none): session-init call failed for user=postgres host=postgres Traceback… | Dattos-Gateway | NoWebsite | 1 | other | 16.4.0 | 6 | 368 | ▼ 44% | ↗ |
| 5 | Acompanhar | Conciliação: coluna ausente na consulta (binder error) | HttpRequestException: Binder Error: Referenced column "OSA" not found in FROM… | Back | eng-release-fix | 23 | eng-internal, prod, local | 16.3.20, 16.3.22 | 9 | 366 | ▼ 35% | ↗ |
| 6 | Precisa de ação | Falha no processamento da análise (ETL) | (none): Error: IO Error: Cannot open database "a:/efs/staging/d4c3261e-b3c6-4c… | Pipeline | sergio | 20 | prod, local, eng-internal, other | 16.3.20, 16.3.22 | 37 | 250 | — sem mudança | ↗ |
| 7 | Acompanhar | Erro de banco/SQL (conciliação) | SqlException: Failed to process the job '704639': an exception occurred. An… | Back | agibank | 12 | prod, other, local | 15.4.11, 15.4.4 | 24 | 208 | ▼ 32% | ↗ |
| 8 | Acompanhar | Falha ao gravar status de arquivo (cancelado) | TaskCanceledException: [SetFileStatusAsync] Failed to set file status for… | Back | csf-qa | 2 | prod, eng-internal | 16.3.22, 16.3.23 | 46 | 156 | — sem mudança | ↗ |
| 9 | Acompanhar | Conciliação: falha de conexão com a fila de mensagens | (none): Error in _create_connection(). Traceback (most recent call last)… | Matching | sergio | 3 | prod, other | 16.3.22, 16.3.24 | 9 | 153 | — sem mudança | ↗ |
| 10 | Acompanhar | Erro de frontend (null/undefined) | FrontException: Navigation cancelled from "/analysis/CBO-1/matching-configs/23… | Front | allcare | 20 | prod, eng-internal, local | 16.3.20, 16.3.22 | 4 | 84 | ▼ 64% | ↗ |
| 11 | Acompanhar | Falha de envio de e-mail | SmtpException: Erro ao enviar e-mail #209625. Service not available, closing… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 8 | 68 | ▼ 31% | ↗ |
| 12 | Sem impacto | Conexão/infra do motor de dados (dev) | (none): Error in _create_connection(). Traceback (most recent call last)… | DataEngine | local-maiglon | 3 | local, other | 16.3.23, 16.4.0 | 0 | 60 | ▼ 33% | ↗ |
| 13 | Acompanhar | Falha ao ler resposta do motor de dados (JSON inválido) | JsonReaderException: DataEngine returned non-parseable JSON on route 'query'… | Back | local | 7 | local, eng-internal, prod | 16.3.22, 16.3.23 | 0 | 50 | — sem mudança | ↗ |
| 14 | Acompanhar | Falha EF/DB (interno) | EntityException: Erro ao executar tarefa de polling. The underlying provider… | Back | dattos-prod.titulo.net | 3 | prod, dev | 15.4.4, 16.4.0 | 31 | 39 | ▼ 51% | ↗ |
| 15 | Acompanhar | Falha EF/DB | EntityCommandExecutionException: An error occurred while executing the… | Back | sergio | 16 | prod, eng-internal, local | 15.4.11, 16.3.22 | 7 | 38 | ▼ 40% | ↗ |
| 16 | Acompanhar | Erro de validação (importação/e-mail) | ArgumentException: Erro ao enviar e-mail #209514. Destinatário do e-mail não… | Back | dattos (BTG) | 4 | prod, local, hom | 15.4.11, 15.4.15 | 1 | 37 | ▼ 24% | ↗ |
| 17 | Acompanhar | Arquivo/pasta de importação ausente (SFTP) | DirectoryNotFoundException: Could not find a part of the path… | Back | ccr | 1 | prod | 16.3.22 | 9 | 30 | — sem mudança | ↗ |
| 18 | Acompanhar | Erro de negócio (e-mail já processado) | BusinessException: Erro ao chamar o agent de SQL completion. O código de… | Back | dattos (BTG) | 8 | prod, hom | 15.4.11, 15.4.15 | 6 | 26 | ▼ 47% | ↗ |
| 19 | Acompanhar | Erro de código (referência nula) | NullReferenceException: Error refreshing sample from step ID 39. Referência… | Back | sergio | 4 | prod | 15.4.11, 16.3.22 | 8 | 16 | ▼ 43% | ↗ |
| 20 | Sem impacto | Permissão de pasta (validação) | AuthorizationException: A pasta atual não é válida de acordo com as pastas… | Back | eng-hotfix | 3 | eng-internal, prod | 16.3.22, 16.3.24 | 0 | 16 | ▼ 47% | ↗ |
| 21 | Acompanhar | Arquivo ausente no storage | FileNotFoundException: File not found on storage Ttl. Details: FileName… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 1 | 11 | ▼ 21% | ↗ |
| 22 | Acompanhar | Falha transitória de importação (banco) | NpgsqlException: Erro durante importação ID 2458900 Exception while reading… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 5 | 10 | — sem mudança | ↗ |
| 23 | Acompanhar | Erro de banco na importação (overflow) | PostgresException: Erro durante importação ID 2458237 22003: integer out of… | Back | dattos (BTG) | 1 | prod | 15.4.11 | 0 | 8 | — sem mudança | ↗ |
| 24 | Acompanhar | Acesso negado a arquivo (SFTP) | UnauthorizedAccessException: Access to the path… | Back | ipiranga | 2 | prod, hom | 15.4.15, 16.3.22 | 1 | 5 | — sem mudança | ↗ |
| 25 | Acompanhar | Erro de código (parâmetro nulo) | ArgumentNullException: Failed to process the job '298259': an exception… | Back | eng-release-fix | 2 | eng-internal, prod | 16.3.22, 16.4.0 | 0 | 5 | ▼ 77% | ↗ |
| 26 | Acompanhar | Erro de código (índice fora do limite) | IndexOutOfRangeException: O índice estava fora dos limites da matriz. O… | Back | mbenz | 1 | prod | 16.3.22 | 0 | 4 | ▼ 73% | ↗ |
| 27 | Acompanhar | Falha em tarefa agendada (reflexão) | TargetInvocationException: Failed to execute polling task. Uma exceção foi… | Back | sergio | 1 | prod | 16.4.0 | 0 | 3 | ▼ 70% | ↗ |