QA Telemetry · 2026-07-04 09:08

Janela 24h/72h · Ambientes afetados 45/152 · bruto 24h 1.945 · 72h 7.518 · 125 queries · anterior 2026-07-03 09:03 (1d atrás) · snapshot 09:08 · copiar versão Slack/Jira ↗

🔴 7 pedem ação · 4 crescendo
🔴7 problemas pedindo ação, 4 crescendo. Comece por: SqlException: Failed to process the job '2020': An object or column….
Precisa de ação
253 ▼ 86% caindo
7 problemas
◆ novo nesta leitura · estimativa
pico 750 · 15 snapshots
Acompanhar
1.380 ▲ 22% subindo
24 problemas
Sem impacto
314 ▲ 140% subindo
dev / infra
Clientes afetados
27 — estável
de 152

📈 Tendência — ~7 dias · está piorando ou melhorando?

01.5503.09925/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros30/06 08h: 1.559 erros01/07 08h: 1.705 erros02/07 08h: 2.506 erros03/07 09h: 3.099 erros04/07 09h: 1.947 erros25/0626/0628/0629/0602/0704/07
Último snapshot: 253 erros que pedem ação, 1.380 para acompanhar, 314 sem impacto.
Precisa de açãoAcompanharSem impacto
📅 desde 25/06 08h · 15 leituras (uma a cada ~12h) · eixo Y = erros/24h
ver linha do tempo detalhada — data e hora de cada leitura
01.5503.09925/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros30/06 08h: 1.559 erros01/07 08h: 1.705 erros02/07 08h: 2.506 erros03/07 09h: 3.099 erros04/07 09h: 1.947 erros25/06 08h25/06 14h26/06 09h26/06 14h27/06 12h27/06 14h28/06 10h28/06 14h29/06 08h29/06 14h30/06 08h01/07 08h02/07 08h03/07 09h04/07 09h

🧩 Saúde por módulo — qual área dói mais (24h)

🔥 Integrações · Storage/SFTP média
248/24h
Persistência · Banco da plataforma (SQL Server) alta
142/24h
Conciliação · Casamento de transações baixa
236/24h
ver mais 7 módulos
Frontend · Tela/UI média
63/24h
Notificação · E-mail alta
35/24h
Plataforma · Mensageria (Rabbit) média
467/24h
Processos · Execução de fluxo média
401/24h
ETL · Carga de Análise (ETL) média
11/24h
Analytics · Análise alta
2/24h
Módulo derivado da assinatura do erro (regra auditável; passe o mouse pra ver). alta namespace específico · média wrapper/texto · baixa só origem. Ordenado por severidade; a barra mede volume.
🎯 Resolver primeiro — o que consertar agora, por prioridade: versão nova → crescendo → vários ambientes → volume
SqlException: Failed to process the job '2020': An object or column…ESCALANDO ·?🔬 investigar🌙 Pico de logs às 19h · fora do expediente— sem mudançacrônico (visto em 15 de 15 snapshots)
77/24h351 · 72h
Módulo Persistência · Banco da plataforma (SQL Server) · origem Back · 16 clientes (agibank, dattos (BTG), allcare, +2) · constante · vs ontem ▼41% caindo · vs ~7d ▲97% subindo · apareceu pela 1ª vez há 9 dias
priorizado por: crescendo agora
versão16.3.9 · 60% (+7)
O job da análise falha silenciosamente; o resultado pode não aparecer para o usuário.
ver diagnóstico
🧭 Onde aconteceAcontece no processamento em segundo plano (jobs), em consultas ao banco da plataforma.
👁 O que o cliente vêO job da análise falha silenciosamente; o resultado pode não aparecer para o usuário.
🤔 Causa provávelErro de SQL com nome de objeto/coluna inválido ao montar a consulta — provável esquema divergente entre o que o código espera e a tabela real de staging. confiança média
0h–1h · 6 erros · 7% do dia1h–2h · 4 erros · 5% do dia2h–3h · 1 erro · 1% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 11 erros · 13% do dia · horário comercial10h–11h · 3 erros · 4% do dia · horário comercial11h–12h · 9 erros · 11% do dia · horário comercial12h–13h · 10 erros · 12% do dia · horário comercial13h–14h · 3 erros · 4% do dia · horário comercial14h–15h · 5 erros · 6% do dia · horário comercial15h–16h · 1 erro · 1% do dia · horário comercial16h–17h · 3 erros · 4% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 8 erros · 10% do dia19h–20h · 14 erros · 17% do dia · pico20h–21h · 5 erros · 6% do dia21h–22h · 1 erro · 1% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre fora do horário comercial, com pico por volta das 19h — provável tarefa agendada, deploy ou infraestrutura, sem cliente na ponta.
🧵 traceId: d382a587-4f7b-4c7e-94d… ↗ · bece04d7-57d8-4b35-bb3… ↗ · 962a286e-62de-4f2a-a50… ↗
↳ at Dattos.Platform.Data.Extensions.DbCommandExtensions.<SafeExecuteScalarAsync>d__16.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_release\Dattos.Platform.Data\Extensions
FrontException: Cannot read properties of undefined (reading 'map')…ESCALANDO ·?♻️ refatorar🕘 Pico de logs às 16h— sem mudançacrônico (visto em 15 de 15 snapshots)
63/24h252 · 72h
Módulo Frontend · Tela/UI · origem Front · 31 clientes (allcare, vwfs, tbmtextil, +2) · constante · vs ontem ▼35% caindo · vs ~7d ▲152% subindo · apareceu pela 1ª vez há 9 dias
priorizado por: crescendo agora
versão16.3.25 · 70% (+5)
Parte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
ver diagnóstico
🧭 Onde aconteceAcontece na interface, ao montar telas com dados ainda não carregados (ex.: filtros de etapa).
👁 O que o cliente vêParte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
🤔 Causa provávelErro de JavaScript "Cannot read properties of undefined (reading map)" no carregamento do filtro de etapa (StepFormFilter), espalhado por mais de 30 clientes. Provável dado assíncrono não tratado no componente. Confirme no Loki. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 2 erros · 3% do dia · horário comercial10h–11h · 2 erros · 3% do dia · horário comercial11h–12h · 15 erros · 23% do dia · horário comercial12h–13h · 6 erros · 9% do dia · horário comercial13h–14h · 14 erros · 22% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 5 erros · 8% do dia · horário comercial16h–17h · 17 erros · 26% do dia · pico17h–18h · 3 erros · 5% do dia · horário comercial18h–19h · 1 erro · 2% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 16h — provável impacto real de cliente.
FileNotFoundException: File not found on storage Ttl. Details…ESCALANDO ·?🌐 config externa🕘 Pico de logs às 16h— sem mudançacrônico (visto em 15 de 15 snapshots)
13/24h45 · 72h
Módulo Integrações · Storage/SFTP · origem Back · Concentrado em 1 cliente: dattos (BTG) (62% dos casos) · constante · vs ontem ▼7% caindo · vs ~7d ▲160% subindo · apareceu pela 1ª vez há 9 dias
priorizado por: crescendo agora
versão15.4.11 · 62% (+1)
O arquivo esperado não é processado; a importação daquele item falha.
ver diagnóstico
🧭 Onde aconteceAcontece na importação, ao buscar um arquivo já referenciado no armazenamento.
👁 O que o cliente vêO arquivo esperado não é processado; a importação daquele item falha.
🤔 Causa provávelO arquivo foi referenciado mas não está no armazenamento — pode ter sido removido, expirado, ou gravado em caminho diferente. Concentra num cliente. Confirme no Loki. confiança média
📋 Regras do móduloimport-business-rules.md ↗ — leia as regras de negócio de Integrações pra confirmar qual se aplica
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 1 erro · 7% do dia9h–10h · 0 erros · 0% do dia · horário comercial10h–11h · 0 erros · 0% do dia · horário comercial11h–12h · 3 erros · 21% do dia · horário comercial12h–13h · 1 erro · 7% do dia · horário comercial13h–14h · 0 erros · 0% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 3 erros · 21% do dia · horário comercial16h–17h · 4 erros · 29% do dia · pico17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 0 erros · 0% do dia19h–20h · 0 erros · 0% do dia20h–21h · 2 erros · 14% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 16h — provável impacto real de cliente.
🧵 traceId: f7e80b1d-9f79-478c-bb5… ↗ · 2b80a74c-4c0c-458b-9ed… ↗
↳ at Dattos.Platform.IO.FileStorage.<OpenReadAsync>d__7.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.IO\FileStorage.cs:line 104

+ 4 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).

📊 Gráficos — toda a análise visual num lugar só. Tudo derivado dos snapshots gravados, mesma régua da Triagem.
🎯 O que atacar — impacto — quem dói, em quem, e quantos itens pedem ação

🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 467) · cor = balde de ação

467/24h
👤 mais impactado: gaspar · 50% · espalhado por 18 ambientes
314/24h
👤 mais impactado: NoWebsite · 100% das ocorrências · v16.4.0
289/24h
👤 mais impactado: bayer · 35% · espalhado por 50 ambientes
215/24h
👤 mais impactado: qualicorp · 98% · espalhado por 4 ambientes
168/24h
👤 mais impactado: dattos-data-engine-query-aws-16-3 · 36% · espalhado por 7 ambientes
100/24h
👤 mais impactado: allcare · 47% · espalhado por 14 ambientes
77/24h
👤 mais impactado: agibank · 59% · espalhado por 16 ambientes
65/24h
👤 mais impactado: agibank · 38% · espalhado por 7 ambientes
63/24h
👤 mais impactado: allcare · 23% · espalhado por 31 ambientes
58/24h
👤 mais impactado: eng-hotfix · 26% · espalhado por 17 ambientes
Precisa de açãoAcompanharSem impacto
A cabeça da distribuição costuma responder por boa parte da carga acionável; a cor mostra o balde de ação. Cliente e percentual vêm da coluna de ambiente do snapshot. Detalhe por linha na aba Tabela ↗.

📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 1.194)

edenred
1.194/72h
qualicorp
644/72h
bayer
456/72h
agibank
418/72h
dattos (BTG)
400/72h
allcare
361/72h
gaspar
319/72h
vwfs
107/72h
natura
63/72h
conciliadorrm
61/72h
afextyc
50/72h
csf-qa
47/72h
Volume de erros não-ruído por cliente de produção (top 12); a cabeça domina e o resto é cauda longa. Detalhe por cliente na aba Contexto ↗.

🧭 Os 32 itens por classificação — contagem de itens (não de volume)

7 Precisa de ação24 Acompanhar1 Sem impacto
Poucos itens pedem ação; a maioria é monitoramento. Volume ≠ nº de itens — um único item pode somar milhares de ocorrências. Lista completa na aba Tabela ↗.
📈 Tendência no tempo — está piorando ou melhorando, e em que horário

🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%

25/06 08h · 38% ação · 61% acompanhar · 1% sem impacto25/06 14h · 36% ação · 64% acompanhar · 0% sem impacto26/06 09h · 44% ação · 55% acompanhar · 1% sem impacto26/06 14h · 44% ação · 55% acompanhar · 1% sem impacto27/06 12h · 26% ação · 66% acompanhar · 9% sem impacto27/06 14h · 19% ação · 66% acompanhar · 15% sem impacto28/06 10h · 34% ação · 38% acompanhar · 28% sem impacto28/06 14h · 46% ação · 29% acompanhar · 24% sem impacto29/06 08h · 0% ação · 98% acompanhar · 2% sem impacto29/06 14h · 34% ação · 63% acompanhar · 3% sem impacto30/06 08h · 29% ação · 71% acompanhar · 0% sem impacto01/07 08h · 35% ação · 64% acompanhar · 0% sem impacto02/07 08h · 48% ação · 52% acompanhar · 1% sem impacto03/07 09h · 59% ação · 36% acompanhar · 4% sem impacto04/07 09h · 13% ação · 71% acompanhar · 16% sem impacto25/06agora
Precisa de açãoAcompanharSem impacto
topo em Precisa de ação: SqlException: Failed to process the… 77/24htopo em Acompanhar: Error: IO Error: Cannot open database… 6/24htopo em Sem impacto: session-init call failed for… 314/24h
Não é o volume (esse está na Tendência, na aba Triagem) — é a mistura: que fração de cada leitura pedia ação. Passe o mouse numa coluna para ver as frações. Os campeões refletem a leitura atual (o topo por balde de leituras passadas não é gravado).

🕘 Ritmo do dia — maior ofensor — SqlException: Failed to process the job… por hora (BRT, 24h)

horário comercial 9–180h–1h · 6 erros · 7% do dia · fora do expediente1h–2h · 4 erros · 5% do dia · fora do expediente2h–3h · 1 erro · 1% do dia · fora do expediente3h–4h · 0 erros · 0% do dia · fora do expediente4h–5h · 0 erros · 0% do dia · fora do expediente5h–6h · 0 erros · 0% do dia · fora do expediente6h–7h · 0 erros · 0% do dia · fora do expediente7h–8h · 0 erros · 0% do dia · fora do expediente8h–9h · 0 erros · 0% do dia · fora do expediente9h–10h · 11 erros · 13% do dia · horário comercial10h–11h · 3 erros · 4% do dia · horário comercial11h–12h · 9 erros · 11% do dia · horário comercial12h–13h · 10 erros · 12% do dia · horário comercial13h–14h · 3 erros · 4% do dia · horário comercial14h–15h · 5 erros · 6% do dia · horário comercial15h–16h · 1 erro · 1% do dia · horário comercial16h–17h · 3 erros · 4% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 8 erros · 10% do dia · fora do expediente19h–20h · 14 erros · 17% do dia · pico20h–21h · 5 erros · 6% do dia · fora do expediente21h–22h · 1 erro · 1% do dia · fora do expediente22h–23h · 0 erros · 0% do dia · fora do expediente23h–24h · 0 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h14
A faixa 9–18h é o horário de operação. Concentração no comercial é assinatura de uso real de cliente (não tarefa agendada); fora dele, costuma ser infra/deploy/agendado. Perfil horário só do maior ofensor deste snapshot.
👀 Acompanhar & frota — o que vigiar e o denominador de risco por versão

🛰 Saúde da frota — 63 clientes por proximidade da versão de produção (16.3.x)

59 na linha (16.3.x)3 atrás1 à frente
É o denominador que normaliza o risco por versão. Os 3 atrás (dattos-prod.titulo.net 15.4.4, dattos (BTG) 15.4.11, dattos-uat (BTG) 15.4.16) podem carregar bug já corrigido. Detalhe por cliente na aba Contexto ↗.
👀 Contexto — acompanhar · ritmo do dia · o que mudou · clientes afetados (investigação secundária)
👀 24 p/ acompanhar · 1 sem impacto housekeeping — não atinge cliente

👀 Acompanhar — ainda não atinge cliente, ou já diminuindo

Error: IO Error: Cannot open database… · Pipeline+Matching · diminuindo6/24h
Error in _create_connection(). RabbitMQ… · Pipeline · crescendo467/24h
InvalidOperationException: Failed to process… · Back · recorrente, sem crescer289/24h
Exception in ASGI application + Exception… · Query · diminuindo168/24h
NpgsqlException: Erro durante importação ID… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico2/24h
OperationCanceledException: Erro ao realizar… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico1/24h
XmlException: Erro durante importação ID… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico0/24h
Failed to process the job '723758'… · Back · recorrente, sem crescer215/24h
DirectoryNotFoundException: Could not find a… · Back · recorrente, sem crescer12/24h
HttpException: The remote host closed the… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico1/24h
SmtpException: Erro ao enviar e-mail #212199… · Back · recorrente, sem crescer25/24h
IOException: The process cannot access the… · Back · crescendo · ⚠ só temos o número, sem diagnóstico2/24h
UnauthorizedAccessException: Access to the… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico1/24h
BackgroundJobClientException: Failed to… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
Error: IO Error: No files found that match… · Matching · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
Passa para Precisa de ação se voltar a crescer e atingir 3 ou mais ambientes.

🩹 Ruído — o que vale consertar na fonte

Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 1.945 erros).

session-init call failed for user=postgres… · Dattos-Gateway · infraestrutura sem cliente
314/24h · 16%
consertar a fonte · 👤 sem dono · definir
Consertando o maior (session-init call failed for…): o painel de 24h cairia de 1.945 para ~1.631.
🕘 Pico de erros às 18h uso real (9–18) vs infra/agendado

Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).

horário comercial 9–180h–1h · 6 erros · 0% do dia · fora do expediente1h–2h · 5 erros · 0% do dia · fora do expediente2h–3h · 1 erro · 0% do dia · fora do expediente3h–4h · 0 erros · 0% do dia · fora do expediente4h–5h · 0 erros · 0% do dia · fora do expediente5h–6h · 0 erros · 0% do dia · fora do expediente6h–7h · 0 erros · 0% do dia · fora do expediente7h–8h · 2 erros · 0% do dia · fora do expediente8h–9h · 2 erros · 0% do dia · fora do expediente9h–10h · 53 erros · 3% do dia · horário comercial10h–11h · 38 erros · 2% do dia · horário comercial11h–12h · 143 erros · 9% do dia · horário comercial12h–13h · 80 erros · 5% do dia · horário comercial13h–14h · 57 erros · 3% do dia · horário comercial14h–15h · 40 erros · 2% do dia · horário comercial15h–16h · 117 erros · 7% do dia · horário comercial16h–17h · 333 erros · 20% do dia · horário comercial17h–18h · 74 erros · 4% do dia · horário comercial18h–19h · 569 erros · 34% do dia · pico19h–20h · 76 erros · 5% do dia · fora do expediente20h–21h · 55 erros · 3% do dia · fora do expediente21h–22h · 11 erros · 1% do dia · fora do expediente22h–23h · 4 erros · 0% do dia · fora do expediente23h–24h · 6 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h569
🔁 0 novos · 1 pararam vs 2026-07-03 09:03 · 1d atrás
⊕ Novos ou que voltaram

Nenhum grupo novo.

👥 27 clientes atingidos · 10 em 3+ ambientes quem e onde

🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)

"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).

🏷 Risco por versão taxa por cliente

Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.

VersãoLinhagemErros (não-ruído)ClientesTaxa/cliente
16.4.116.4.x2
16.4.016.4.x8201820 amostra fraca
16.3.2716.3.x4
16.3.2616.3.x7751775 amostra fraca
16.3.2516.3.x4.4775581.4
16.3.2416.3.x1251125 amostra fraca
16.3.2216.3.x23123 amostra fraca
16.3.916.3.x4261426 amostra fraca
15.4.1615.4.x34134 amostra fraca
15.4.1115.4.x4001400 amostra fraca
15.4.415.4.x17117 amostra fraca
📦 Carga por cliente (volume) top por volume

Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (79 de 152 ambientes afetados em 72h). Internos e máquinas de dev fora.

edenred
1.194/72h
qualicorp
644/72h
bayer
456/72h
agibank
418/72h
dattos (BTG)
400/72h
allcare
361/72h
gaspar
319/72h
vwfs
107/72h
natura
63/72h
conciliadorrm
61/72h
afextyc
50/72h
csf-qa
47/72h
🛰 Frota — versão por cliente 63 clientes

Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.

16.4.0
1 cliente
16.3.26 ★
1 cliente
16.3.25 ★
55 clientes
16.3.24 ★
1 cliente
16.3.22 ★
1 cliente
16.3.9 ★
1 cliente
15.4.16
1 cliente
15.4.11
1 cliente
15.4.4
1 cliente
★ = versão de produção mais comum (16.3.x)atrásna linhaà frente
ver por cliente (63)
ClienteVersão dominanteTambém vistaAtraso?
dattos-prod.titulo.net15.4.4⚠ versão antiga
dattos (BTG)15.4.11⚠ versão antiga
dattos-uat (BTG)15.4.16⚠ versão antiga
agibank16.3.9✓ atual
ifoodcorp16.3.22✓ atual
vwfs16.3.2416.3.27 · 16.3.25✓ atual
123milhas16.3.25✓ atual
abc16.3.25✓ atual
ache16.3.25✓ atual
afextyc16.3.25✓ atual
allcare16.3.2516.3.26✓ atual
atlas16.3.25✓ atual
bayer16.3.25✓ atual
brpartners16.3.25✓ atual
bs216.3.25✓ atual
cbmm16.3.25✓ atual
ccab-agro16.3.25✓ atual
ccr16.3.25✓ atual
cea16.3.25✓ atual
cervejariacidadeimperial16.3.25✓ atual
cmpc16.3.25✓ atual
cofco16.3.25✓ atual
comercialzaffari16.3.25✓ atual
conciliadorrm16.3.2516.3.26✓ atual
csf-qa16.3.25✓ atual
edenred16.3.25✓ atual
fiap16.3.25✓ atual
flagship16.3.25✓ atual
granado16.3.25✓ atual
grupoepr16.3.2516.3.26✓ atual
holambracoop16.3.25✓ atual
hsl16.3.25✓ atual
ipiranga16.3.25✓ atual
isacteep16.3.2516.3.26✓ atual
kryptonbpo16.3.25✓ atual
laponia16.3.25✓ atual
martins16.3.25✓ atual
mbenz16.3.25✓ atual
natura16.3.25✓ atual
omnicom16.3.25✓ atual
operafidc16.3.25✓ atual
orizon16.3.25✓ atual
pirelli_csa16.3.25✓ atual
protege16.3.25✓ atual
pucrs16.3.25✓ atual
qualicorp16.3.2516.3.26✓ atual
redeamericas16.3.25✓ atual
remessaonline16.3.25✓ atual
sales16.3.25✓ atual
sementesprodutiva16.3.25✓ atual
simpaul16.3.25✓ atual
solinftec16.3.2516.3.27✓ atual
stellantis16.3.25✓ atual
tbmtextil16.3.25✓ atual
travelex16.3.25✓ atual
uniasselvi16.3.25✓ atual
unimedprudente16.3.25✓ atual
valid16.3.2516.3.26✓ atual
yamaha16.3.25✓ atual
zaffari16.3.25✓ atual
zortea16.3.25✓ atual
gaspar16.3.2616.3.25✓ atual
financeiro16.4.0↑ pré-lançamento
🗂 32 grupos · fonte de investigação — ordenada por volume 72h · filtrável por origem

Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.

#ClassificaçãoTipo de erroErroSistemaCliente principalNº amb.AmbientesVersões24h72hTendência
1Acompanhar Falha no serviço de Consulta (motor de dados)Exception in ASGI application + Exception Group Traceback (most recent call…Querydattos-data-engine-query-aws-16-37other, eng-internal16.3.25, 16.3.261681.398▼ 26%
2AcompanharExecução de fluxo pulada porque o fluxo estava parado (Stopped)InvalidOperationException: Failed to process the job '10431494': an exception…Backbayer50prod, eng-internal, local, demo, other, hom, dev15.4.11, 15.4.162891.253— sem mudança
3AcompanharErro de código (parâmetro nulo)ArgumentNullException: Value cannot be null. Parameter name: entity Value…Backedenred8prod, eng-internal16.3.24, 16.3.2521.034— sem mudança
4AcompanharFalha de storage externo (confirmação de status de arquivo)Failed to process the job '723758': [SetFileStatusAsync] storage externo…Backqualicorp4prod16.3.25215646— sem mudança
5AcompanharFalha de conexão do pipeline com o servidor de mensagens (RabbitMQ/callback)Error in _create_connection(). RabbitMQ blocking_connection (pika) falhou +…Pipelinegaspar18prod, other, eng-internal, local, demo16.3.25, 16.3.26467622▲ 242%
6Sem impactoGateway/serviço novo falhandosession-init call failed for user=postgres host= Traceback (most recent call…Dattos-GatewayNoWebsite1other16.4.0, 16.4.1314458▲ 201%
7Precisa de açãoErro de banco/SQL (conciliação — coluna/alias vazio)SqlException: Failed to process the job '2020': An object or column name is…Backagibank16prod, hom, other, local15.4.11, 15.4.1677351— sem mudança
8Precisa de ação Conciliação: tabela de resultado ausente na consulta (regressão)HttpRequestException: Catalog Error: Table with name matching_434352505852…Backeng-hotfix17eng-internal, prod, local16.3.24, 16.3.2558325— sem mudança
9Precisa de açãoErro de tela (propriedade indefinida no carregamento)FrontException: Cannot read properties of undefined (reading 'map') Cannot…Frontallcare31prod, demo, eng-internal, dev15.4.4, 16.3.2463252— sem mudança
10Precisa de açãoErro de validação (e-mail sem destinatário)ArgumentException: Erro ao enviar e-mail #212147. Destinatário do e-mail não…Backeng-release-fix8eng-internal, prod, local15.4.11, 16.3.2510208— sem mudança
11AcompanharFalha ao ler/gravar no banco (EF/DB)EntityCommandExecutionException: Failed to process the job '10432337': an…Backallcare14prod, eng-internal15.4.11, 16.3.24100175▲ 84%
12Precisa de açãoRegra de negócio: storage não encontrado / permissão / agente de IABusinessException: Failed to process the job '309602': an exception occurred…Backeng-release-fix15eng-internal, prod, other, dev15.4.11, 16.3.2422149— sem mudança
13Precisa de ação Erro de código (referência nula) — etapa de conciliaçãoNullReferenceException: Object reference not set to an instance of an object…Backallcare11prod, eng-internal, local15.4.11, 16.3.2410120— sem mudança
14AcompanharFalha EF/DB (tarefa de polling)EntityException: Erro ao executar tarefa de polling. An exception has been…Backagibank7prod, hom15.4.16, 16.3.2465107▲ 73%
15AcompanharFalha de envio de e-mail (limite do servidor)SmtpException: Erro ao enviar e-mail #212199. Service not available, closing…Backdattos (BTG)2prod15.4.11, 16.3.222591— sem mudança
16AcompanharResposta inválida do motor de dados (503)JsonReaderException: DataEngine returned non-parseable JSON on route…Backeng-hotfix6eng-internal, prod, local16.3.25, 16.3.26378— sem mudança
17Acompanhar Conciliação: base temporária aberta em modo somente-leitura (DuckDB)Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"…Pipeline+Matchingeng-hotfix8eng-internal, prod16.3.25, 16.3.26653— sem mudança
18AcompanharFalha ao confirmar arquivo no armazenamento (tempo esgotado)TaskCanceledException: [SetFileStatusAsync] Failed to set file status for…Backcsf-qa2prod16.3.251751▲ 42%
19Precisa de açãoArquivo de importação ausente no armazenamentoFileNotFoundException: File not found on storage Ttl. Details: FileName…Backdattos (BTG)4prod15.4.11, 16.3.251345— sem mudança
20AcompanharPasta de importação (SFTP) não encontradaDirectoryNotFoundException: Could not find a part of the path…Backccr3prod, hom15.4.11, 15.4.161240— sem mudança
21Acompanhar OutOfMemoryException — leitura de CSV grande (Back)OutOfMemoryException: Erro durante importação ID 2491245 Array dimensions…Backdattos (BTG)1prod15.4.11135— sem mudança
22AcompanharPermissão negada (configurar processo / pasta)AuthorizationException: Você não tem permissão para configurar um Processo…Backeng-release-fix3eng-internal, local, prod16.3.25, 16.4.0219▼ 30%
23Acompanhar OracleException (fonte externa do cliente)OracleException: Erro durante importação ID 154576 ORA-03113: end-of-file on…Backdattos (BTG)2prod15.4.11, 15.4.4112— sem mudança
24AcompanharHttpException — conexão remota encerrada (Back)HttpException: The remote host closed the connection. The error code is…Backuniasselvi3prod16.3.24, 16.3.2516▼ 45%
25Acompanhar Falha transitória de importação (banco)NpgsqlException: Erro durante importação ID 2491313 The operation has timed…Backdattos (BTG)1prod15.4.1126▼ 33%
26Acompanhar OperationCanceledException (Back)OperationCanceledException: Erro ao realizar cancelamento da importação…Backdattos (BTG)1prod15.4.1116— sem mudança
27AcompanharIOException — arquivo em uso (Back)IOException: The process cannot access the file…Backdattos (BTG)1prod15.4.1124▼ 60%
28AcompanharBackgroundJobClientException (Back)BackgroundJobClientException: Failed to execute job ISendEmailJob. Background…Backcervejariacidadeimperial2prod16.3.24, 16.3.2504— sem mudança
29AcompanharErros sem classe (Matching)Error: IO Error: No files found that match the pattern…Matchingeng-release-fix2eng-internal, prod16.3.25, 16.4.004— sem mudança
30AcompanharUnauthorizedAccessException (Back)UnauthorizedAccessException: Access to the path…Backipiranga1prod16.3.2513▼ 40%
31AcompanharTimeoutException — trava de execução (Back)TimeoutException: Semaphore ExecutionWorkflow timed out. Trace: at…Backdattos (BTG)1prod15.4.1103— sem mudança
32Acompanhar XmlException — XML inválido na importação (Back)XmlException: Erro durante importação ID 2486125 Name cannot begin with the…Backdattos (BTG)1prod15.4.1103▼ 25%
❓ Ajuda — como ler este painel · seções que ligam quando a coleta acumular dado
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
  • Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
  • Acompanhar ainda não atinge cliente, ou já está diminuindo.
  • Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
  • Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.

"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.

Símbolos
  • 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
  • 🔗 N incidente consolidado de N erros da mesma raiz.
  • 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
  • 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
  • em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
  • NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor

vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.

⏱ Horizonte: comparações cobrem ~7 dias (14 snapshots de 12/12h); não há base "vs semana/mês passado" nem horário exato de última ocorrência. 🏷 Tipo de erro é classificado por IA (pode errar — confirme no Loki). Contagens podem ser piso quando a consulta satura.