QA Telemetry · 2026-06-24 09:22

Janela 24h/72h · Ambientes afetados 65/151 · bruto 24h 2.384 · 72h 6.633 · 79 queries · anterior 2026-06-23 08:38 (1d atrás) · snapshot 09:22 · copiar versão Slack/Jira ↗

🔴 13 pedem ação · 12 crescendo
🔴13 problemas pedindo ação, 12 crescendo · 4 pode ter surgido numa versão recente. Comece por: FrontException: Cannot read properties of undefined (reading….
Precisa de ação
1.131 — estável
13 problemas
◆ novo nesta leitura · estimativa
pico 2.439 · 15 snapshots
Acompanhar
1.243 ▼ 45% caindo
16 problemas
Sem impacto
7 ▼ 50% caindo
dev / infra
Clientes afetados
39 ▲ 18% subindo
de 151

📈 Tendência — ~7 dias · está piorando ou melhorando?

01.6933.38518/06 15h: 2.726 erros18/06 16h: 3.007 erros19/06 08h: 3.284 erros19/06 14h: 2.329 erros19/06 15h: 2.615 erros20/06 15h: 1.229 erros21/06 14h: 495 erros21/06 19h: 609 erros21/06 20h: 600 erros21/06 23h: 690 erros22/06 08h: 804 erros22/06 11h: 2.066 erros22/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros18/0619/0621/0621/0622/0624/06
Último snapshot: 1.131 erros que pedem ação, 1.243 para acompanhar, 7 sem impacto.
Precisa de açãoAcompanharSem impacto
📅 desde 18/06 15h · 15 leituras (uma a cada ~12h) · eixo Y = erros/24h
ver linha do tempo detalhada — data e hora de cada leitura
01.6933.38518/06 15h: 2.726 erros18/06 16h: 3.007 erros19/06 08h: 3.284 erros19/06 14h: 2.329 erros19/06 15h: 2.615 erros20/06 15h: 1.229 erros21/06 14h: 495 erros21/06 19h: 609 erros21/06 20h: 600 erros21/06 23h: 690 erros22/06 08h: 804 erros22/06 11h: 2.066 erros22/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros18/06 15h18/06 16h19/06 08h19/06 14h19/06 15h20/06 15h21/06 14h21/06 19h21/06 20h21/06 23h22/06 08h22/06 11h22/06 16h23/06 08h24/06 09h

🧩 Saúde por módulo — qual área dói mais (24h)

🔥 Plataforma · Mensageria (Rabbit) média
270/24h
Frontend · Tela/UI média
169/24h
Analytics · Análise alta
12/24h
ver mais 6 módulos
Processos · Execução de fluxo média
482/24h
Integrações · Storage/SFTP média
88/24h
Notificação · E-mail alta
43/24h
ETL · Importação alta
35/24h
Conciliação · Casamento de transações baixa
861/24h
Módulo derivado da assinatura do erro (regra auditável; passe o mouse pra ver). alta namespace específico · média wrapper/texto · baixa só origem. Ordenado por severidade; a barra mede volume.
🎯 Resolver primeiro — o que consertar agora, por prioridade: versão nova → crescendo → vários ambientes → volume
FrontException: Cannot read properties of undefined (reading…ESCALANDO ·?🔍 v16.3.9? (possível regressão da versão recente — a confirmar)♻️ refatorar🕘 Pico de logs às 10h▲ 303% subindocrônico (visto em 15 de 15 snapshots)
169/24h246 · 72h
Módulo Frontend · Tela/UI · origem Front · 30 clientes (edenred, zaffari, volks, +3) · em alta · vs ontem ▲202% subindo · vs ~7d ▲8% subindo · apareceu pela 1ª vez há 5 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.24 · 61% (+3)
A tela quebra ou um trecho não renderiza; o usuário vê erro ou área em branco.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.9 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece no carregamento de telas do frontend, com destaque para o componente de controle de licença.
👁 O que o cliente vêA tela quebra ou um trecho não renderiza; o usuário vê erro ou área em branco.
🤔 Causa provávelO código do frontend lê uma propriedade de um objeto indefinido (ex.: currentSizeGB no controle de licença); há também casos de função não definida (toastError) e de limite de licença atingido. Provável dado ausente na resposta ou regressão de componente. Confirme no Loki. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 1 erro · 1% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 3 erros · 2% do dia9h–10h · 8 erros · 4% do dia · horário comercial10h–11h · 38 erros · 20% do dia · pico11h–12h · 20 erros · 11% do dia · horário comercial12h–13h · 27 erros · 14% do dia · horário comercial13h–14h · 9 erros · 5% do dia · horário comercial14h–15h · 7 erros · 4% do dia · horário comercial15h–16h · 25 erros · 13% do dia · horário comercial16h–17h · 31 erros · 16% do dia · horário comercial17h–18h · 10 erros · 5% do dia · horário comercial18h–19h · 9 erros · 5% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 10h — provável impacto real de cliente.
Error in _create_connection(). Traceback (most recent call last)…CRÔNICO🔍 v16.3.10? (possível regressão da versão recente — a confirmar)🔬 investigar🌙 Pico de logs às 4h · fora do expediente▲ 25% subindocrônico (visto em 8 de 15 snapshots)
108/24h414 · 72h
Módulo Plataforma · Mensageria (Rabbit) · origem Pipeline · 18 clientes (edenred, cea, gaspar) · constante · vs ontem ▼62% caindo · apareceu pela 1ª vez há 2 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.4.0 · 87% (+2)
A preparação da análise falha ou para no meio; o dado não fica pronto para conciliar.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.10 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece na preparação de dados (ETL), quando uma etapa procura a tabela gerada pela etapa anterior.
👁 O que o cliente vêA preparação da análise falha ou para no meio; o dado não fica pronto para conciliar.
🤔 Causa provávelA tabela intermediária esperada não existe quando a próxima etapa roda — possível corrida entre criar e ler a área temporária — somada a perda de conexão ao banco por tempo esgotado e arquivos de formato não detectado. Confirme no Loki. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 1 erro · 1% do dia2h–3h · 0 erros · 0% do dia3h–4h · 4 erros · 4% do dia4h–5h · 17 erros · 16% do dia · pico5h–6h · 1 erro · 1% do dia6h–7h · 2 erros · 2% do dia7h–8h · 14 erros · 13% do dia8h–9h · 10 erros · 9% do dia9h–10h · 14 erros · 13% do dia · horário comercial10h–11h · 9 erros · 8% do dia · horário comercial11h–12h · 5 erros · 5% do dia · horário comercial12h–13h · 10 erros · 9% do dia · horário comercial13h–14h · 0 erros · 0% do dia · horário comercial14h–15h · 1 erro · 1% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 5 erros · 5% do dia19h–20h · 11 erros · 10% do dia20h–21h · 3 erros · 3% do dia21h–22h · 1 erro · 1% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre fora do horário comercial, com pico por volta das 4h — provável tarefa agendada, deploy ou infraestrutura, sem cliente na ponta.
↳ File "/usr/local/lib/python3.13/site-packages/pika/adapters/blocking_connection.py", line 451, in _create_connection
Unexpected connection close detected: StreamLostError: ("Stream…NOVO🔍 v16.4.0? (possível regressão da versão recente — a confirmar)⚠ capacidade🔧 infra🌙 Pico de logs às 2h · fora do expedientenovo subindo
85/24h85 · 72h
Módulo Plataforma · Mensageria (Rabbit) · origem DataEngine · 1 cliente · em alta · apareceu pela 1ª vez novo hoje
priorizado por: suspeita de versão recente (hipótese)
versão16.4.0 · 100%
Em geral sem efeito visível imediato — a operação é repetida; se persistir, pode atrasar consultas e conciliações.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.4.0 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece na comunicação interna entre serviços, quando o motor de dados perde a conexão com a fila de mensagens.
👁 O que o cliente vêEm geral sem efeito visível imediato — a operação é repetida; se persistir, pode atrasar consultas e conciliações.
🤔 Causa provávelQueda de conexão de rede/mensageria (StreamLost / ConnectionAborted 10053) no motor de dados, concentrada em ambiente interno (sem cliente). Parece instabilidade de infraestrutura, não erro de dado. Confirme no Loki. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 42 erros · 49% do dia · pico3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 6 erros · 7% do dia9h–10h · 15 erros · 18% do dia · horário comercial10h–11h · 0 erros · 0% do dia · horário comercial11h–12h · 0 erros · 0% do dia · horário comercial12h–13h · 0 erros · 0% do dia · horário comercial13h–14h · 0 erros · 0% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 0 erros · 0% do dia19h–20h · 22 erros · 26% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre fora do horário comercial, com pico por volta das 2h — provável tarefa agendada, deploy ou infraestrutura, sem cliente na ponta.

+ 10 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).

📊 Gráficos — toda a análise visual num lugar só. Tudo derivado dos snapshots gravados, mesma régua da Triagem.
🎯 O que atacar — impacto — quem dói, em quem, e quantos itens pedem ação

🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 667) · cor = balde de ação

667/24h
👤 mais impactado: dattos-data-engine-query-aws-16-3 · 69% · espalhado por 8 ambientes
338/24h
👤 mais impactado: homolog · 21% · espalhado por 45 ambientes
196/24h
👤 mais impactado: qualicorp · 99% · espalhado por 3 ambientes
194/24h
👤 mais impactado: edenred · 33% · espalhado por 20 ambientes
169/24h
👤 mais impactado: edenred · 26% · espalhado por 30 ambientes
154/24h
👤 mais impactado: agibank · 44% · espalhado por 13 ambientes
132/24h
👤 mais impactado: allcare · 45% · espalhado por 17 ambientes
108/24h
👤 mais impactado: NoWebsite · 62% · espalhado por 18 ambientes
85/24h
👤 mais impactado: NoWebsite · 82% das ocorrências · v16.4.0
77/24h
👤 mais impactado: NoWebsite · 81% · espalhado por 4 ambientes
Precisa de açãoAcompanharSem impacto
A cabeça da distribuição costuma responder por boa parte da carga acionável; a cor mostra o balde de ação. Cliente e percentual vêm da coluna de ambiente do snapshot. Detalhe por linha na aba Tabela ↗.

📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 2.000)

qualicorp
2.000/72h
agibank
288/72h
edenred
265/72h
dattos (BTG)
255/72h
csf-qa
220/72h
allcare
168/72h
fujifilm
72/72h
yamaha
67/72h
natura
63/72h
kryptonbpo
49/72h
zaffari
48/72h
bayer
40/72h
Volume de erros não-ruído por cliente de produção (top 12); a cabeça domina e o resto é cauda longa. Detalhe por cliente na aba Contexto ↗.

🧭 Os 31 itens por classificação — contagem de itens (não de volume)

13 Precisa de ação16 Acompanhar2 Sem impacto
Poucos itens pedem ação; a maioria é monitoramento. Volume ≠ nº de itens — um único item pode somar milhares de ocorrências. Lista completa na aba Tabela ↗.
📈 Tendência no tempo — está piorando ou melhorando, e em que horário

🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%

18/06 15h · 74% ação · 10% acompanhar · 16% sem impacto18/06 16h · 80% ação · 6% acompanhar · 15% sem impacto19/06 08h · 75% ação · 8% acompanhar · 17% sem impacto19/06 14h · 66% ação · 19% acompanhar · 15% sem impacto19/06 15h · 71% ação · 17% acompanhar · 12% sem impacto20/06 15h · 80% ação · 10% acompanhar · 9% sem impacto21/06 14h · 52% ação · 47% acompanhar · 1% sem impacto21/06 19h · 40% ação · 35% acompanhar · 24% sem impacto21/06 20h · 64% ação · 12% acompanhar · 24% sem impacto21/06 23h · 36% ação · 44% acompanhar · 20% sem impacto22/06 08h · 71% ação · 16% acompanhar · 13% sem impacto22/06 11h · 83% ação · 12% acompanhar · 5% sem impacto22/06 16h · 78% ação · 18% acompanhar · 4% sem impacto23/06 08h · 33% ação · 67% acompanhar · 0% sem impacto24/06 09h · 48% ação · 52% acompanhar · 0% sem impacto18/06agora
Precisa de açãoAcompanharSem impacto
topo em Precisa de ação: FrontException: Cannot read… 169/24htopo em Acompanhar: HttpRequestException: Catalog Error… 194/24htopo em Sem impacto: session-init call failed for… 7/24h
Não é o volume (esse está na Tendência, na aba Triagem) — é a mistura: que fração de cada leitura pedia ação. Passe o mouse numa coluna para ver as frações. Os campeões refletem a leitura atual (o topo por balde de leituras passadas não é gravado).

🕘 Ritmo do dia — maior ofensor — FrontException: Cannot read properties… por hora (BRT, 24h)

horário comercial 9–180h–1h · 0 erros · 0% do dia · fora do expediente1h–2h · 0 erros · 0% do dia · fora do expediente2h–3h · 1 erro · 1% do dia · fora do expediente3h–4h · 0 erros · 0% do dia · fora do expediente4h–5h · 0 erros · 0% do dia · fora do expediente5h–6h · 0 erros · 0% do dia · fora do expediente6h–7h · 0 erros · 0% do dia · fora do expediente7h–8h · 0 erros · 0% do dia · fora do expediente8h–9h · 3 erros · 2% do dia · fora do expediente9h–10h · 8 erros · 4% do dia · horário comercial10h–11h · 38 erros · 20% do dia · pico11h–12h · 20 erros · 11% do dia · horário comercial12h–13h · 27 erros · 14% do dia · horário comercial13h–14h · 9 erros · 5% do dia · horário comercial14h–15h · 7 erros · 4% do dia · horário comercial15h–16h · 25 erros · 13% do dia · horário comercial16h–17h · 31 erros · 16% do dia · horário comercial17h–18h · 10 erros · 5% do dia · horário comercial18h–19h · 9 erros · 5% do dia · fora do expediente19h–20h · 0 erros · 0% do dia · fora do expediente20h–21h · 0 erros · 0% do dia · fora do expediente21h–22h · 0 erros · 0% do dia · fora do expediente22h–23h · 0 erros · 0% do dia · fora do expediente23h–24h · 0 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h38
A faixa 9–18h é o horário de operação. Concentração no comercial é assinatura de uso real de cliente (não tarefa agendada); fora dele, costuma ser infra/deploy/agendado. Perfil horário só do maior ofensor deste snapshot.
👀 Acompanhar & frota — o que vigiar e o denominador de risco por versão

🛰 Saúde da frota — 65 clientes por proximidade da versão de produção (16.3.x)

58 na linha (16.3.x)4 atrás3 à frente
É o denominador que normaliza o risco por versão. Os 4 atrás (dattos-prod.titulo.net 15.4.4, dattos (BTG) 15.4.11, dattos-uat (BTG) 15.4.15, iugu 16.0.12) podem carregar bug já corrigido. Detalhe por cliente na aba Contexto ↗.
👀 Contexto — acompanhar · ritmo do dia · o que mudou · clientes afetados (investigação secundária)
👀 16 p/ acompanhar · 2 sem impacto housekeeping — não atinge cliente

👀 Acompanhar — ainda não atinge cliente, ou já diminuindo

Error in _create_connection(). Traceback… · Matching · crescendo77/24h
TaskCanceledException: [SetFileStatusAsync]… · Back · recorrente, sem crescer74/24h
NpgsqlException: Erro durante importação ID… · Back · recorrente, sem crescer · ⚠ só temos o número, sem diagnóstico4/24h
DirectoryNotFoundException: Could not find a… · Back · recorrente, sem crescer12/24h
OfxException: Unsupported Account Type… · Back · sem crescer0/24h
Passa para Precisa de ação se voltar a crescer e atingir 3 ou mais ambientes.

🩹 Ruído — o que vale consertar na fonte

Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 2.384 erros).

session-init call failed for user=postgres… · Dattos-Gateway · infraestrutura sem cliente
7/24h · 0%
consertar a fonte · 👤 sem dono · definir
Consertando o maior (session-init call failed for…): o painel de 24h cairia de 2.384 para ~2.377.
🕘 Pico de erros às 11h uso real (9–18) vs infra/agendado

Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).

horário comercial 9–180h–1h · 10 erros · 0% do dia · fora do expediente1h–2h · 4 erros · 0% do dia · fora do expediente2h–3h · 51 erros · 2% do dia · fora do expediente3h–4h · 16 erros · 1% do dia · fora do expediente4h–5h · 41 erros · 2% do dia · fora do expediente5h–6h · 21 erros · 1% do dia · fora do expediente6h–7h · 9 erros · 0% do dia · fora do expediente7h–8h · 38 erros · 2% do dia · fora do expediente8h–9h · 59 erros · 2% do dia · fora do expediente9h–10h · 202 erros · 8% do dia · horário comercial10h–11h · 199 erros · 8% do dia · horário comercial11h–12h · 398 erros · 16% do dia · pico12h–13h · 254 erros · 10% do dia · horário comercial13h–14h · 40 erros · 2% do dia · horário comercial14h–15h · 68 erros · 3% do dia · horário comercial15h–16h · 166 erros · 7% do dia · horário comercial16h–17h · 178 erros · 7% do dia · horário comercial17h–18h · 161 erros · 7% do dia · horário comercial18h–19h · 334 erros · 13% do dia · fora do expediente19h–20h · 106 erros · 4% do dia · fora do expediente20h–21h · 53 erros · 2% do dia · fora do expediente21h–22h · 19 erros · 1% do dia · fora do expediente22h–23h · 36 erros · 1% do dia · fora do expediente23h–24h · 12 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h398
🔁 8 novos · 1 pararam vs 2026-06-23 08:38 · 1d atrás
👥 39 clientes atingidos · 10 em 3+ ambientes quem e onde

🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)

"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).

🏷 Risco por versão taxa por cliente

Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.

VersãoLinhagemErros (não-ruído)ClientesTaxa/cliente
16.4.016.4.x1.1953398.3
16.3.2416.3.x1.8932286
16.3.2216.3.x2.8103190.6
16.3.2016.3.x1234
16.3.1616.3.x616 amostra fraca
16.3.1016.3.x7
16.3.916.3.x2891289 amostra fraca
16.0.1216.0.x717 amostra fraca
15.4.1515.4.x18118 amostra fraca
15.4.1115.4.x2551255 amostra fraca
15.4.415.4.x818 amostra fraca
📦 Carga por cliente (volume) top por volume

Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (82 de 151 ambientes afetados em 72h). Internos e máquinas de dev fora.

qualicorp
2.000/72h
agibank
288/72h
edenred
265/72h
dattos (BTG)
255/72h
csf-qa
220/72h
allcare
168/72h
fujifilm
72/72h
yamaha
67/72h
natura
63/72h
kryptonbpo
49/72h
zaffari
48/72h
bayer
40/72h
🛰 Frota — versão por cliente 65 clientes

Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.

16.4.0
3 clientes
16.3.24 ★
22 clientes
16.3.22 ★
31 clientes
16.3.20 ★
3 clientes
16.3.16 ★
1 cliente
16.3.9 ★
1 cliente
16.0.12
1 cliente
15.4.15
1 cliente
15.4.11
1 cliente
15.4.4
1 cliente
★ = versão de produção mais comum (16.3.x)atrásna linhaà frente
ver por cliente (65)
ClienteVersão dominanteTambém vistaAtraso?
dattos-prod.titulo.net15.4.4⚠ versão antiga
dattos (BTG)15.4.11⚠ versão antiga
dattos-uat (BTG)15.4.15⚠ versão antiga
iugu16.0.12⚠ versão antiga
agibank16.3.9✓ atual
cliente16.3.16✓ atual
acelen16.3.20✓ atual
cea16.3.2016.3.24✓ atual
omnicom16.3.2016.3.24✓ atual
ache16.3.22✓ atual
bayer16.3.2216.3.24✓ atual
brpartners16.3.22✓ atual
bs216.3.2216.3.24✓ atual
ccr16.3.2216.3.24✓ atual
celcoin16.3.22✓ atual
cmpc16.3.22✓ atual
cofco16.3.2216.3.24✓ atual
colgate16.3.2216.3.24✓ atual
conciliadorrm16.3.22✓ atual
csf-qa16.3.2216.3.24✓ atual
fujifilm16.3.22✓ atual
granado16.3.22✓ atual
grupoepr16.3.22✓ atual
ifoodcorp16.3.22✓ atual
ipiranga16.3.2216.3.24✓ atual
kryptonbpo16.3.2216.3.24✓ atual
martins16.3.22✓ atual
nutrien16.3.2216.3.24✓ atual
operafidc16.3.2216.3.24✓ atual
protege16.3.2216.3.24✓ atual
pucrs16.3.22✓ atual
qualicorp16.3.2216.3.24✓ atual
randon16.3.22✓ atual
sales16.3.2216.3.24✓ atual
solinftec16.3.22✓ atual
stellantis16.3.2216.3.24✓ atual
uniasselvi16.3.22✓ atual
valid16.3.22✓ atual
zaffari16.3.22✓ atual
zortea16.3.22✓ atual
local16.3.2416.3.10✓ atual
allcare16.3.2416.3.22✓ atual
atlas16.3.2416.3.22✓ atual
cocal16.3.2416.3.22✓ atual
edenred16.3.2416.3.22✓ atual
holambracoop16.3.2416.3.22✓ atual
natura16.3.2416.3.22✓ atual
sebraemg16.3.2416.3.22✓ atual
simpaul16.3.2416.3.22✓ atual
vwfs16.3.2416.3.22✓ atual
yamaha16.3.2416.3.22✓ atual
123milhas16.3.24✓ atual
cobasi16.3.24✓ atual
columbia16.3.24✓ atual
comercialzaffari16.3.24✓ atual
f2jinterlagos16.3.24✓ atual
hsl16.3.24✓ atual
mbenz16.3.24✓ atual
nissei16.3.24✓ atual
pirelli_csa16.3.24✓ atual
travelex16.3.24✓ atual
volks16.3.24✓ atual
gaspar16.4.016.3.24↑ pré-lançamento
local-denis16.4.0↑ pré-lançamento
pentest16.4.0↑ pré-lançamento
🗂 31 grupos · fonte de investigação — ordenada por volume 72h · filtrável por origem

Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.

#ClassificaçãoTipo de erroErroSistemaCliente principalNº amb.AmbientesVersões24h72hTendência
1Precisa de açãoFalha ao confirmar arquivo no armazenamento (não encontrado)Execution CountersAggregator is in the Failed state now due to an exception…Backqualicorp3prod, other16.3.22, 16.4.01962.020— sem mudança
2AcompanharFalha no serviço de Consulta (motor de dados)Exception in ASGI application + Exception Group Traceback (most recent call…Querydattos-data-engine-query-aws-16-38other16.3.24, 16.4.0667982▲ 214%
3Precisa de açãoExecução de fluxo: parte não roda por status, parte falha ao chamar o pipelineInvalidOperationException: Failed to process the job '119934': an exception…Backhomolog45demo, prod, other, eng-internal, local, dev, hom15.4.11, 15.4.15338872▲ 55%
4Precisa de açãoPreparação de dados (ETL): tabela intermediária ausente e banco lentoError in _create_connection(). Traceback (most recent call last): File…PipelineNoWebsite18other, prod, eng-internal, local, dev16.3.10, 16.3.24108414▲ 25%
5AcompanharConciliação: base temporária e conexão de mensageria instáveisError in _create_connection(). Traceback (most recent call last): File…MatchingNoWebsite4other, prod, demo16.3.24, 16.4.077385▲ 25%
6Precisa de açãoErro de banco/SQL (conciliação)SqlException: Failed to process the job '712680': an exception occurred. An…Backagibank13prod, other, hom, local15.4.11, 15.4.15154371▲ 65%
7Acompanhar Falha ao enviar requisição ao motor de dadosHttpRequestException: Catalog Error: Table with name matching_32343933 does…Backedenred20prod, demo, eng-internal, local16.3.20, 16.3.22194366▲ 104%
8Precisa de açãoErro de tela no controle de licença (propriedade indefinida)FrontException: Cannot read properties of undefined (reading 'currentSizeGB')…Frontedenred30prod, local, eng-internal, demo16.3.22, 16.3.24169246▲ 303%
9AcompanharFalha ao confirmar arquivo no armazenamento (tempo esgotado)TaskCanceledException: [SetFileStatusAsync] Failed to set file status for…Backcsf-qa2prod15.4.11, 16.3.2274186— sem mudança
10AcompanharFalha ao ler do banco (EF/DB)EntityCommandExecutionException: Failed to process the job '10313579': an…Backallcare17prod, local, demo, eng-internal15.4.11, 16.3.22132178▲ 242%
11Sem impactoGateway/serviço novo falhandosession-init call failed for user=postgres host=postgres Traceback (most…Dattos-GatewayNoWebsite1other16.4.07116— sem mudança
12AcompanharFalha de envio de e-mail (limite do servidor)SmtpException: Erro ao enviar e-mail #210251. Service not available, closing…Backdattos (BTG)1prod15.4.113887▲ 53%
13Precisa de açãoConexão com o motor de dados perdida (mensageria)Unexpected connection close detected: StreamLostError: ("Stream connection…DataEngineNoWebsite2other, local16.4.08585novo
14AcompanharFalha EF/DB (interno)EntityException: Failed to execute polling task. An exception has been raised…Backsergio8prod, other, hom, dev, eng-internal, local15.4.15, 16.3.161170▼ 22%
15Precisa de ação Erro de código (referência nula) na amostraNullReferenceException: Failed to process the job '10315450': an exception…Backallcare6prod, local15.4.11, 16.3.222946▲ 84%
16AcompanharPasta de importação (SFTP) não encontradaDirectoryNotFoundException: Could not find a part of the path…Backccr1prod16.3.22, 16.3.241233— sem mudança
17AcompanharResposta inválida do motor de dados (503)JsonReaderException: DataEngine returned non-parseable JSON on route…Backeng-hotfix10eng-internal, prod, local16.3.22, 16.3.241527▲ 125%
18Precisa de açãoAgente de IA de SQL indisponível e erros de sintaxe no ETLBusinessException: Não é possível gerar este relatório para esta conciliação…Backgaspar15prod, dev, hom, eng-internal, local15.4.11, 15.4.151424▲ 71%
19Precisa de açãoArquivo de importação ausente no armazenamentoFileNotFoundException: File not found on storage Ttl. Details: FileName…Backdattos (BTG)2prod15.4.11, 16.3.22920▲ 67%
20Precisa de açãoErro de código (parâmetro nulo)ArgumentNullException: Value cannot be null. Parameter name: entity Value…Backeng-release-fix6eng-internal, prod16.3.20, 16.3.22715▲ 88%
21Acompanhar Falha transitória de importação (banco)NpgsqlException: Erro durante importação ID 2466015 Exception while reading…Backdattos (BTG)1prod15.4.11415— sem mudança
22Precisa de açãoPasta de importação fora da configuração (autorização)AuthorizationException: A pasta atual não é válida de acordo com as pastas…Backedenred2prod, local16.3.24, 16.4.01214novo
23Precisa de açãoErro de validação (e-mail sem destinatário)ArgumentException: Erro ao enviar e-mail #210255. Destinatário do e-mail não…Backdattos (BTG)4prod, dev15.4.11, 16.3.22512▲ 100%
24AcompanharErro interno encapsulado (causa oculta)TargetInvocationException: Uma exceção foi acionada pelo destino de uma…Backgaspar2prod, eng-internal16.4.078novo
25Sem impactoFalha de inicialização de serviço (injeção de dependência)DependencyResolutionException: An exception was thrown while activating…BackNoWebsite1other16.3.2206— sem mudança
26AcompanharConexão encerrada pelo cliente (HTTP)HttpException: The remote host closed the connection. The error code is…Backnatura2prod16.3.22, 16.3.2445novo
27Precisa de açãoErro de SQL em banco externo (Oracle)OracleException: ORA-00904: "TSCCLIGER"."NM_CLIENTE": invalid identifier…Backdattos (BTG)1prod15.4.1155novo
28Acompanhar Formato de dado inválido na importaçãoFormatException: Erro durante importação ID 91797 Input string was not in a…Backcofco2prod16.3.22, 16.3.2424novo
29AcompanharImportação OFX: tipo de conta não suportadoOfxException: Unsupported Account Type Unsupported Account Type Trace…Backoperafidc1prod16.3.2204— sem mudança
30AcompanharFalha ao ler arquivo enviado (upload)IOException: Error reading MIME multipart body part. Error reading MIME…Backnatura2prod16.3.24, 16.4.033novo
31AcompanharTabela ausente em banco externo (MySQL)MySqlException: Table 'RPA-1286.TB_AUTBANK_TS_REQ_GERAL' doesn't exist…Backdattos (BTG)1prod15.4.1133novo
❓ Ajuda — como ler este painel · seções que ligam quando a coleta acumular dado
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
  • Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
  • Acompanhar ainda não atinge cliente, ou já está diminuindo.
  • Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
  • Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.

"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.

Símbolos
  • 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
  • 🔗 N incidente consolidado de N erros da mesma raiz.
  • 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
  • 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
  • em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
  • NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor

vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.

⏱ Horizonte: comparações cobrem ~7 dias (14 snapshots de 12/12h); não há base "vs semana/mês passado" nem horário exato de última ocorrência. 🏷 Tipo de erro é classificado por IA (pode errar — confirme no Loki). Contagens podem ser piso quando a consulta satura.