QA Telemetry · 2026-06-25 08:47

Janela 24h/72h · Ambientes afetados 60/157 · bruto 24h 2.129 · 72h 7.863 · 105 queries · anterior 2026-06-24 14:40 (18h atrás) · snapshot 08:47 · copiar versão Slack/Jira ↗

🔴 11 pedem ação · 7 crescendo
🔴11 problemas pedindo ação, 7 crescendo · 2 pode ter surgido numa versão recente. Comece por: Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.d….
Leitura do analista confiança média: Produção movimentada, sem incêndio novo isolado. O maior volume por cliente é a falha de storage externo no qualicorp (status de arquivo não atualiza), já diminuindo. Em vários clientes seguem, estáveis, a automação agendada falhando ao processar regras e erros de tela no frontend (este em alta). Sinal a confirmar: o erro de staging "somente-leitura" voltou a aparecer só na versão mais nova (16.3.24) em 5 clientes — possível recorrência do PRD-9149. Hipótese, confirme no Loki.
📌 A fila técnica começa por Error: IO Error: Cannot open database… — suspeita de versão recente (a confirmar).
Precisa de ação
816 ▼ 16% caindo
11 problemas
≈ neste nível há ~2d · 5 leituras · estimativa
pico 957 · 15 snapshots
Acompanhar
1.313 — estável
23 problemas
Sem impacto
12 ▼ 25% caindo
dev / infra
Clientes afetados
43 — estável
de 157

📈 Tendência — ~7 dias · está piorando ou melhorando?

01.6933.38519/06 08h: 3.284 erros19/06 14h: 2.329 erros19/06 15h: 2.615 erros20/06 15h: 1.229 erros21/06 14h: 495 erros21/06 19h: 609 erros21/06 20h: 600 erros21/06 23h: 690 erros22/06 08h: 804 erros22/06 11h: 2.066 erros22/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros19/0620/0621/0622/0624/0625/06
Último snapshot: 816 erros que pedem ação, 1.313 para acompanhar, 12 sem impacto.
Precisa de açãoAcompanharSem impacto
📅 desde 19/06 08h · 15 leituras (uma a cada ~12h) · eixo Y = erros/24h
ver linha do tempo detalhada — data e hora de cada leitura
01.6933.38519/06 08h: 3.284 erros19/06 14h: 2.329 erros19/06 15h: 2.615 erros20/06 15h: 1.229 erros21/06 14h: 495 erros21/06 19h: 609 erros21/06 20h: 600 erros21/06 23h: 690 erros22/06 08h: 804 erros22/06 11h: 2.066 erros22/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros19/06 08h19/06 14h19/06 15h20/06 15h21/06 14h21/06 19h21/06 20h21/06 23h22/06 08h22/06 11h22/06 16h23/06 08h24/06 09h24/06 14h25/06 08h

🧩 Saúde por módulo — qual área dói mais (24h)

🔥 ETL · Carga de Análise (ETL) média
456/24h
Frontend · Tela/UI média
173/24h
Conciliação · Casamento de transações baixa
505/24h
ver mais 8 módulos
Notificação · E-mail alta
45/24h
Plataforma · Mensageria (Rabbit) baixa
17/24h
Analytics · Automação de fluxo alta
389/24h
Integrações · Storage/SFTP média
291/24h
Persistência · Banco da plataforma (SQL Server) média
93/24h
Processos · Cópia de arquivo alta
12/24h
Fechamento · Processo de fechamento alta
6/24h
Módulo derivado da assinatura do erro (regra auditável; passe o mouse pra ver). alta namespace específico · média wrapper/texto · baixa só origem. Ordenado por severidade; a barra mede volume.
🎯 Resolver primeiro — o que consertar agora, por prioridade: versão nova → crescendo → vários ambientes → volume
Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.d…NOVO🔍 v16.3.24? (possível regressão da versão recente — a confirmar)↩ histórico de escape🐞 corrigir bugnovo subindo
15/24h29 · 72h
Módulo ETL · Carga de Análise (ETL) · origem Pipeline+Matching · 5 clientes (allcare, cea, conciliadorrm, +2) · em alta · apareceu pela 1ª vez novo hoje
priorizado por: suspeita de versão recente (hipótese)
versão16.3.24 · 100%
A etapa de carga falha e a análise não conclui para o cliente afetado.
ver diagnóstico e possível causa
🔍 suspeita · confiança média ainda não confirmado — pode ter começado em PRD-9149 (v16.3.24) · Conciliação/ETL — staging DuckDB. Erro "Cannot open database ... in read-only mode: database does not exist" casa com a assinatura do PR "open staging in read-only mode" (PRD-9149). 100% concentrado na 16.3.24 (build mais novo), 5 clientes de produção. Reaparecendo após correção — confirmar se é recorrência pós-fix. Confirme no Loki antes de agir.
🧭 Onde aconteceAcontece na carga da análise (ETL/conciliação), ao abrir o arquivo de staging em DuckDB.
👁 O que o cliente vêA etapa de carga falha e a análise não conclui para o cliente afetado.
🤔 Causa provávelO banco de staging é aberto em modo somente-leitura quando ainda não existe. Mesma assinatura do PRD-9149 (abrir staging em read-only). Concentrado 100% na versão mais nova (16.3.24), em 5 clientes — confirmar se é recorrência pós-correção. Hipótese, não veredito. confiança média
↩ Histórico da área4 escapes catalogados em ETL: PRD-8903, PRD-8965, Pipeline-storage, CB-1 — matriz de escape ↗. Construtor/ETL Turbo AI é a área mais frágil catalogada (boilerplate vs banner, resumo truncado, agente PDF transiente); saturação de staging DuckDB sob volume alto. Histórico da área, a confirmar — não é veredito deste erro.
📋 Regras do móduloetl-business-rules.md ↗ — leia as regras de negócio de ETL pra confirmar qual se aplica
FrontException: Cannot read properties of undefined (reading…CRÔNICO🔍 v16.3.9? (possível regressão da versão recente — a confirmar)♻️ refatorar🕘 Pico de logs às 11h▲ 27% subindocrônico (visto em 15 de 15 snapshots)
173/24h413 · 72h
Módulo Frontend · Tela/UI · origem Front · 35 clientes (edenred, zaffari, martins, +3) · constante · vs ontem ▲2% subindo · vs ~7d ▲37% subindo · apareceu pela 1ª vez há 5 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.24 · 55% (+3)
Parte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.9 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece na interface (frontend), ao renderizar telas com dados ainda não carregados.
👁 O que o cliente vêParte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
🤔 Causa provávelErro de JavaScript "Cannot read properties of undefined" lendo propriedade de objeto indefinido, espalhado por mais de 30 clientes e em alta (~+27% vs anterior). Provável dado ausente/assíncrono não tratado em algum componente. confiança média
0h–1h · 8 erros · 4% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 3 erros · 2% do dia9h–10h · 7 erros · 4% do dia · horário comercial10h–11h · 2 erros · 1% do dia · horário comercial11h–12h · 44 erros · 25% do dia · pico12h–13h · 13 erros · 7% do dia · horário comercial13h–14h · 10 erros · 6% do dia · horário comercial14h–15h · 4 erros · 2% do dia · horário comercial15h–16h · 9 erros · 5% do dia · horário comercial16h–17h · 9 erros · 5% do dia · horário comercial17h–18h · 29 erros · 16% do dia · horário comercial18h–19h · 35 erros · 20% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 5 erros · 3% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 11h — provável impacto real de cliente.
BusinessException: ETL não encontrado com o código…ESCALANDO ·?↩ histórico de escape🔬 investigar🕘 Pico de logs às 5h▲ 75% subindocrônico (visto em 15 de 15 snapshots)
35/24h56 · 72h
Módulo ETL · Carga de Análise (ETL) · origem Back · 20 clientes (edenred, dattos (BTG), allcare, +2) · em alta · vs ontem ▲150% subindo · vs ~7d ▲25% subindo · apareceu pela 1ª vez há 5 dias
priorizado por: crescendo agora
versão16.3.24 · 55% (+4)
A geração assistida de SQL falha; a transformação não conclui.
ver diagnóstico
🧭 Onde aconteceAcontece na preparação de dados, quando o ETL usa o agente de IA para completar/gerar SQL.
👁 O que o cliente vêA geração assistida de SQL falha; a transformação não conclui.
🤔 Causa provávelO serviço do agente de SQL respondeu indisponível (503) e há casos de sintaxe SQL inválida. Misto de indisponibilidade externa e erro de regra. Confirme no Loki. confiança média
↩ Histórico da área4 escapes catalogados em ETL: PRD-8903, PRD-8965, Pipeline-storage, CB-1 — matriz de escape ↗. Construtor/ETL Turbo AI é a área mais frágil catalogada (boilerplate vs banner, resumo truncado, agente PDF transiente); saturação de staging DuckDB sob volume alto. Histórico da área, a confirmar — não é veredito deste erro.
📋 Regras do móduloetl-business-rules.md ↗ — leia as regras de negócio de ETL pra confirmar qual se aplica
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 10 erros · 29% do dia · pico6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 0 erros · 0% do dia · horário comercial10h–11h · 1 erro · 3% do dia · horário comercial11h–12h · 1 erro · 3% do dia · horário comercial12h–13h · 3 erros · 9% do dia · horário comercial13h–14h · 0 erros · 0% do dia · horário comercial14h–15h · 1 erro · 3% do dia · horário comercial15h–16h · 10 erros · 29% do dia · horário comercial16h–17h · 7 erros · 20% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 1 erro · 3% do dia19h–20h · 1 erro · 3% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 5h — provável impacto real de cliente.
🧵 traceId: a647833a-a68e-403c-957… ↗ · 80debe84-2aed-4259-a71… ↗ · 97d99448-7a7b-4894-9ac… ↗
↳ at Dattos.Platform.Services.Etls.Steps.ImportResultStepService.<GetIntegratedCurrentEtlAsync>d__15.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.Se

+ 8 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).

📊 Gráficos — toda a análise visual num lugar só. Tudo derivado dos snapshots gravados, mesma régua da Triagem.
🎯 O que atacar — impacto — quem dói, em quem, e quantos itens pedem ação

🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 401) · cor = balde de ação

401/24h
👤 mais impactado: NoWebsite · 72% · espalhado por 20 ambientes
351/24h
👤 mais impactado: dattos-data-engine-query-aws-16-3 · 62% · espalhado por 7 ambientes
306/24h
👤 mais impactado: agibank · 16% · espalhado por 51 ambientes
206/24h
👤 mais impactado: qualicorp · 98% · espalhado por 5 ambientes
173/24h
👤 mais impactado: edenred · 18% · espalhado por 35 ambientes
130/24h
👤 mais impactado: NoWebsite · 85% · espalhado por 4 ambientes
109/24h
👤 mais impactado: edenred · 32% · espalhado por 21 ambientes
93/24h
👤 mais impactado: agibank · 47% · espalhado por 14 ambientes
76/24h
👤 mais impactado: csf-qa · 95% · espalhado por 4 ambientes
72/24h
👤 mais impactado: allcare · 34% · espalhado por 22 ambientes
Precisa de açãoAcompanharSem impacto
A cabeça da distribuição costuma responder por boa parte da carga acionável; a cor mostra o balde de ação. Cliente e percentual vêm da coluna de ambiente do snapshot. Detalhe por linha na aba Tabela ↗.

📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 1.970)

qualicorp
1.970/72h
edenred
351/72h
agibank
346/72h
dattos (BTG)
320/72h
allcare
293/72h
csf-qa
245/72h
natura
82/72h
martins
78/72h
fujifilm
72/72h
celcoin
71/72h
kryptonbpo
68/72h
yamaha
68/72h
Volume de erros não-ruído por cliente de produção (top 12); a cabeça domina e o resto é cauda longa. Detalhe por cliente na aba Contexto ↗.

🧭 Os 37 itens por classificação — contagem de itens (não de volume)

11 Precisa de ação23 Acompanhar3 Sem impacto
Poucos itens pedem ação; a maioria é monitoramento. Volume ≠ nº de itens — um único item pode somar milhares de ocorrências. Lista completa na aba Tabela ↗.
📈 Tendência no tempo — está piorando ou melhorando, e em que horário

🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%

19/06 08h · 75% ação · 8% acompanhar · 17% sem impacto19/06 14h · 66% ação · 19% acompanhar · 15% sem impacto19/06 15h · 71% ação · 17% acompanhar · 12% sem impacto20/06 15h · 80% ação · 10% acompanhar · 9% sem impacto21/06 14h · 52% ação · 47% acompanhar · 1% sem impacto21/06 19h · 40% ação · 35% acompanhar · 24% sem impacto21/06 20h · 64% ação · 12% acompanhar · 24% sem impacto21/06 23h · 36% ação · 44% acompanhar · 20% sem impacto22/06 08h · 71% ação · 16% acompanhar · 13% sem impacto22/06 11h · 83% ação · 12% acompanhar · 5% sem impacto22/06 16h · 78% ação · 18% acompanhar · 4% sem impacto23/06 08h · 33% ação · 67% acompanhar · 0% sem impacto24/06 09h · 48% ação · 52% acompanhar · 0% sem impacto24/06 14h · 41% ação · 58% acompanhar · 1% sem impacto25/06 08h · 38% ação · 61% acompanhar · 1% sem impacto19/06agora
Precisa de açãoAcompanharSem impacto
topo em Precisa de ação: Error: IO Error: Cannot open database… 15/24htopo em Acompanhar: Error: IO Error: Cannot open database… 401/24htopo em Sem impacto: session-init call failed for… 7/24h
Não é o volume (esse está na Tendência, na aba Triagem) — é a mistura: que fração de cada leitura pedia ação. Passe o mouse numa coluna para ver as frações. Os campeões refletem a leitura atual (o topo por balde de leituras passadas não é gravado).
👀 Acompanhar & frota — o que vigiar e o denominador de risco por versão

🛰 Saúde da frota — 68 clientes por proximidade da versão de produção (16.3.x)

61 na linha (16.3.x)4 atrás3 à frente
É o denominador que normaliza o risco por versão. Os 4 atrás (app 14.8.4, dattos-prod.titulo.net 15.4.4, dattos (BTG) 15.4.11, dattos-uat (BTG) 15.4.15) podem carregar bug já corrigido. Detalhe por cliente na aba Contexto ↗.
👀 Contexto — acompanhar · ritmo do dia · o que mudou · clientes afetados (investigação secundária)
👀 23 p/ acompanhar · 3 sem impacto housekeeping — não atinge cliente

👀 Acompanhar — ainda não atinge cliente, ou já diminuindo

Error: IO Error: Cannot open database… · Pipeline · crescendo401/24h
NpgsqlException: Erro durante importação ID… · Back · recorrente, sem crescer · ⚠ só temos o número, sem diagnóstico5/24h
EntityCommandExecutionException: An error… · Back · recorrente, sem crescer72/24h
ArgumentOutOfRangeException… · Back · crescendo10/24h
Exception in ASGI application + Exception… · Query · recorrente, sem crescer351/24h
Failed to process the job '716072': an… · Back · diminuindo206/24h
HttpRequestException: Error refreshing sample… · Back · recorrente, sem crescer109/24h
TaskCanceledException: [SetFileStatusAsync]… · Back · recorrente, sem crescer76/24h
ArgumentNullException: Value cannot be null… · Back · recorrente, sem crescer · ⚠ só temos o número, sem diagnóstico6/24h
JsonReaderException: DataEngine returned… · Back · recorrente, sem crescer6/24h
DirectoryNotFoundException: Could not find a… · Back · recorrente, sem crescer12/24h
AuthorizationException: A pasta atual não é… · Back · recorrente, sem crescer4/24h
OfxException: Unsupported Account Type… · Back · recorrente, sem crescer0/24h
Passa para Precisa de ação se voltar a crescer e atingir 3 ou mais ambientes.

🩹 Ruído — o que vale consertar na fonte

Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 2.129 erros).

session-init call failed for user=postgres… · Dattos-Gateway · infraestrutura sem cliente
7/24h · 0%
consertar a fonte · 👤 sem dono · definir
HttpResponseException: Processing of the… · Back · infraestrutura sem cliente
5/24h · 0%
consertar a fonte · 👤 sem dono · definir
Consertando o maior (session-init call failed for…): o painel de 24h cairia de 2.129 para ~2.122.
🕘 Pico de erros às 14h uso real (9–18) vs infra/agendado

Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).

horário comercial 9–180h–1h · 15 erros · 1% do dia · fora do expediente1h–2h · 14 erros · 1% do dia · fora do expediente2h–3h · 3 erros · 0% do dia · fora do expediente3h–4h · 16 erros · 1% do dia · fora do expediente4h–5h · 34 erros · 2% do dia · fora do expediente5h–6h · 50 erros · 2% do dia · fora do expediente6h–7h · 3 erros · 0% do dia · fora do expediente7h–8h · 13 erros · 1% do dia · fora do expediente8h–9h · 81 erros · 4% do dia · fora do expediente9h–10h · 185 erros · 8% do dia · horário comercial10h–11h · 100 erros · 4% do dia · horário comercial11h–12h · 138 erros · 6% do dia · horário comercial12h–13h · 113 erros · 5% do dia · horário comercial13h–14h · 213 erros · 9% do dia · horário comercial14h–15h · 367 erros · 16% do dia · pico15h–16h · 115 erros · 5% do dia · horário comercial16h–17h · 225 erros · 10% do dia · horário comercial17h–18h · 108 erros · 5% do dia · horário comercial18h–19h · 339 erros · 15% do dia · fora do expediente19h–20h · 57 erros · 3% do dia · fora do expediente20h–21h · 10 erros · 0% do dia · fora do expediente21h–22h · 7 erros · 0% do dia · fora do expediente22h–23h · 9 erros · 0% do dia · fora do expediente23h–24h · 30 erros · 1% do dia · fora do expediente0h6h9h12h15h18h23h367
🔁 3 novos · 0 pararam vs 2026-06-24 14:40 · 18h atrás
👥 43 clientes atingidos · 10 em 3+ ambientes quem e onde

🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)

"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).

Outros (NoWebsite/nós de serviço) · 12 grupos · 6.059 hits
·
Exception in ASGI application + Exception Group… · dattos-data-engine-query-aws-16-3
1.261
🏷 Risco por versão taxa por cliente

Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.

VersãoLinhagemErros (não-ruído)ClientesTaxa/cliente
16.4.016.4.x1.6533551
16.3.2416.3.x2.5393279.3
16.3.2216.3.x2.91725116.7
16.3.2016.3.x1226 amostra fraca
16.3.1616.3.x616 amostra fraca
16.3.1016.3.x7
16.3.916.3.x3471347 amostra fraca
16.3.216.3.x3
16.0.1316.0.x5
16.0.1216.0.x7
15.4.1515.4.x19119 amostra fraca
15.4.1115.4.x3201320 amostra fraca
15.4.415.4.x818 amostra fraca
14.8.414.8.x616 amostra fraca
📦 Carga por cliente (volume) top por volume

Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (85 de 157 ambientes afetados em 72h). Internos e máquinas de dev fora.

qualicorp
1.970/72h
edenred
351/72h
agibank
346/72h
dattos (BTG)
320/72h
allcare
293/72h
csf-qa
245/72h
natura
82/72h
martins
78/72h
fujifilm
72/72h
celcoin
71/72h
kryptonbpo
68/72h
yamaha
68/72h
🛰 Frota — versão por cliente 68 clientes

Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.

16.4.0
3 clientes
16.3.24 ★
32 clientes
16.3.22 ★
25 clientes
16.3.20 ★
2 clientes
16.3.16 ★
1 cliente
16.3.9 ★
1 cliente
15.4.15
1 cliente
15.4.11
1 cliente
15.4.4
1 cliente
14.8.4
1 cliente
★ = versão de produção mais comum (16.3.x)atrásna linhaà frente
ver por cliente (68)
ClienteVersão dominanteTambém vistaAtraso?
app14.8.4⚠ versão antiga
dattos-prod.titulo.net15.4.4⚠ versão antiga
dattos (BTG)15.4.11⚠ versão antiga
dattos-uat (BTG)15.4.15⚠ versão antiga
agibank16.3.9✓ atual
cliente16.3.16✓ atual
acelen16.3.20✓ atual
cea16.3.2016.3.24✓ atual
ache16.3.22✓ atual
brpartners16.3.22✓ atual
bs216.3.2216.3.24✓ atual
ccr16.3.2216.3.24✓ atual
celcoin16.3.22✓ atual
cmpc16.3.22✓ atual
cofco16.3.2216.3.24✓ atual
colgate16.3.2216.3.24✓ atual
conciliadorrm16.3.2216.3.24✓ atual
csf-qa16.3.2216.3.24✓ atual
fujifilm16.3.22✓ atual
granado16.3.22✓ atual
grupoepr16.3.22✓ atual
ifoodcorp16.3.22✓ atual
martins16.3.22✓ atual
nutrien16.3.2216.3.24✓ atual
operafidc16.3.2216.3.24✓ atual
positivosmais16.3.22✓ atual
pucrs16.3.22✓ atual
qualicorp16.3.2216.3.24✓ atual
randon16.3.22✓ atual
sales16.3.2216.3.24✓ atual
uniasselvi16.3.22✓ atual
valid16.3.22✓ atual
zaffari16.3.22✓ atual
iugu16.3.2416.0.12✓ atual
cervejariacidadeimperial16.3.2416.0.13✓ atual
local16.3.2416.3.10✓ atual
omnicom16.3.2416.3.20✓ atual
allcare16.3.2416.3.22✓ atual
atlas16.3.2416.3.22✓ atual
bayer16.3.2416.3.22✓ atual
cocal16.3.2416.3.22✓ atual
edenred16.3.2416.3.22✓ atual
holambracoop16.3.2416.3.22✓ atual
kryptonbpo16.3.2416.3.22✓ atual
natura16.3.2416.3.22✓ atual
sebraemg16.3.2416.3.22✓ atual
simpaul16.3.2416.3.22✓ atual
stellantis16.3.2416.3.22✓ atual
vwfs16.3.2416.3.22✓ atual
yamaha16.3.2416.3.22✓ atual
123milhas16.3.24✓ atual
cobasi16.3.24✓ atual
columbia16.3.24✓ atual
comercialzaffari16.3.24✓ atual
f2jinterlagos16.3.24✓ atual
flagship16.3.24✓ atual
hsl16.3.24✓ atual
ipiranga16.3.24✓ atual
laponia16.3.24✓ atual
mbenz16.3.24✓ atual
nissei16.3.24✓ atual
pirelli_csa16.3.24✓ atual
protege16.3.24✓ atual
travelex16.3.24✓ atual
volks16.3.24✓ atual
gaspar16.4.016.3.24↑ pré-lançamento
local-denis16.4.0↑ pré-lançamento
pentest16.4.0↑ pré-lançamento
🗂 37 grupos · fonte de investigação — ordenada por volume 72h · filtrável por origem

Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.

#ClassificaçãoTipo de erroErroSistemaCliente principalNº amb.AmbientesVersões24h72hTendência
1AcompanharFalha de storage externoFailed to process the job '716072': an exception occurred. An object or…Backqualicorp5prod, other, eng-internal14.8.4, 16.3.222061.998— sem mudança
2Acompanhar Falha no serviço de Consulta (motor de dados)Exception in ASGI application + Exception Group Traceback (most recent call…Querydattos-data-engine-query-aws-16-37other16.3.24, 16.4.03511.261— sem mudança
3Precisa de açãoExecução de fluxo: parte não roda por status, parte falha ao chamar o pipelineInvalidOperationException: [SchedulePolling] Error processing rule 20 for…Backagibank51prod, other, demo, eng-internal, local, dev, hom15.4.11, 15.4.15306933— sem mudança
4Acompanhar Falha de conexão do pipeline com o servidor de mensagens (tempo esgotado)Error: IO Error: Cannot open database "/mnt/staging/fbe066de-5efb-4afa-9a31-82…PipelineNoWebsite20other, prod, dev, eng-internal, local, demo16.3.10, 16.3.24401779— sem mudança
5Precisa de açãoConciliação: base temporária e conexão de mensageria instáveis[!] Critical error in pool process matching-16-4: Traceback (most recent call…MatchingNoWebsite4other, prod, demo16.3.24, 16.4.0130487— sem mudança
6AcompanharFalha ao enviar requisição ao motor de dadosHttpRequestException: Error refreshing sample from step ID 3533. IO Error: No…Backedenred21prod, demo, eng-internal, local16.3.20, 16.3.22109449— sem mudança
7Precisa de açãoErro de tela no controle de licença (propriedade indefinida)FrontException: Cannot read properties of undefined (reading 'length') Cannot…Frontedenred35prod, demo, local, dev, eng-internal16.3.22, 16.3.24173413▲ 27%
8Precisa de açãoErro de banco/SQL (conciliação)SqlException: Failed to process the job '715913': an exception occurred. An…Backagibank14prod, other, hom, local15.4.11, 15.4.1593409— sem mudança
9AcompanharFalha ao ler do banco (EF/DB)EntityCommandExecutionException: An error occurred while reading from the…Backallcare22prod, dev, local, demo, eng-internal15.4.11, 16.0.1372241— sem mudança
10AcompanharFalha ao confirmar arquivo no armazenamento (tempo esgotado)TaskCanceledException: [SetFileStatusAsync] Failed to set file status for…Backcsf-qa4prod, eng-internal, demo15.4.11, 16.3.2276229— sem mudança
11AcompanharFalha de envio de e-mail (limite do servidor)SmtpException: Erro ao enviar e-mail #210486. Service not available, closing…Backdattos (BTG)1prod15.4.1135115▲ 22%
12Precisa de açãoConexão com o motor de dados perdida (mensageria)Unexpected connection close detected: StreamLostError: ("Stream connection…DataEngineNoWebsite2other, local16.4.01585— sem mudança
13AcompanharFalha EF/DB (interno)EntityException: Failed to execute polling task. The underlying provider…Backsergio9prod, other, hom, dev, eng-internal, local15.4.15, 16.3.16771— sem mudança
14Precisa de ação Erro de código (referência nula) na amostraNullReferenceException: Object reference not set to an instance of an object…Backallcare8prod, local15.4.11, 16.3.222469▲ 35%
15Precisa de ação Agente de IA de SQL indisponível e erros de sintaxe no ETLBusinessException: ETL não encontrado com o código EXT-REPOM-ITAU-26712 ETL…Backedenred20prod, dev, hom, eng-internal, local15.4.11, 15.4.153556▲ 75%
16AcompanharPasta de importação (SFTP) não encontradaDirectoryNotFoundException: Could not find a part of the path…Backccr1prod16.3.22, 16.3.241236— sem mudança
17Precisa de ação Regressão (suspeita de versão)Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"…Pipeline+Matchingallcare5prod16.3.241529novo
18Precisa de açãoArquivo de importação ausente no armazenamentoFileNotFoundException: File not found on storage Ttl. Details: FileName…Backdattos (BTG)4prod, hom15.4.11, 15.4.15928— sem mudança
19AcompanharResposta inválida do motor de dados (503)JsonReaderException: DataEngine returned non-parseable JSON on route…Backallcare9prod, eng-internal, local16.3.22, 16.3.24625— sem mudança
20Sem impactoGateway/serviço novo falhandosession-init call failed for user=postgres host=postgres Traceback (most…Dattos-GatewayNoWebsite1other16.4.0722▼ 82%
21Precisa de açãoErro de validação (e-mail sem destinatário)ArgumentException: Erro ao enviar e-mail #210414. Destinatário do e-mail não…Backdattos (BTG)8prod, dev15.4.11, 16.0.131021▲ 40%
22AcompanharErro de código (parâmetro nulo)ArgumentNullException: Value cannot be null. Parameter name: source Value…Backeng-release-fix9eng-internal, prod16.3.20, 16.3.22621— sem mudança
23AcompanharPasta de importação fora da configuração (autorização)AuthorizationException: A pasta atual não é válida de acordo com as pastas…Backedenred2prod, local16.3.24, 16.4.0418— sem mudança
24Acompanhar Falha transitória de importação (banco)NpgsqlException: Erro durante importação ID 2469505 The operation has timed…Backdattos (BTG)1prod15.4.11515— sem mudança
25AcompanharProvável bugArgumentOutOfRangeException: [GenerateEtlStepDownloadJob] Error in job 1087…Backhomolog1demo16.3.241010novo
26AcompanharConexão encerrada pelo cliente (HTTP)HttpException: The remote host closed the connection. The error code is…Backnatura4prod16.3.22, 16.3.2438— sem mudança
27AcompanharProvável bugTypeLoadException: Could not load type 'OpenMcdf.CompoundFile' from assembly…Backeng-develop1dev16.4.088novo
28AcompanharErro interno encapsulado (causa oculta)TargetInvocationException: Uma exceção foi acionada pelo destino de uma…Backgaspar2prod, eng-internal16.4.008— sem mudança
29Precisa de açãoFalha ao mover arquivo processado no armazenamento (operação não suportada)NotSupportedException: [MoveProcessedStorageFilesAsync] storageId=3…Backgaspar1prod16.4.066▲ 50%
30Sem impactoFalha de inicialização de serviço (injeção de dependência)DependencyResolutionException: An exception was thrown while activating…BackNoWebsite1other16.3.2206— sem mudança
31Sem impactoFalha ao identificar o ambiente do cliente na requisiçãoHttpResponseException: Processing of the HTTP request resulted in an…BackNoWebsite1other16.3.2455▼ 29%
32AcompanharErro de SQL em banco externo (Oracle)OracleException: ORA-00904: "TSCCLIGER"."NM_CLIENTE": invalid identifier…Backdattos (BTG)1prod15.4.1105— sem mudança
33Acompanhar Formato de dado inválido na importaçãoFormatException: Erro durante importação ID 91797 Input string was not in a…Backcofco2prod16.3.22, 16.3.2404— sem mudança
34AcompanharImportação OFX: tipo de conta não suportadoOfxException: Unsupported Account Type Unsupported Account Type Trace…Backoperafidc1prod16.3.2204— sem mudança
35AcompanharFalha ao ler arquivo enviado (upload)IOException: Error reading MIME multipart body part. Error reading MIME…Backnatura2prod16.3.24, 16.4.003— sem mudança
36AcompanharTabela ausente em banco externo (MySQL)MySqlException: Table 'RPA-1286.TB_AUTBANK_TS_REQ_GERAL' doesn't exist…Backdattos (BTG)1prod15.4.1103— sem mudança
37AcompanharInfra/banco2026-06-24 18:17:54.6697|ERROR|Microsoft.EntityFrameworkCore.Database.Command|…Portal192.168.133.11/health3other16.3.223novo
❓ Ajuda — como ler este painel · seções que ligam quando a coleta acumular dado
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
  • Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
  • Acompanhar ainda não atinge cliente, ou já está diminuindo.
  • Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
  • Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.

"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.

Símbolos
  • 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
  • 🔗 N incidente consolidado de N erros da mesma raiz.
  • 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
  • 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
  • em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
  • NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor

vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.

⏱ Horizonte: comparações cobrem ~7 dias (14 snapshots de 12/12h); não há base "vs semana/mês passado" nem horário exato de última ocorrência. 🏷 Tipo de erro é classificado por IA (pode errar — confirme no Loki). Contagens podem ser piso quando a consulta satura.