QA Telemetry · 2026-06-30 08:35

Janela 24h/72h · Ambientes afetados 54/162 · bruto 24h 1.561 · 72h 3.427 · 74 queries · anterior 2026-06-29 14:35 (18h atrás) · snapshot 08:35 · copiar versão Slack/Jira ↗

🔴 4 pedem ação · 4 crescendo
🔴4 problemas pedindo ação, 4 crescendo. Comece por: InvalidOperationException: [SchedulePolling] Error processing rule 26….
Precisa de ação
449 ▲ 17% subindo
4 problemas
≈ neste nível há ~18h · 2 leituras · estimativa
pico 873 · 15 snapshots
Acompanhar
1.105 ▲ 58% subindo
21 problemas
Sem impacto
5 ▼ 85% caindo
dev / infra
Clientes afetados
32 ▲ 14% subindo
de 162

📈 Tendência — ~7 dias · está piorando ou melhorando?

01.6933.38522/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros30/06 08h: 1.559 erros22/0624/0626/0627/0629/0630/06
Último snapshot: 449 erros que pedem ação, 1.105 para acompanhar, 5 sem impacto.
Precisa de açãoAcompanharSem impacto
📅 desde 22/06 16h · 15 leituras (uma a cada ~12h) · eixo Y = erros/24h
ver linha do tempo detalhada — data e hora de cada leitura
01.6933.38522/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros30/06 08h: 1.559 erros22/06 16h23/06 08h24/06 09h24/06 14h25/06 08h25/06 14h26/06 09h26/06 14h27/06 12h27/06 14h28/06 10h28/06 14h29/06 08h29/06 14h30/06 08h

🧩 Saúde por módulo — qual área dói mais (24h)

🔥 Analytics · Automação de fluxo alta
356/24h
Persistência · Banco da plataforma (SQL Server) média
103/24h
Frontend · Tela/UI média
69/24h
ver mais 8 módulos
Plataforma · Mensageria (Rabbit) média
341/24h
Integrações · Storage/SFTP média
251/24h
ETL · Importação média
30/24h
Conciliação · Casamento de transações média
234/24h
Notificação · E-mail alta
43/24h
Processos · Cópia de arquivo alta
12/24h
Fechamento · Processo de fechamento alta
4/24h
Indeterminado baixa
111/24h
Módulo derivado da assinatura do erro (regra auditável; passe o mouse pra ver). alta namespace específico · média wrapper/texto · baixa só origem. Ordenado por severidade; a barra mede volume.
🎯 Resolver primeiro — o que consertar agora, por prioridade: versão nova → crescendo → vários ambientes → volume
InvalidOperationException: [SchedulePolling] Error processing rule 26…ESCALANDO ·?🔬 investigar🕘 Pico de logs às 9h— sem mudançacrônico (visto em 15 de 15 snapshots)
271/24h381 · 72h
Módulo Analytics · Automação de fluxo · origem Back · 33 clientes (agibank, dattos (BTG), yamaha, +3) · em alta · vs ontem ▲299% subindo · vs ~7d ▼9% caindo · apareceu pela 1ª vez há 7 dias
priorizado por: crescendo agora
versão16.3.25 · 65% (+5)
A automação de uma regra específica não roda no horário previsto; o cliente pode não ver a análise atualizar sozinha.
ver diagnóstico
🧭 Onde aconteceAcontece na automação agendada, quando o robô de agendamento processa as regras de cada análise.
👁 O que o cliente vêA automação de uma regra específica não roda no horário previsto; o cliente pode não ver a análise atualizar sozinha.
🤔 Causa provávelO agendamento ("SchedulePolling") falha ao processar regras específicas, em mais de 50 clientes. Volume estável — provável regra apontando para análise/etapa que mudou de estado. confiança média
📋 Regras do móduloautomacao-business-rules.md ↗ — leia as regras de negócio de Analytics pra confirmar qual se aplica
0h–1h · 0 erros · 0% do dia1h–2h · 37 erros · 12% do dia2h–3h · 1 erro · 0% do dia3h–4h · 3 erros · 1% do dia4h–5h · 3 erros · 1% do dia5h–6h · 6 erros · 2% do dia6h–7h · 4 erros · 1% do dia7h–8h · 11 erros · 4% do dia8h–9h · 32 erros · 10% do dia9h–10h · 42 erros · 14% do dia · pico10h–11h · 28 erros · 9% do dia · horário comercial11h–12h · 28 erros · 9% do dia · horário comercial12h–13h · 28 erros · 9% do dia · horário comercial13h–14h · 10 erros · 3% do dia · horário comercial14h–15h · 14 erros · 5% do dia · horário comercial15h–16h · 9 erros · 3% do dia · horário comercial16h–17h · 4 erros · 1% do dia · horário comercial17h–18h · 14 erros · 5% do dia · horário comercial18h–19h · 14 erros · 5% do dia19h–20h · 14 erros · 5% do dia20h–21h · 4 erros · 1% do dia21h–22h · 2 erros · 1% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 9h — provável impacto real de cliente.
🧵 traceId: 54721a09-37dd-499b-ae9… ↗ · 14c99623-1d8d-4ecc-8ad… ↗ · bf91ce28-bb4a-4e05-85e… ↗
↳ at Dattos.Platform.Services.Workflows.WorkflowExecutorJob.<>c__DisplayClass30_0.<<RunAsync>b__0>d.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.Ser
SqlException: Failed to process the job '2020': an exception…ESCALANDO ·?🔬 investigar🕘 Pico de logs às 11h— sem mudançacrônico (visto em 15 de 15 snapshots)
103/24h125 · 72h
Módulo Persistência · Banco da plataforma (SQL Server) · origem Back · Concentrado em 1 cliente: agibank (78% dos casos) · em alta · vs ontem ▲472% subindo · vs ~7d ▼37% caindo · apareceu pela 1ª vez há 7 dias
priorizado por: crescendo agora
versão16.3.9 · 78% (+4)
O job da análise falha silenciosamente; o resultado pode não aparecer para o usuário.
ver diagnóstico
🧭 Onde aconteceAcontece no processamento em segundo plano (jobs), em consultas ao banco da plataforma.
👁 O que o cliente vêO job da análise falha silenciosamente; o resultado pode não aparecer para o usuário.
🤔 Causa provávelErro de SQL com nome de objeto/coluna inválido ao montar a consulta — provável esquema divergente entre o que o código espera e a tabela real de staging. confiança média
0h–1h · 2 erros · 2% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 6 erros · 5% do dia4h–5h · 2 erros · 2% do dia5h–6h · 1 erro · 1% do dia6h–7h · 1 erro · 1% do dia7h–8h · 3 erros · 3% do dia8h–9h · 9 erros · 8% do dia9h–10h · 11 erros · 10% do dia · horário comercial10h–11h · 16 erros · 15% do dia · horário comercial11h–12h · 20 erros · 18% do dia · pico12h–13h · 8 erros · 7% do dia · horário comercial13h–14h · 2 erros · 2% do dia · horário comercial14h–15h · 16 erros · 15% do dia · horário comercial15h–16h · 3 erros · 3% do dia · horário comercial16h–17h · 4 erros · 4% do dia · horário comercial17h–18h · 1 erro · 1% do dia · horário comercial18h–19h · 2 erros · 2% do dia19h–20h · 2 erros · 2% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 1 erro · 1% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 11h — provável impacto real de cliente.
🧵 traceId: f1dbee47-1e8f-47c5-8bc… ↗ · c08f9825-5287-4643-ab7… ↗ · 7f22faf2-3bd7-4123-8df… ↗
↳ at Dattos.Platform.Data.Extensions.DbCommandExtensions.<SafeExecuteNonQueryAsync>d__13.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.Data\Extension
FrontException: An API key with the description provided already…ESCALANDO ·?🐞 corrigir bug🕘 Pico de logs às 11h— sem mudançacrônico (visto em 15 de 15 snapshots)
69/24h85 · 72h
Módulo Frontend · Tela/UI · origem Front · 13 clientes (veneza, vwfs, edenred, +3) · em alta · vs ontem ▲360% subindo · vs ~7d ▲23% subindo · apareceu pela 1ª vez há 7 dias
priorizado por: crescendo agora
versão16.3.25 · 75% (+3)
Parte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
ver diagnóstico
🧭 Onde aconteceAcontece na interface (frontend), ao renderizar telas com dados ainda não carregados.
👁 O que o cliente vêParte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
🤔 Causa provávelErro de JavaScript "Cannot read properties of undefined" lendo propriedade de objeto indefinido, espalhado por mais de 30 clientes e em alta (~+27% vs anterior). Provável dado ausente/assíncrono não tratado em algum componente. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 1 erro · 1% do dia9h–10h · 10 erros · 14% do dia · horário comercial10h–11h · 6 erros · 8% do dia · horário comercial11h–12h · 25 erros · 35% do dia · pico12h–13h · 5 erros · 7% do dia · horário comercial13h–14h · 19 erros · 26% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 3 erros · 4% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 3 erros · 4% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 11h — provável impacto real de cliente.

+ 1 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).

📊 Gráficos — toda a análise visual num lugar só. Tudo derivado dos snapshots gravados, mesma régua da Triagem.
🎯 O que atacar — impacto — quem dói, em quem, e quantos itens pedem ação

🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 335) · cor = balde de ação

335/24h
👤 mais impactado: NoWebsite · 95% · espalhado por 8 ambientes
271/24h
👤 mais impactado: agibank · 17% · espalhado por 33 ambientes
234/24h
👤 mais impactado: dattos-data-engine-query-aws-16-3 · 54% · espalhado por 6 ambientes
220/24h
👤 mais impactado: qualicorp · 96% · espalhado por 4 ambientes
103/24h
👤 mais impactado: agibank · 78% · espalhado por 10 ambientes
71/24h
👤 mais impactado: edenred · 26% · espalhado por 12 ambientes
69/24h
👤 mais impactado: veneza · 26% · espalhado por 13 ambientes
60/24h
👤 mais impactado: sergio · 73% · espalhado por 3 ambientes
36/24h
👤 mais impactado: dattos (BTG) · 100% das ocorrências · v15.4.11
30/24h
👤 mais impactado: veneza · 61% · espalhado por 5 ambientes
Precisa de açãoAcompanharSem impacto
A cabeça da distribuição costuma responder por boa parte da carga acionável; a cor mostra o balde de ação. Cliente e percentual vêm da coluna de ambiente do snapshot. Detalhe por linha na aba Tabela ↗.

📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 483)

edenred
483/72h
qualicorp
225/72h
agibank
216/72h
dattos (BTG)
157/72h
veneza
50/72h
vwfs
49/72h
sales
48/72h
yamaha
47/72h
mrsdp
36/72h
bayer
31/72h
ccr
30/72h
gaspar
20/72h
Volume de erros não-ruído por cliente de produção (top 12); a cabeça domina e o resto é cauda longa. Detalhe por cliente na aba Contexto ↗.

🧭 Os 26 itens por classificação — contagem de itens (não de volume)

4 Precisa de ação21 Acompanhar1 Sem impacto
Poucos itens pedem ação; a maioria é monitoramento. Volume ≠ nº de itens — um único item pode somar milhares de ocorrências. Lista completa na aba Tabela ↗.
📈 Tendência no tempo — está piorando ou melhorando, e em que horário

🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%

22/06 16h · 78% ação · 18% acompanhar · 4% sem impacto23/06 08h · 33% ação · 67% acompanhar · 0% sem impacto24/06 09h · 48% ação · 52% acompanhar · 0% sem impacto24/06 14h · 41% ação · 58% acompanhar · 1% sem impacto25/06 08h · 38% ação · 61% acompanhar · 1% sem impacto25/06 14h · 36% ação · 64% acompanhar · 0% sem impacto26/06 09h · 44% ação · 55% acompanhar · 1% sem impacto26/06 14h · 44% ação · 55% acompanhar · 1% sem impacto27/06 12h · 26% ação · 66% acompanhar · 9% sem impacto27/06 14h · 19% ação · 66% acompanhar · 15% sem impacto28/06 10h · 34% ação · 38% acompanhar · 28% sem impacto28/06 14h · 46% ação · 29% acompanhar · 24% sem impacto29/06 08h · 0% ação · 98% acompanhar · 2% sem impacto29/06 14h · 34% ação · 63% acompanhar · 3% sem impacto30/06 08h · 29% ação · 71% acompanhar · 0% sem impacto22/06agora
Precisa de açãoAcompanharSem impacto
topo em Precisa de ação: InvalidOperationException… 271/24htopo em Acompanhar: NullReferenceException: Failed to… 19/24htopo em Sem impacto: session-init call failed for… 5/24h
Não é o volume (esse está na Tendência, na aba Triagem) — é a mistura: que fração de cada leitura pedia ação. Passe o mouse numa coluna para ver as frações. Os campeões refletem a leitura atual (o topo por balde de leituras passadas não é gravado).

🕘 Ritmo do dia — maior ofensor — InvalidOperationException… por hora (BRT, 24h)

horário comercial 9–180h–1h · 0 erros · 0% do dia · fora do expediente1h–2h · 37 erros · 12% do dia · fora do expediente2h–3h · 1 erro · 0% do dia · fora do expediente3h–4h · 3 erros · 1% do dia · fora do expediente4h–5h · 3 erros · 1% do dia · fora do expediente5h–6h · 6 erros · 2% do dia · fora do expediente6h–7h · 4 erros · 1% do dia · fora do expediente7h–8h · 11 erros · 4% do dia · fora do expediente8h–9h · 32 erros · 10% do dia · fora do expediente9h–10h · 42 erros · 14% do dia · pico10h–11h · 28 erros · 9% do dia · horário comercial11h–12h · 28 erros · 9% do dia · horário comercial12h–13h · 28 erros · 9% do dia · horário comercial13h–14h · 10 erros · 3% do dia · horário comercial14h–15h · 14 erros · 5% do dia · horário comercial15h–16h · 9 erros · 3% do dia · horário comercial16h–17h · 4 erros · 1% do dia · horário comercial17h–18h · 14 erros · 5% do dia · horário comercial18h–19h · 14 erros · 5% do dia · fora do expediente19h–20h · 14 erros · 5% do dia · fora do expediente20h–21h · 4 erros · 1% do dia · fora do expediente21h–22h · 2 erros · 1% do dia · fora do expediente22h–23h · 0 erros · 0% do dia · fora do expediente23h–24h · 0 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h42
A faixa 9–18h é o horário de operação. Concentração no comercial é assinatura de uso real de cliente (não tarefa agendada); fora dele, costuma ser infra/deploy/agendado. Perfil horário só do maior ofensor deste snapshot.
👀 Acompanhar & frota — o que vigiar e o denominador de risco por versão

🛰 Saúde da frota — 47 clientes por proximidade da versão de produção (16.3.x)

42 na linha (16.3.x)4 atrás1 à frente
É o denominador que normaliza o risco por versão. Os 4 atrás (app 14.8.4, dattos-prod.titulo.net 15.4.4, dattos (BTG) 15.4.11, dattos-uat (BTG) 15.4.16) podem carregar bug já corrigido. Detalhe por cliente na aba Contexto ↗.
👀 Contexto — acompanhar · ritmo do dia · o que mudou · clientes afetados (investigação secundária)
👀 21 p/ acompanhar · 1 sem impacto housekeeping — não atinge cliente

👀 Acompanhar — ainda não atinge cliente, ou já diminuindo

NullReferenceException: Failed to process the… · Back · crescendo · ⚠ só temos o número, sem diagnóstico19/24h
ComponentNotRegisteredException: The… · Back · crescendo · ⚠ só temos o número, sem diagnóstico3/24h
Error: IO Error: Cannot open database… · Pipeline+Matching · crescendo2/24h
[CALLBACK_HTTP_ERROR] correlation_id=06995a13… · Pipeline · crescendo335/24h
Failed to process the job '723758': an… · Back · crescendo220/24h
ArgumentNullException: Value cannot be null… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico4/24h
DependencyResolutionException: An exception… · Back · crescendo · ⚠ só temos o número, sem diagnóstico6/24h
SsrfException: The URL 'https://sftp://transfe… · Back · crescendo · ⚠ só temos o número, sem diagnóstico3/24h
Exception in ASGI application + Exception… · Query · recorrente, sem crescer234/24h
NpgsqlException: Erro durante importação ID… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico6/24h
ArgumentException: Erro ao enviar e-mail… · Back · crescendo · ⚠ só temos o número, sem diagnóstico7/24h
DirectoryNotFoundException: Could not find a… · Back · recorrente, sem crescer12/24h
Passa para Precisa de ação se voltar a crescer e atingir 3 ou mais ambientes.

🩹 Ruído — o que vale consertar na fonte

Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 1.561 erros).

session-init call failed for user=snguser… · Dattos-Gateway · infraestrutura sem cliente
5/24h · 0%
consertar a fonte · 👤 sem dono · definir
Consertando o maior (session-init call failed for…): o painel de 24h cairia de 1.561 para ~1.556.
🕘 Pico de erros às 23h uso real (9–18) vs infra/agendado

Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).

horário comercial 9–180h–1h · 5 erros · 0% do dia · fora do expediente1h–2h · 40 erros · 2% do dia · fora do expediente2h–3h · 4 erros · 0% do dia · fora do expediente3h–4h · 13 erros · 1% do dia · fora do expediente4h–5h · 8 erros · 0% do dia · fora do expediente5h–6h · 12 erros · 1% do dia · fora do expediente6h–7h · 11 erros · 1% do dia · fora do expediente7h–8h · 18 erros · 1% do dia · fora do expediente8h–9h · 100 erros · 6% do dia · fora do expediente9h–10h · 102 erros · 6% do dia · horário comercial10h–11h · 143 erros · 9% do dia · horário comercial11h–12h · 120 erros · 7% do dia · horário comercial12h–13h · 147 erros · 9% do dia · horário comercial13h–14h · 103 erros · 6% do dia · horário comercial14h–15h · 83 erros · 5% do dia · horário comercial15h–16h · 24 erros · 1% do dia · horário comercial16h–17h · 243 erros · 15% do dia · horário comercial17h–18h · 32 erros · 2% do dia · horário comercial18h–19h · 53 erros · 3% do dia · fora do expediente19h–20h · 30 erros · 2% do dia · fora do expediente20h–21h · 15 erros · 1% do dia · fora do expediente21h–22h · 7 erros · 0% do dia · fora do expediente22h–23h · 7 erros · 0% do dia · fora do expediente23h–24h · 337 erros · 20% do dia · pico0h6h9h12h15h18h23h337
🔁 3 novos · 1 pararam vs 2026-06-29 14:35 · 18h atrás
👥 32 clientes atingidos · 10 em 3+ ambientes quem e onde

🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)

"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).

Dev (eng-develop) · 2 grupos · 504 hits
Homolog/UAT · 1 grupo · 10 hits
Demo/trial · 1 grupo · 381 hits
🏷 Risco por versão taxa por cliente

Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.

VersãoLinhagemErros (não-ruído)ClientesTaxa/cliente
16.4.016.4.x8921892 amostra fraca
16.3.2516.3.x1.8383947.1
16.3.2416.3.x50150 amostra fraca
16.3.2216.3.x212 amostra fraca
16.3.916.3.x2161216 amostra fraca
15.4.1615.4.x111 amostra fraca
15.4.1115.4.x1571157 amostra fraca
14.8.414.8.x616 amostra fraca
📦 Carga por cliente (volume) top por volume

Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (60 de 162 ambientes afetados em 72h). Internos e máquinas de dev fora.

edenred
483/72h
qualicorp
225/72h
agibank
216/72h
dattos (BTG)
157/72h
veneza
50/72h
vwfs
49/72h
sales
48/72h
yamaha
47/72h
mrsdp
36/72h
bayer
31/72h
ccr
30/72h
gaspar
20/72h
🛰 Frota — versão por cliente 47 clientes

Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.

16.4.0
1 cliente
16.3.25 ★
39 clientes
16.3.24 ★
1 cliente
16.3.22 ★
1 cliente
16.3.9 ★
1 cliente
15.4.16
1 cliente
15.4.11
1 cliente
15.4.4
1 cliente
14.8.4
1 cliente
★ = versão de produção mais comum (16.3.x)atrásna linhaà frente
ver por cliente (47)
ClienteVersão dominanteTambém vistaAtraso?
app14.8.4⚠ versão antiga
dattos-prod.titulo.net15.4.4⚠ versão antiga
dattos (BTG)15.4.11⚠ versão antiga
dattos-uat (BTG)15.4.16⚠ versão antiga
agibank16.3.9✓ atual
ifoodcorp16.3.22✓ atual
vwfs16.3.24✓ atual
123milhas16.3.25✓ atual
ache16.3.25✓ atual
allcare16.3.25✓ atual
atlas16.3.25✓ atual
bayer16.3.25✓ atual
brpartners16.3.25✓ atual
bs216.3.25✓ atual
ccr16.3.25✓ atual
cea16.3.25✓ atual
celcoin16.3.25✓ atual
cervejariacidadeimperial16.3.25✓ atual
cobasi16.3.25✓ atual
colgate16.3.25✓ atual
conciliadorrm16.3.25✓ atual
csf-qa16.3.25✓ atual
edenred16.3.25✓ atual
embarca16.3.25✓ atual
flagship16.3.25✓ atual
grupomodenaesilva16.3.25✓ atual
holambracoop16.3.25✓ atual
ipiranga16.3.25✓ atual
kryptonbpo16.3.25✓ atual
laponia16.3.25✓ atual
martins16.3.25✓ atual
mrsdp16.3.25✓ atual
natura16.3.25✓ atual
nutrien16.3.25✓ atual
operafidc16.3.25✓ atual
orizon16.3.25✓ atual
pirelli_csa16.3.25✓ atual
protege16.3.25✓ atual
qualicorp16.3.25✓ atual
sales16.3.25✓ atual
simpaul16.3.25✓ atual
solinftec16.3.25✓ atual
travelex16.3.25✓ atual
veneza16.3.25✓ atual
yamaha16.3.25✓ atual
zaffari16.3.25✓ atual
gaspar16.4.0↑ pré-lançamento
🗂 26 grupos · fonte de investigação — ordenada por volume 72h · filtrável por origem

Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.

#ClassificaçãoTipo de erroErroSistemaCliente principalNº amb.AmbientesVersões24h72hTendência
1AcompanharFalha de conexão do pipeline com o servidor de mensagens (tempo esgotado)[CALLBACK_HTTP_ERROR] correlation_id=06995a13-59d9-4ef5-acf9-000915882c2e…PipelineNoWebsite8other, prod, eng-internal16.3.25, 16.4.0335798▲ 57%
2Acompanhar Falha no serviço de Consulta (motor de dados)Exception in ASGI application + Exception Group Traceback (most recent call…Querydattos-data-engine-query-aws-16-36other16.3.25, 16.4.0234654— sem mudança
3Precisa de açãoExecução de fluxo: parte não roda por status, parte falha ao chamar o pipelineInvalidOperationException: [SchedulePolling] Error processing rule 26 for…Backagibank33prod, other, eng-internal, local, dev, demo15.4.11, 16.3.22271381— sem mudança
4AcompanharErro de código (parâmetro nulo)ArgumentNullException: Value cannot be null. Parameter name: source Value…Backedenred6prod, eng-internal, local16.3.25, 16.4.04314— sem mudança
5Sem impactoGateway/serviço novo falhandosession-init call failed for user=snguser host= Traceback (most recent call…Dattos-GatewayNoWebsite1other16.4.05257▼ 37%
6AcompanharFalha de storage externoFailed to process the job '723758': an exception occurred. An object or…Backqualicorp4prod14.8.4, 16.3.25220226— sem mudança
7Precisa de açãoErro de banco/SQL (conciliação)SqlException: Failed to process the job '2020': an exception occurred. An…Backagibank10prod, other, local15.4.11, 16.3.24103125— sem mudança
8AcompanharFalha ao enviar requisição ao motor de dadosHttpRequestException: IO Error: No files found that match the pattern…Backedenred12prod, eng-internal, dev16.3.24, 16.3.2571123▼ 28%
9Precisa de açãoErro de tela no controle de licença (propriedade indefinida)FrontException: An API key with the description provided already exists. An…Frontveneza13prod, eng-internal16.3.24, 16.3.256985— sem mudança
10Acompanhar Falha transitória de importação (banco)NpgsqlException: Erro durante importação ID 2472878 Exception while reading…Backagibank5prod15.4.11, 16.3.25673— sem mudança
11AcompanharFalha EF/DB (interno)EntityException: Failed to execute polling task. The underlying provider…Backsergio3prod16.3.24, 16.4.06063▲ 271%
12AcompanharPasta de importação fora da configuração (autorização)AuthorizationException: A pasta atual não é válida de acordo com as pastas…Backedenred1prod16.3.25056▼ 32%
13AcompanharFalha de envio de e-mail (limite do servidor)SmtpException: Erro ao enviar e-mail #210712. Service not available, closing…Backdattos (BTG)1prod15.4.113651— sem mudança
14AcompanharFalha ao ler do banco (EF/DB)EntityCommandExecutionException: An error occurred while reading from the…Backedenred10prod15.4.11, 16.3.242538— sem mudança
15Acompanhar Erro de código (referência nula) na amostraNullReferenceException: Failed to process the job '10343628': an exception…Backsales8prod15.4.11, 16.3.241936▼ 22%
16AcompanharAgente de IA de SQL indisponível e erros de sintaxe no ETLBusinessException: datasource/from-file failed (analysisId=11) Agent service…Backveneza5prod, eng-internal16.3.24, 16.3.253031▼ 33%
17AcompanharPasta de importação (SFTP) não encontradaDirectoryNotFoundException: Could not find a part of the path…Backccr1prod16.3.251230— sem mudança
18AcompanharArquivo de importação ausente no armazenamentoFileNotFoundException: File not found on storage Ttl. Details: FileName…Backdattos (BTG)1prod15.4.111018— sem mudança
19AcompanharFalha ao confirmar arquivo no armazenamento (tempo esgotado)TaskCanceledException: [SetFileStatusAsync] Failed to set file status for…Backcsf-qa1prod16.3.251818— sem mudança
20AcompanharResposta inválida do motor de dados (503)JsonReaderException: DataEngine returned non-parseable JSON on route…Backsales4prod, eng-internal16.3.25, 16.4.0411▼ 66%
21AcompanharErro de validação (e-mail sem destinatário)ArgumentException: Erro ao enviar e-mail #210720. Destinatário do e-mail não…Backdattos (BTG)3prod, eng-internal, hom15.4.11, 15.4.16710— sem mudança
22AcompanharDependencyResolutionException (Back)DependencyResolutionException: An exception was thrown while activating…BackNoWebsite1other16.3.2566novo
23Precisa de açãoHttpException (Back)HttpException: An error occurred while communicating with the remote host…Backeng-release-fix3eng-internal, prod16.3.25, 16.4.066▲ 50%
24Acompanhar ComponentNotRegisteredException (Back)ComponentNotRegisteredException: The requested service 'FlatFile…Backinternal1local16.4.033novo
25AcompanharSsrfException (Back)SsrfException: The URL 'https://sftp://transfer.dattos.com.br' was blocked by…Backeng-release-fix1eng-internal16.4.033novo
26Acompanhar Conciliação: base temporária aberta em modo somente-leitura (DuckDB)Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"…Pipeline+Matchingedenred2prod, eng-internal16.3.25, 16.4.023▲ 50%
❓ Ajuda — como ler este painel · seções que ligam quando a coleta acumular dado
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
  • Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
  • Acompanhar ainda não atinge cliente, ou já está diminuindo.
  • Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
  • Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.

"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.

Símbolos
  • 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
  • 🔗 N incidente consolidado de N erros da mesma raiz.
  • 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
  • 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
  • em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
  • NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor

vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.

⏱ Horizonte: comparações cobrem ~7 dias (14 snapshots de 12/12h); não há base "vs semana/mês passado" nem horário exato de última ocorrência. 🏷 Tipo de erro é classificado por IA (pode errar — confirme no Loki). Contagens podem ser piso quando a consulta satura.