QA Telemetry · 2026-06-29 14:35

Janela 24h/72h · Ambientes afetados 53/162 · bruto 24h 1.121 · 72h 3.425 · 72 queries · anterior 2026-06-29 08:33 (6h atrás) · snapshot 14:35 · copiar versão Slack/Jira ↗

🔴 5 pedem ação · 5 crescendo
🔴5 problemas pedindo ação, 5 crescendo · 2 pode ter surgido numa versão recente. Comece por: FrontException: An API key with the description provided already….
Precisa de ação
385 novo
5 problemas
◆ novo nesta leitura · estimativa
pico 930 · 15 snapshots
Acompanhar
699 ▲ 42% subindo
16 problemas
Sem impacto
33 ▲ 200% subindo
dev / infra
Clientes afetados
28 — estável
de 162

📈 Tendência — ~7 dias · está piorando ou melhorando?

01.6933.38522/06 11h: 2.066 erros22/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros22/0624/0625/0627/0628/0629/06
Último snapshot: 385 erros que pedem ação, 699 para acompanhar, 33 sem impacto.
Precisa de açãoAcompanharSem impacto
📅 desde 22/06 11h · 15 leituras (uma a cada ~12h) · eixo Y = erros/24h
ver linha do tempo detalhada — data e hora de cada leitura
01.6933.38522/06 11h: 2.066 erros22/06 16h: 2.856 erros23/06 08h: 3.385 erros24/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros22/06 11h22/06 16h23/06 08h24/06 09h24/06 14h25/06 08h25/06 14h26/06 09h26/06 14h27/06 12h27/06 14h28/06 10h28/06 14h29/06 08h29/06 14h

🧩 Saúde por módulo — qual área dói mais (24h)

🔥 Frontend · Tela/UI média
76/24h
Analytics · Automação de fluxo alta
198/24h
Persistência · Banco da plataforma (SQL Server) média
84/24h
ver mais 8 módulos
ETL · Importação média
44/24h
Notificação · E-mail alta
27/24h
Conciliação · Casamento de transações média
471/24h
Plataforma · Mensageria (Rabbit) média
19/24h
Processos · Cópia de arquivo alta
12/24h
Integrações · Storage/SFTP média
14/24h
Fechamento · Processo de fechamento alta
3/24h
Indeterminado baixa
136/24h
Módulo derivado da assinatura do erro (regra auditável; passe o mouse pra ver). alta namespace específico · média wrapper/texto · baixa só origem. Ordenado por severidade; a barra mede volume.
🎯 Resolver primeiro — o que consertar agora, por prioridade: versão nova → crescendo → vários ambientes → volume
FrontException: An API key with the description provided already…ESCALANDO ·?🔍 v16.3.9? (possível regressão da versão recente — a confirmar)🐞 corrigir bug🕘 Pico de logs às 11h▲ 47% subindocrônico (visto em 15 de 15 snapshots)
76/24h94 · 72h
Módulo Frontend · Tela/UI · origem Front · 17 clientes (veneza, vwfs, edenred, +2) · em alta · vs ontem ▲7500% subindo · vs ~7d ▲69% subindo · apareceu pela 1ª vez há 7 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.25 · 63% (+4)
Parte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.9 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece na interface (frontend), ao renderizar telas com dados ainda não carregados.
👁 O que o cliente vêParte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
🤔 Causa provávelErro de JavaScript "Cannot read properties of undefined" lendo propriedade de objeto indefinido, espalhado por mais de 30 clientes e em alta (~+27% vs anterior). Provável dado ausente/assíncrono não tratado em algum componente. confiança média
0h–1h · 6 erros · 8% do dia1h–2h · 0 erros · 0% do dia2h–3h · 4 erros · 5% do dia3h–4h · 2 erros · 3% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 2 erros · 3% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 7 erros · 9% do dia · horário comercial10h–11h · 6 erros · 8% do dia · horário comercial11h–12h · 25 erros · 33% do dia · pico12h–13h · 5 erros · 7% do dia · horário comercial13h–14h · 19 erros · 25% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 0 erros · 0% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 11h — provável impacto real de cliente.
BusinessException: datasource/from-file failed (analysisId=11) Agent…ESCALANDO ·?🔍 v16.3.22? (possível regressão da versão recente — a confirmar)🔬 investigar🕘 Pico de logs às 10h▲ 70% subindocrônico (visto em 15 de 15 snapshots)
26/24h46 · 72h
Módulo Indeterminado · origem Back · 9 clientes (veneza, colgate, gaspar, +1) · em alta · vs ~7d ▲420% subindo · apareceu pela 1ª vez há 7 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.25 · 52% (+3)
A geração assistida de SQL falha; a transformação não conclui.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.22 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece na preparação de dados, quando o ETL usa o agente de IA para completar/gerar SQL.
👁 O que o cliente vêA geração assistida de SQL falha; a transformação não conclui.
🤔 Causa provávelO serviço do agente de SQL respondeu indisponível (503) e há casos de sintaxe SQL inválida. Misto de indisponibilidade externa e erro de regra. Confirme no Loki. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 0 erros · 0% do dia · horário comercial10h–11h · 19 erros · 73% do dia · pico11h–12h · 0 erros · 0% do dia · horário comercial12h–13h · 4 erros · 15% do dia · horário comercial13h–14h · 2 erros · 8% do dia · horário comercial14h–15h · 1 erro · 4% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 0 erros · 0% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 10h — provável impacto real de cliente.
🧵 traceId: 44c5a996-01b8-49cd-90d… ↗ · 21401f8d-be48-409e-ba6… ↗ · a7dc15bf-14fa-4a96-999… ↗
↳ at Dattos.Platform.Services.Etls.Jobs.EtlImportSampleJob.<ImportSampleAsync>d__16.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.Services\Etls\Jobs\
NullReferenceException: Failed to process the job '10343628': an…ESCALANDO ·?↩ histórico de escape🐞 corrigir bug🕘 Pico de logs às 10h— sem mudançacrônico (visto em 15 de 15 snapshots)
18/24h46 · 72h
Módulo ETL · Importação · origem Back · 7 clientes (allcare, sales, edenred, +3) · constante · vs ontem ▲100% subindo · vs ~7d ▲50% subindo · apareceu pela 1ª vez há 7 dias
priorizado por: crescendo agora
versão16.3.25 · 52% (+2)
ver diagnóstico
↩ Histórico da área4 escapes catalogados em ETL: PRD-8903, PRD-8965, Pipeline-storage, CB-1 — matriz de escape ↗. Construtor/ETL Turbo AI é a área mais frágil catalogada (boilerplate vs banner, resumo truncado, agente PDF transiente); saturação de staging DuckDB sob volume alto. Histórico da área, a confirmar — não é veredito deste erro.
📋 Regras do móduloetl-business-rules.md ↗ — leia as regras de negócio de ETL pra confirmar qual se aplica
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 1 erro · 6% do dia · horário comercial10h–11h · 5 erros · 28% do dia · pico11h–12h · 2 erros · 11% do dia · horário comercial12h–13h · 0 erros · 0% do dia · horário comercial13h–14h · 2 erros · 11% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 3 erros · 17% do dia · horário comercial18h–19h · 5 erros · 28% do dia19h–20h · 0 erros · 0% do dia20h–21h · 0 erros · 0% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 10h — provável impacto real de cliente.
🧵 traceId: 78ca6da6-ad3c-4562-bf8… ↗ · a677e6f2-fd69-4af4-997… ↗ · 7b98aef7-6994-40d2-bf1… ↗
↳ at Dattos.Platform.Auth.Saml.Certificate.StringToByteArray(String st) in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.Auth.Saml\Certificate.cs:line 37

+ 2 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).

📊 Gráficos — toda a análise visual num lugar só. Tudo derivado dos snapshots gravados, mesma régua da Triagem.
🎯 O que atacar — impacto — quem dói, em quem, e quantos itens pedem ação

🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 471) · cor = balde de ação

471/24h
👤 mais impactado: dattos-data-engine-query-aws-16-3 · 56% · espalhado por 7 ambientes
181/24h
👤 mais impactado: yamaha · 17% · espalhado por 35 ambientes
97/24h
👤 mais impactado: edenred · 19% · espalhado por 14 ambientes
84/24h
👤 mais impactado: agibank · 70% · espalhado por 10 ambientes
76/24h
👤 mais impactado: veneza · 23% · espalhado por 17 ambientes
26/24h
👤 mais impactado: agibank · 78% · espalhado por 5 ambientes
26/24h
👤 mais impactado: veneza · 41% · espalhado por 9 ambientes
25/24h
👤 mais impactado: edenred · 39% · espalhado por 11 ambientes
23/24h
👤 mais impactado: dattos (BTG) · 100% das ocorrências · v15.4.11
19/24h
👤 mais impactado: NoWebsite · 88% · espalhado por 9 ambientes
Precisa de açãoAcompanharSem impacto
A cabeça da distribuição costuma responder por boa parte da carga acionável; a cor mostra o balde de ação. Cliente e percentual vêm da coluna de ambiente do snapshot. Detalhe por linha na aba Tabela ↗.

📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 555)

edenred
555/72h
qualicorp
228/72h
agibank
183/72h
dattos (BTG)
142/72h
yamaha
54/72h
vwfs
53/72h
sales
50/72h
veneza
48/72h
holambracoop
38/72h
ccr
30/72h
gaspar
28/72h
colgate
20/72h
Volume de erros não-ruído por cliente de produção (top 12); a cabeça domina e o resto é cauda longa. Detalhe por cliente na aba Contexto ↗.

🧭 Os 24 itens por classificação — contagem de itens (não de volume)

5 Precisa de ação16 Acompanhar3 Sem impacto
Poucos itens pedem ação; a maioria é monitoramento. Volume ≠ nº de itens — um único item pode somar milhares de ocorrências. Lista completa na aba Tabela ↗.
📈 Tendência no tempo — está piorando ou melhorando, e em que horário

🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%

22/06 11h · 83% ação · 12% acompanhar · 5% sem impacto22/06 16h · 78% ação · 18% acompanhar · 4% sem impacto23/06 08h · 33% ação · 67% acompanhar · 0% sem impacto24/06 09h · 48% ação · 52% acompanhar · 0% sem impacto24/06 14h · 41% ação · 58% acompanhar · 1% sem impacto25/06 08h · 38% ação · 61% acompanhar · 1% sem impacto25/06 14h · 36% ação · 64% acompanhar · 0% sem impacto26/06 09h · 44% ação · 55% acompanhar · 1% sem impacto26/06 14h · 44% ação · 55% acompanhar · 1% sem impacto27/06 12h · 26% ação · 66% acompanhar · 9% sem impacto27/06 14h · 19% ação · 66% acompanhar · 15% sem impacto28/06 10h · 34% ação · 38% acompanhar · 28% sem impacto28/06 14h · 46% ação · 29% acompanhar · 24% sem impacto29/06 08h · 0% ação · 98% acompanhar · 2% sem impacto29/06 14h · 34% ação · 63% acompanhar · 3% sem impacto22/06agora
Precisa de açãoAcompanharSem impacto
topo em Precisa de ação: FrontException: An API key with the… 76/24htopo em Acompanhar: Exception in ASGI application +… 471/24htopo em Sem impacto: EntityCommandExecutionException: An… 25/24h
Não é o volume (esse está na Tendência, na aba Triagem) — é a mistura: que fração de cada leitura pedia ação. Passe o mouse numa coluna para ver as frações. Os campeões refletem a leitura atual (o topo por balde de leituras passadas não é gravado).

🕘 Ritmo do dia — maior ofensor — FrontException: An API key with the… por hora (BRT, 24h)

horário comercial 9–180h–1h · 6 erros · 8% do dia · fora do expediente1h–2h · 0 erros · 0% do dia · fora do expediente2h–3h · 4 erros · 5% do dia · fora do expediente3h–4h · 2 erros · 3% do dia · fora do expediente4h–5h · 0 erros · 0% do dia · fora do expediente5h–6h · 0 erros · 0% do dia · fora do expediente6h–7h · 2 erros · 3% do dia · fora do expediente7h–8h · 0 erros · 0% do dia · fora do expediente8h–9h · 0 erros · 0% do dia · fora do expediente9h–10h · 7 erros · 9% do dia · horário comercial10h–11h · 6 erros · 8% do dia · horário comercial11h–12h · 25 erros · 33% do dia · pico12h–13h · 5 erros · 7% do dia · horário comercial13h–14h · 19 erros · 25% do dia · horário comercial14h–15h · 0 erros · 0% do dia · horário comercial15h–16h · 0 erros · 0% do dia · horário comercial16h–17h · 0 erros · 0% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 0 erros · 0% do dia · fora do expediente19h–20h · 0 erros · 0% do dia · fora do expediente20h–21h · 0 erros · 0% do dia · fora do expediente21h–22h · 0 erros · 0% do dia · fora do expediente22h–23h · 0 erros · 0% do dia · fora do expediente23h–24h · 0 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h25
A faixa 9–18h é o horário de operação. Concentração no comercial é assinatura de uso real de cliente (não tarefa agendada); fora dele, costuma ser infra/deploy/agendado. Perfil horário só do maior ofensor deste snapshot.
👀 Acompanhar & frota — o que vigiar e o denominador de risco por versão

🛰 Saúde da frota — 49 clientes por proximidade da versão de produção (16.3.x)

44 na linha (16.3.x)3 atrás2 à frente
É o denominador que normaliza o risco por versão. Os 3 atrás (app 14.8.4, dattos (BTG) 15.4.11, dattos-uat (BTG) 15.4.16) podem carregar bug já corrigido. Detalhe por cliente na aba Contexto ↗.
👀 Contexto — acompanhar · ritmo do dia · o que mudou · clientes afetados (investigação secundária)
👀 16 p/ acompanhar · 3 sem impacto housekeeping — não atinge cliente

👀 Acompanhar — ainda não atinge cliente, ou já diminuindo

NpgsqlException: Erro durante importação ID… · Back · recorrente, sem crescer · ⚠ só temos o número, sem diagnóstico26/24h
[CALLBACK_HTTP_ERROR] correlation_id=06995a13… · Pipeline · diminuindo19/24h
ArgumentException: Erro ao enviar e-mail… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico4/24h
HttpException: An error occurred while… · Back · crescendo · ⚠ só temos o número, sem diagnóstico4/24h
Error: IO Error: Cannot open database… · Pipeline+Matching · diminuindo0/24h
JsonReaderException: DataEngine returned… · Back · recorrente, sem crescer9/24h
ArgumentNullException: Value cannot be null… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico3/24h
DirectoryNotFoundException: Could not find a… · Back · recorrente, sem crescer12/24h
TaskCanceledException: [SetFileStatusAsync]… · Back · recorrente, sem crescer0/24h
AuthorizationException: A pasta atual não é… · Back · recorrente, sem crescer0/24h
Passa para Precisa de ação se voltar a crescer e atingir 3 ou mais ambientes.

🩹 Ruído — o que vale consertar na fonte

Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 1.121 erros).

25/24h · 2%
consertar a fonte · 👤 sem dono · definir
session-init call failed for user=snguser… · Dattos-Gateway · infraestrutura sem cliente
8/24h · 1%
consertar a fonte · 👤 sem dono · definir
Consertando o maior (EntityCommandExecutionExceptio…): o painel de 24h cairia de 1.121 para ~1.096.
🕘 Pico de erros às 10h uso real (9–18) vs infra/agendado

Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).

horário comercial 9–180h–1h · 8 erros · 1% do dia · fora do expediente1h–2h · 1 erro · 0% do dia · fora do expediente2h–3h · 5 erros · 0% do dia · fora do expediente3h–4h · 32 erros · 3% do dia · fora do expediente4h–5h · 11 erros · 1% do dia · fora do expediente5h–6h · 14 erros · 1% do dia · fora do expediente6h–7h · 42 erros · 4% do dia · fora do expediente7h–8h · 31 erros · 3% do dia · fora do expediente8h–9h · 61 erros · 6% do dia · fora do expediente9h–10h · 68 erros · 6% do dia · horário comercial10h–11h · 140 erros · 13% do dia · pico11h–12h · 119 erros · 11% do dia · horário comercial12h–13h · 140 erros · 13% do dia · horário comercial13h–14h · 96 erros · 9% do dia · horário comercial14h–15h · 85 erros · 8% do dia · horário comercial15h–16h · 19 erros · 2% do dia · horário comercial16h–17h · 6 erros · 1% do dia · horário comercial17h–18h · 90 erros · 8% do dia · horário comercial18h–19h · 102 erros · 9% do dia · fora do expediente19h–20h · 3 erros · 0% do dia · fora do expediente20h–21h · 11 erros · 1% do dia · fora do expediente21h–22h · 1 erro · 0% do dia · fora do expediente22h–23h · 1 erro · 0% do dia · fora do expediente23h–24h · 3 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h140
🔁 1 novos · 1 pararam vs 2026-06-29 08:33 · 6h atrás
✅ Resolvidos (provável) — pararam de aparecer e antes pediam atenção. Parou não é o mesmo que corrigido: confirme a causa.
·
−3
1 de 1 sem card identificado — é o esperado: a maioria some por mudança de uso ou de dado, não por correção. Ausência de card não prova nada nos dois sentidos.
⊖ Que pararam

Nenhum.

👥 28 clientes atingidos · 10 em 3+ ambientes quem e onde

🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)

"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).

Homolog/UAT · 2 grupos · 117 hits
🏷 Risco por versão taxa por cliente

Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.

VersãoLinhagemErros (não-ruído)ClientesTaxa/cliente
16.4.016.4.x5882294 amostra fraca
16.3.2516.3.x1.5863348.1
16.3.2416.3.x202728.9
16.3.2216.3.x239379.7
16.3.2016.3.x2
16.3.916.3.x1841184 amostra fraca
15.4.1615.4.x212 amostra fraca
15.4.1115.4.x1421142 amostra fraca
14.8.414.8.x818 amostra fraca
📦 Carga por cliente (volume) top por volume

Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (63 de 162 ambientes afetados em 72h). Internos e máquinas de dev fora.

edenred
555/72h
qualicorp
228/72h
agibank
183/72h
dattos (BTG)
142/72h
yamaha
54/72h
vwfs
53/72h
sales
50/72h
veneza
48/72h
holambracoop
38/72h
ccr
30/72h
gaspar
28/72h
colgate
20/72h
🛰 Frota — versão por cliente 49 clientes

Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.

16.4.0
2 clientes
16.3.25 ★
33 clientes
16.3.24 ★
7 clientes
16.3.22 ★
3 clientes
16.3.9 ★
1 cliente
15.4.16
1 cliente
15.4.11
1 cliente
14.8.4
1 cliente
★ = versão de produção mais comum (16.3.x)atrásna linhaà frente
ver por cliente (49)
ClienteVersão dominanteTambém vistaAtraso?
app14.8.4⚠ versão antiga
dattos (BTG)15.4.11⚠ versão antiga
dattos-uat (BTG)15.4.16⚠ versão antiga
agibank16.3.9✓ atual
ifoodcorp16.3.22✓ atual
martins16.3.2216.3.25✓ atual
uniasselvi16.3.22✓ atual
kryptonbpo16.3.2416.3.25✓ atual
laponia16.3.24✓ atual
opea16.3.2416.3.25✓ atual
sebraemg16.3.24✓ atual
simpaul16.3.2416.3.25✓ atual
vwfs16.3.24✓ atual
yamaha16.3.2416.3.25✓ atual
cea16.3.2516.3.20✓ atual
brpartners16.3.2516.3.22✓ atual
qualicorp16.3.2516.3.22✓ atual
sales16.3.2516.3.22✓ atual
zaffari16.3.2516.3.22✓ atual
allcare16.3.2516.3.24✓ atual
cervejariacidadeimperial16.3.2516.3.24✓ atual
colgate16.3.2516.3.24✓ atual
edenred16.3.2516.3.24✓ atual
natura16.3.2516.3.24✓ atual
operafidc16.3.2516.3.24✓ atual
travelex16.3.2516.3.24✓ atual
123milhas16.3.25✓ atual
ache16.3.25✓ atual
atlas16.3.25✓ atual
bayer16.3.25✓ atual
bs216.3.25✓ atual
ccr16.3.25✓ atual
celcoin16.3.25✓ atual
cobasi16.3.25✓ atual
conciliadorrm16.3.25✓ atual
csf-qa16.3.25✓ atual
embarca16.3.25✓ atual
flagship16.3.25✓ atual
grupomodenaesilva16.3.25✓ atual
holambracoop16.3.25✓ atual
ipiranga16.3.25✓ atual
nutrien16.3.25✓ atual
orizon16.3.25✓ atual
pirelli_csa16.3.25✓ atual
protege16.3.25✓ atual
solinftec16.3.25✓ atual
veneza16.3.25✓ atual
gaspar16.4.0↑ pré-lançamento
local-denis16.4.0↑ pré-lançamento
🗂 24 grupos · fonte de investigação — ordenada por volume 72h · filtrável por origem

Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.

#ClassificaçãoTipo de erroErroSistemaCliente principalNº amb.AmbientesVersões24h72hTendência
1Acompanhar Falha no serviço de Consulta (motor de dados)Exception in ASGI application + Exception Group Traceback (most recent call…Querydattos-data-engine-query-aws-16-37other16.3.25, 16.4.0471717— sem mudança
2AcompanharFalha de conexão do pipeline com o servidor de mensagens (tempo esgotado)[CALLBACK_HTTP_ERROR] correlation_id=06995a13-59d9-4ef5-acf9-000915882c2e…PipelineNoWebsite9other, prod, eng-internal, local16.3.25, 16.4.019507— sem mudança
3Sem impactoGateway/serviço novo falhandosession-init call failed for user=snguser host= Traceback (most recent call…Dattos-GatewayNoWebsite1other16.4.08405— sem mudança
4AcompanharErro de código (parâmetro nulo)ArgumentNullException: Value cannot be null. Parameter name: source Value…Backedenred4prod, eng-internal16.3.24, 16.3.253376▼ 24%
5Precisa de açãoExecução de fluxo: parte não roda por status, parte falha ao chamar o pipelineInvalidOperationException: [SchedulePolling] Error processing rule 26 for…Backyamaha35prod, other, eng-internal, dev, local15.4.11, 16.3.20181327— sem mudança
6AcompanharFalha de storage externoFailed to process the job '723758': an exception occurred. An object or…Backqualicorp2prod14.8.4, 16.3.224230— sem mudança
7AcompanharFalha ao enviar requisição ao motor de dadosHttpRequestException: IO Error: No files found that match the pattern…Backedenred14prod, eng-internal, dev, local16.3.22, 16.3.2497170▼ 30%
8Precisa de açãoErro de banco/SQL (conciliação)SqlException: Failed to process the job '2020': an exception occurred. An…Backagibank10prod, other, hom, local15.4.11, 15.4.1684106— sem mudança
9Precisa de açãoErro de tela no controle de licença (propriedade indefinida)FrontException: An API key with the description provided already exists. An…Frontveneza17prod, eng-internal16.3.22, 16.3.247694▲ 47%
10AcompanharPasta de importação fora da configuração (autorização)AuthorizationException: A pasta atual não é válida de acordo com as pastas…Backedenred2prod, eng-internal16.3.24, 16.3.25082— sem mudança
11Acompanhar Falha transitória de importação (banco)NpgsqlException: Erro durante importação ID 2472878 Exception while reading…Backagibank5prod15.4.11, 16.3.252677— sem mudança
12AcompanharFalha de envio de e-mail (limite do servidor)SmtpException: Erro ao enviar e-mail #210712. Service not available, closing…Backdattos (BTG)1prod15.4.112352▲ 27%
13Precisa de açãoAgente de IA de SQL indisponível e erros de sintaxe no ETLBusinessException: datasource/from-file failed (analysisId=11) Agent service…Backveneza9prod, eng-internal, local16.3.22, 16.3.242646▲ 70%
14Precisa de ação Erro de código (referência nula) na amostraNullReferenceException: Failed to process the job '10343628': an exception…Backallcare7prod15.4.11, 16.3.241846— sem mudança
15Sem impactoFalha ao ler do banco (EF/DB)EntityCommandExecutionException: An error occurred while reading from the…Backedenred11prod, local16.3.24, 16.3.252541— sem mudança
16AcompanharResposta inválida do motor de dados (503)JsonReaderException: DataEngine returned non-parseable JSON on route…Backeng-release-fix5eng-internal, dev, prod16.3.25, 16.4.0932— sem mudança
17AcompanharPasta de importação (SFTP) não encontradaDirectoryNotFoundException: Could not find a part of the path…Backccr1prod16.3.251230— sem mudança
18AcompanharFalha ao confirmar arquivo no armazenamento (tempo esgotado)TaskCanceledException: [SetFileStatusAsync] Failed to set file status for…Backcsf-qa1prod16.3.25020— sem mudança
19AcompanharArquivo de importação ausente no armazenamentoFileNotFoundException: File not found on storage Ttl. Details: FileName…Backdattos (BTG)1prod15.4.111018— sem mudança
20AcompanharFalha EF/DB (interno)EntityException: Failed to execute polling task. The underlying provider…Backvwfs3prod16.3.24, 16.4.01717▲ 183%
21AcompanharErro de validação (e-mail sem destinatário)ArgumentException: Erro ao enviar e-mail #210720. Destinatário do e-mail não…Backdattos (BTG)4prod, eng-internal, hom15.4.11, 15.4.16411▼ 27%
22AcompanharHttpException (Back)HttpException: An error occurred while communicating with the remote host…Backtravelex2prod16.3.2544novo
23Sem impactoFalha ao identificar o ambiente do cliente na requisiçãoHttpResponseException: Processing of the HTTP request resulted in an…BackNoWebsite1other16.4.004— sem mudança
24Acompanhar Conciliação: base temporária aberta em modo somente-leitura (DuckDB)Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"…Pipeline+Matchingedenred2prod, eng-internal16.3.25, 16.4.002▼ 50%
❓ Ajuda — como ler este painel · seções que ligam quando a coleta acumular dado
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
  • Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
  • Acompanhar ainda não atinge cliente, ou já está diminuindo.
  • Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
  • Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.

"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.

Símbolos
  • 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
  • 🔗 N incidente consolidado de N erros da mesma raiz.
  • 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
  • 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
  • em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
  • NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor

vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.

⏱ Horizonte: comparações cobrem ~7 dias (14 snapshots de 12/12h); não há base "vs semana/mês passado" nem horário exato de última ocorrência. 🏷 Tipo de erro é classificado por IA (pode errar — confirme no Loki). Contagens podem ser piso quando a consulta satura.