QA Telemetry · 2026-07-02 08:37

Janela 24h/72h · Ambientes afetados 66/161 · bruto 24h 2.486 · 72h 5.755 · 85 queries · anterior 2026-07-01 08:35 (1d atrás) · snapshot 08:37 · copiar versão Slack/Jira ↗

🔴 11 pedem ação · 11 crescendo
🔴11 problemas pedindo ação, 11 crescendo · 4 pode ter surgido numa versão recente. Comece por: Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.d….
Precisa de ação
1.192 ▲ 97% subindo
11 problemas
◆ novo nesta leitura · estimativa
pico 1.192 · 15 snapshots
Acompanhar
1.299 ▲ 19% subindo
21 problemas
Sem impacto
15 ▲ 150% subindo
dev / infra
Clientes afetados
28 ▼ 22% caindo
de 161

📈 Tendência — ~7 dias · está piorando ou melhorando?

01.2712.54124/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros30/06 08h: 1.559 erros01/07 08h: 1.705 erros02/07 08h: 2.506 erros24/0625/0627/0628/0630/0602/07
Último snapshot: 1.192 erros que pedem ação, 1.299 para acompanhar, 15 sem impacto.
Precisa de açãoAcompanharSem impacto
📅 desde 24/06 09h · 15 leituras (uma a cada ~12h) · eixo Y = erros/24h
ver linha do tempo detalhada — data e hora de cada leitura
01.2712.54124/06 09h: 2.381 erros24/06 14h: 2.382 erros25/06 08h: 2.141 erros25/06 14h: 2.007 erros26/06 09h: 2.541 erros26/06 14h: 2.370 erros27/06 12h: 1.826 erros27/06 14h: 1.686 erros28/06 10h: 922 erros28/06 14h: 612 erros29/06 08h: 504 erros29/06 14h: 1.117 erros30/06 08h: 1.559 erros01/07 08h: 1.705 erros02/07 08h: 2.506 erros24/06 09h24/06 14h25/06 08h25/06 14h26/06 09h26/06 14h27/06 12h27/06 14h28/06 10h28/06 14h29/06 08h29/06 14h30/06 08h01/07 08h02/07 08h

🧩 Saúde por módulo — qual área dói mais (24h)

🔥 Analytics · Automação de fluxo alta
599/24h
ETL · Importação média
120/24h
Frontend · Tela/UI média
92/24h
ver mais 8 módulos
Fechamento · Processo de fechamento alta
22/24h
Notificação · E-mail alta
222/24h
Integrações · Storage/SFTP média
249/24h
Persistência · Banco da plataforma (SQL Server) média
143/24h
Conciliação · Casamento de transações baixa
697/24h
Processos · Cópia de arquivo alta
17/24h
Plataforma · Mensageria (Rabbit) média
75/24h
Indeterminado baixa
255/24h
Módulo derivado da assinatura do erro (regra auditável; passe o mouse pra ver). alta namespace específico · média wrapper/texto · baixa só origem. Ordenado por severidade; a barra mede volume.
🎯 Resolver primeiro — o que consertar agora, por prioridade: versão nova → crescendo → vários ambientes → volume
Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.d…ESCALANDO ·?🔍 v16.3.25? (possível regressão da versão recente — a confirmar)↩ histórico de escape🐞 corrigir bug▲ 600% subindocrônico (visto em 13 de 15 snapshots)
24/24h28 · 72h
Módulo ETL · Carga de Análise (ETL) · origem Pipeline+Matching · Concentrado em 1 cliente: edenred (61% dos casos) · em alta · vs ontem ▲1100% subindo · vs ~7d ▲60% subindo · apareceu pela 1ª vez há 6 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.25 · 79% (+1)
O passo da conciliacao falha e o resultado pode nao ser gerado; o usuario ve a analise sem concluir.
ver diagnóstico e possível causa
🔍 suspeita · confiança média ainda não confirmado — pode ter começado em PRD-9149 (v16.3.25) · Conciliação/ETL — staging DuckDB. Erro "Cannot open database ... in read-only mode: database does not exist" casa com a assinatura do PR "open staging in read-only mode" (PRD-9149). Concentrado na versão 16.3.25 (79% das ocorrências em 72h), atingindo 6 clientes de produção. Recorrência após correção — confirmar antes de agir. Confirme no Loki antes de agir.
🧭 Onde aconteceAcontece na conciliacao/ETL Turbo, quando o motor abre a base temporaria (staging DuckDB) de um passo do fluxo.
👁 O que o cliente vêO passo da conciliacao falha e o resultado pode nao ser gerado; o usuario ve a analise sem concluir.
🤔 Causa provávelA base de staging é aberta em modo somente-leitura quando ainda não existe. Mesma assinatura do PRD-9149 (abrir staging em read-only). Concentrado na versão 16.3.25 (79% das ocorrências em 72h). Hipótese, confirmar no Loki, não veredito. confiança média
↩ Histórico da área4 escapes catalogados em ETL: PRD-8903, PRD-8965, Pipeline-storage, CB-1 — matriz de escape ↗. Construtor/ETL Turbo AI é a área mais frágil catalogada (boilerplate vs banner, resumo truncado, agente PDF transiente); saturação de staging DuckDB sob volume alto. Histórico da área, a confirmar — não é veredito deste erro.
📋 Regras do móduloetl-business-rules.md ↗ — leia as regras de negócio de ETL pra confirmar qual se aplica
FrontException: An API key with the description provided already…CRÔNICO🔍 v16.3.9? (possível regressão da versão recente — a confirmar)🐞 corrigir bug🕘 Pico de logs às 16h▲ 38% subindocrônico (visto em 15 de 15 snapshots)
92/24h282 · 72h
Módulo Frontend · Tela/UI · origem Front · 34 clientes (vwfs, afextyc, veneza, +1) · constante · vs ontem ▼24% caindo · vs ~7d ▼47% caindo · apareceu pela 1ª vez há 7 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.25 · 56% (+3)
Parte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.9 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
🧭 Onde aconteceAcontece na interface (frontend), ao renderizar telas com dados ainda não carregados.
👁 O que o cliente vêParte da tela quebra ou não exibe um valor; o usuário vê campo vazio ou comportamento estranho.
🤔 Causa provávelErro de JavaScript "Cannot read properties of undefined" lendo propriedade de objeto indefinido, espalhado por mais de 30 clientes e em alta (~+27% vs anterior). Provável dado ausente/assíncrono não tratado em algum componente. confiança média
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 2 erros · 2% do dia9h–10h · 7 erros · 7% do dia · horário comercial10h–11h · 9 erros · 9% do dia · horário comercial11h–12h · 4 erros · 4% do dia · horário comercial12h–13h · 13 erros · 13% do dia · horário comercial13h–14h · 4 erros · 4% do dia · horário comercial14h–15h · 1 erro · 1% do dia · horário comercial15h–16h · 9 erros · 9% do dia · horário comercial16h–17h · 19 erros · 19% do dia · pico17h–18h · 1 erro · 1% do dia · horário comercial18h–19h · 5 erros · 5% do dia19h–20h · 1 erro · 1% do dia20h–21h · 17 erros · 17% do dia21h–22h · 8 erros · 8% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 16h — provável impacto real de cliente.
ArgumentNullException: Value cannot be null. Parameter name: source…ESCALANDO ·?🔍 v16.3.24? (possível regressão da versão recente — a confirmar)🐞 corrigir bug🕘 Pico de logs às 10h▲ 70% subindocrônico (visto em 15 de 15 snapshots)
22/24h51 · 72h
Módulo Fechamento · Processo de fechamento · origem Back · 11 clientes (cea, cmpc, conciliadorrm, +2) · constante · vs ontem ▼12% caindo · vs ~7d ▲267% subindo · apareceu pela 1ª vez há 7 dias
priorizado por: suspeita de versão recente (hipótese)
versão16.3.25 · 84% (+2)
ver diagnóstico e possível causa
🔍 suspeita de versão concentrado na versão 16.3.24 e crescendo — investigar o que mudou nessa versão (hipótese a confirmar). ver só nesta versão ↗ (abre o Loki em nova aba)
0h–1h · 0 erros · 0% do dia1h–2h · 0 erros · 0% do dia2h–3h · 0 erros · 0% do dia3h–4h · 0 erros · 0% do dia4h–5h · 0 erros · 0% do dia5h–6h · 0 erros · 0% do dia6h–7h · 0 erros · 0% do dia7h–8h · 0 erros · 0% do dia8h–9h · 0 erros · 0% do dia9h–10h · 1 erro · 5% do dia · horário comercial10h–11h · 7 erros · 32% do dia · pico11h–12h · 0 erros · 0% do dia · horário comercial12h–13h · 0 erros · 0% do dia · horário comercial13h–14h · 1 erro · 5% do dia · horário comercial14h–15h · 4 erros · 18% do dia · horário comercial15h–16h · 1 erro · 5% do dia · horário comercial16h–17h · 3 erros · 14% do dia · horário comercial17h–18h · 0 erros · 0% do dia · horário comercial18h–19h · 0 erros · 0% do dia19h–20h · 0 erros · 0% do dia20h–21h · 5 erros · 23% do dia21h–22h · 0 erros · 0% do dia22h–23h · 0 erros · 0% do dia23h–24h · 0 erros · 0% do dia
0h9h18h23h
A maior parte dos erros ocorre no horário comercial (9–18h), com pico por volta das 10h — provável impacto real de cliente.
🧵 traceId: 68061529-481a-404b-9f9… ↗
↳ at Dattos.Platform.Services.BaseService`2.<DeleteAsync>d__13`1.MoveNext() in C:\jenkins-dev\workspace\dattos-recon-net_master\Dattos.Platform.Services\BaseService.cs:line 80

+ 8 que também pedem ação — abra a aba 🗂 Tabela (ordenada por volume).

📊 Gráficos — toda a análise visual num lugar só. Tudo derivado dos snapshots gravados, mesma régua da Triagem.
🎯 O que atacar — impacto — quem dói, em quem, e quantos itens pedem ação

🏆 Top ofensores por volume — com cliente mais impactado — 24h · eixo fixo (maior = 693) · cor = balde de ação

693/24h
👤 mais impactado: dattos-data-engine-query-aws-16-3 · 35% · espalhado por 8 ambientes
532/24h
👤 mais impactado: bayer · 21% · espalhado por 51 ambientes
214/24h
👤 mais impactado: qualicorp · 100% · espalhado por 3 ambientes
185/24h
👤 mais impactado: eng-release-fix · 88% · espalhado por 6 ambientes
151/24h
👤 mais impactado: allcare · 19% · espalhado por 21 ambientes
143/24h
👤 mais impactado: agibank · 74% · espalhado por 16 ambientes
92/24h
👤 mais impactado: vwfs · 30% · espalhado por 34 ambientes
86/24h
👤 mais impactado: allcare · 20% · espalhado por 16 ambientes
75/24h
👤 mais impactado: NoWebsite · 73% · espalhado por 15 ambientes
75/24h
👤 mais impactado: eng-release-fix · 24% · espalhado por 19 ambientes
Precisa de açãoAcompanharSem impacto
A cabeça da distribuição costuma responder por boa parte da carga acionável; a cor mostra o balde de ação. Cliente e percentual vêm da coluna de ambiente do snapshot. Detalhe por linha na aba Tabela ↗.

📦 Carga por cliente — produção · não-ruído · 72h · eixo fixo (maior = 656)

qualicorp
656/72h
agibank
418/72h
dattos (BTG)
343/72h
bayer
256/72h
vwfs
219/72h
edenred
172/72h
allcare
113/72h
afextyc
79/72h
sales
65/72h
yamaha
61/72h
cervejariacidadeimperial
60/72h
holambracoop
44/72h
Volume de erros não-ruído por cliente de produção (top 12); a cabeça domina e o resto é cauda longa. Detalhe por cliente na aba Contexto ↗.

🧭 Os 33 itens por classificação — contagem de itens (não de volume)

11 Precisa de ação21 Acompanhar1 Sem impacto
Poucos itens pedem ação; a maioria é monitoramento. Volume ≠ nº de itens — um único item pode somar milhares de ocorrências. Lista completa na aba Tabela ↗.
📈 Tendência no tempo — está piorando ou melhorando, e em que horário

🧪 Composição da carga por classificação — ~7 dias · cada coluna = uma leitura, normalizada a 100%

24/06 09h · 48% ação · 52% acompanhar · 0% sem impacto24/06 14h · 41% ação · 58% acompanhar · 1% sem impacto25/06 08h · 38% ação · 61% acompanhar · 1% sem impacto25/06 14h · 36% ação · 64% acompanhar · 0% sem impacto26/06 09h · 44% ação · 55% acompanhar · 1% sem impacto26/06 14h · 44% ação · 55% acompanhar · 1% sem impacto27/06 12h · 26% ação · 66% acompanhar · 9% sem impacto27/06 14h · 19% ação · 66% acompanhar · 15% sem impacto28/06 10h · 34% ação · 38% acompanhar · 28% sem impacto28/06 14h · 46% ação · 29% acompanhar · 24% sem impacto29/06 08h · 0% ação · 98% acompanhar · 2% sem impacto29/06 14h · 34% ação · 63% acompanhar · 3% sem impacto30/06 08h · 29% ação · 71% acompanhar · 0% sem impacto01/07 08h · 35% ação · 64% acompanhar · 0% sem impacto02/07 08h · 48% ação · 52% acompanhar · 1% sem impacto24/06agora
Precisa de açãoAcompanharSem impacto
topo em Precisa de ação: Error: IO Error: Cannot open database… 24/24htopo em Acompanhar: Exception in ASGI application +… 693/24htopo em Sem impacto: session-init call failed for… 15/24h
Não é o volume (esse está na Tendência, na aba Triagem) — é a mistura: que fração de cada leitura pedia ação. Passe o mouse numa coluna para ver as frações. Os campeões refletem a leitura atual (o topo por balde de leituras passadas não é gravado).
👀 Acompanhar & frota — o que vigiar e o denominador de risco por versão

🛰 Saúde da frota — 66 clientes por proximidade da versão de produção (16.3.x)

61 na linha (16.3.x)3 atrás2 à frente
É o denominador que normaliza o risco por versão. Os 3 atrás (dattos-prod.titulo.net 15.4.4, dattos (BTG) 15.4.11, dattos-uat (BTG) 15.4.16) podem carregar bug já corrigido. Detalhe por cliente na aba Contexto ↗.
👀 Contexto — acompanhar · ritmo do dia · o que mudou · clientes afetados (investigação secundária)
👀 21 p/ acompanhar · 1 sem impacto housekeeping — não atinge cliente

👀 Acompanhar — ainda não atinge cliente, ou já diminuindo

XmlException: Erro durante importação ID… · Back · crescendo · ⚠ só temos o número, sem diagnóstico3/24h
Failed to process the job '723758': an… · Back · crescendo214/24h
[CALLBACK_HTTP_ERROR] correlation_id=06995a13… · Pipeline · recorrente, sem crescer75/24h
HttpException: An error occurred while… · Back · crescendo · ⚠ só temos o número, sem diagnóstico3/24h
BackgroundJobClientException: Failed to… · Back · crescendo · ⚠ só temos o número, sem diagnóstico4/24h
Error: IO Error: No files found that match… · Matching · crescendo · ⚠ só temos o número, sem diagnóstico4/24h
NpgsqlException: Erro durante importação ID… · Back · diminuindo · ⚠ só temos o número, sem diagnóstico2/24h
ComponentNotRegisteredException: The… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
IOException: Erro inesperado durante a… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
UnauthorizedAccessException: Access to the… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico1/24h
InvalidCastException: O campo Data de… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
DependencyResolutionException: An exception… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
SsrfException: The URL 'https://sftp://transfe… · Back · sem crescer · ⚠ só temos o número, sem diagnóstico0/24h
Passa para Precisa de ação se voltar a crescer e atingir 3 ou mais ambientes.

🩹 Ruído — o que vale consertar na fonte

Consertar a fonte (some do log de verdade) — não silenciar (silenciar cega o plantão). A barra usa só a janela de 24h (base 2.486 erros).

session-init call failed for user=snguser… · Dattos-Gateway · infraestrutura sem cliente
15/24h · 1%
consertar a fonte · 👤 sem dono · definir
Consertando o maior (session-init call failed for…): o painel de 24h cairia de 2.486 para ~2.471.
🕘 Pico de erros às 16h uso real (9–18) vs infra/agendado

Erros que pedem atenção por hora do dia (últimas 24h). A faixa 9–18 é o horário comercial: erro que sobe nela tende a ser uso real de cliente; fora dela, costuma ser infra/deploy ou tarefa agendada (e-mail, importação).

horário comercial 9–180h–1h · 8 erros · 0% do dia · fora do expediente1h–2h · 3 erros · 0% do dia · fora do expediente2h–3h · 51 erros · 2% do dia · fora do expediente3h–4h · 100 erros · 4% do dia · fora do expediente4h–5h · 5 erros · 0% do dia · fora do expediente5h–6h · 12 erros · 0% do dia · fora do expediente6h–7h · 5 erros · 0% do dia · fora do expediente7h–8h · 19 erros · 1% do dia · fora do expediente8h–9h · 68 erros · 3% do dia · fora do expediente9h–10h · 203 erros · 8% do dia · horário comercial10h–11h · 246 erros · 10% do dia · horário comercial11h–12h · 296 erros · 12% do dia · horário comercial12h–13h · 196 erros · 8% do dia · horário comercial13h–14h · 57 erros · 2% do dia · horário comercial14h–15h · 157 erros · 6% do dia · horário comercial15h–16h · 207 erros · 8% do dia · horário comercial16h–17h · 332 erros · 13% do dia · pico17h–18h · 107 erros · 4% do dia · horário comercial18h–19h · 162 erros · 6% do dia · fora do expediente19h–20h · 136 erros · 5% do dia · fora do expediente20h–21h · 98 erros · 4% do dia · fora do expediente21h–22h · 68 erros · 3% do dia · fora do expediente22h–23h · 5 erros · 0% do dia · fora do expediente23h–24h · 9 erros · 0% do dia · fora do expediente0h6h9h12h15h18h23h332
🔁 4 novos · 0 pararam vs 2026-07-01 08:35 · 1d atrás
👥 28 clientes atingidos · 10 em 3+ ambientes quem e onde

🌎 Por ambiente — os totais não se somam (uma mesma falha aparece em vários)

"Outros (NoWebsite)" = evento sem ambiente identificado no registro (atribuição estimada).

Outros (NoWebsite/nós de serviço) · 7 grupos · 3.485 hits
·
Exception in ASGI application + Exception Group… · dattos-data-engine-query-aws-16-3
1.566
🏷 Risco por versão taxa por cliente

Ranque por taxa por cliente (erros ÷ clientes que rodam a versão), nunca por contagem bruta. Piso de 3 clientes: abaixo disso é amostra fraca.

VersãoLinhagemErros (não-ruído)ClientesTaxa/cliente
16.4.016.4.x1.2132606.5 amostra fraca
16.3.2516.3.x3.5195860.7
16.3.2416.3.x2111211 amostra fraca
16.3.2216.3.x30130 amostra fraca
16.3.916.3.x4191419 amostra fraca
15.4.1615.4.x919 amostra fraca
15.4.1115.4.x3431343 amostra fraca
15.4.415.4.x414 amostra fraca
📦 Carga por cliente (volume) top por volume

Volume de erros não-ruído por cliente de produção (top 12), base deste snapshot (83 de 161 ambientes afetados em 72h). Internos e máquinas de dev fora.

qualicorp
656/72h
agibank
418/72h
dattos (BTG)
343/72h
bayer
256/72h
vwfs
219/72h
edenred
172/72h
allcare
113/72h
afextyc
79/72h
sales
65/72h
yamaha
61/72h
cervejariacidadeimperial
60/72h
holambracoop
44/72h
🛰 Frota — versão por cliente 66 clientes

Distribuição da frota por versão (1 barra por versão; quem está atrás da versão de produção mais comum carrega bug já corrigido). É o denominador que normaliza o risco por versão.

16.4.0
2 clientes
16.3.25 ★
58 clientes
16.3.24 ★
1 cliente
16.3.22 ★
1 cliente
16.3.9 ★
1 cliente
15.4.16
1 cliente
15.4.11
1 cliente
15.4.4
1 cliente
★ = versão de produção mais comum (16.3.x)atrásna linhaà frente
ver por cliente (66)
ClienteVersão dominanteTambém vistaAtraso?
dattos-prod.titulo.net15.4.4⚠ versão antiga
dattos (BTG)15.4.11⚠ versão antiga
dattos-uat (BTG)15.4.16⚠ versão antiga
agibank16.3.9✓ atual
ifoodcorp16.3.22✓ atual
vwfs16.3.2416.3.25✓ atual
123milhas16.3.25✓ atual
abc16.3.25✓ atual
ache16.3.25✓ atual
afextyc16.3.25✓ atual
allcare16.3.25✓ atual
atlas16.3.25✓ atual
bayer16.3.25✓ atual
brpartners16.3.25✓ atual
bs216.3.25✓ atual
ccab-agro16.3.25✓ atual
ccr16.3.25✓ atual
cea16.3.25✓ atual
celcoin16.3.25✓ atual
cervejariacidadeimperial16.3.25✓ atual
cmpc16.3.25✓ atual
cobasi16.3.25✓ atual
cofco16.3.25✓ atual
colgate16.3.25✓ atual
comercialzaffari16.3.25✓ atual
conciliadorrm16.3.25✓ atual
csf-qa16.3.25✓ atual
edenred16.3.25✓ atual
embarca16.3.25✓ atual
f2jinterlagos16.3.25✓ atual
fiap16.3.25✓ atual
flagship16.3.25✓ atual
granado16.3.25✓ atual
grupoepr16.3.25✓ atual
holambracoop16.3.25✓ atual
hsl16.3.25✓ atual
ipiranga16.3.25✓ atual
kryptonbpo16.3.25✓ atual
laponia16.3.25✓ atual
martins16.3.25✓ atual
mbenz16.3.25✓ atual
mrsdp16.3.25✓ atual
natura16.3.25✓ atual
omnicom16.3.25✓ atual
opea16.3.25✓ atual
operafidc16.3.25✓ atual
orizon16.3.25✓ atual
pirelli_csa16.3.25✓ atual
protege16.3.25✓ atual
qualicorp16.3.25✓ atual
redeamericas16.3.25✓ atual
remessaonline16.3.25✓ atual
sales16.3.25✓ atual
sementesprodutiva16.3.25✓ atual
simpaul16.3.25✓ atual
solinftec16.3.25✓ atual
stellantis16.3.25✓ atual
travelex16.3.25✓ atual
unimedprudente16.3.25✓ atual
veneza16.3.25✓ atual
vibra16.3.25✓ atual
yamaha16.3.25✓ atual
zaffari16.3.25✓ atual
zortea16.3.25✓ atual
financeiro16.4.0↑ pré-lançamento
gaspar16.4.0↑ pré-lançamento
🗂 33 grupos · fonte de investigação — ordenada por volume 72h · filtrável por origem

Fonte crua de investigação: todos os grupos com classificação por IA, versões e link Loki. A ordem por volume 72h cobre o antigo "Top 10"; use o filtro por origem para fatiar por sistema.

#ClassificaçãoTipo de erroErroSistemaCliente principalNº amb.AmbientesVersões24h72hTendência
1Acompanhar Falha no serviço de Consulta (motor de dados)Exception in ASGI application + Exception Group Traceback (most recent call…Querydattos-data-engine-query-aws-16-38other, eng-internal16.3.25, 16.4.06931.566▲ 37%
2Precisa de açãoExecução de fluxo: parte não roda por status, parte falha ao chamar o pipelineInvalidOperationException: [SchedulePolling] Error processing rule 26 for…Backbayer51prod, eng-internal, other, demo, local, hom, dev15.4.11, 15.4.165321.104▲ 73%
3AcompanharFalha de storage externoFailed to process the job '723758': an exception occurred. An object or…Backqualicorp3prod16.3.25214650▲ 48%
4AcompanharFalha de conexão do pipeline com o servidor de mensagens (tempo esgotado)[CALLBACK_HTTP_ERROR] correlation_id=06995a13-59d9-4ef5-acf9-000915882c2e…PipelineNoWebsite15other, prod, demo, eng-internal, local16.3.25, 16.4.075440— sem mudança
5Precisa de açãoErro de banco/SQL (conciliação)SqlException: Failed to process the job '2020': an exception occurred. An…Backagibank16prod, hom15.4.11, 15.4.16143324▲ 63%
6AcompanharFalha ao enviar requisição ao motor de dadosHttpRequestException: IO Error: No files found that match the pattern…Backallcare21prod, eng-internal, local, dev16.3.24, 16.3.25151296▲ 66%
7Precisa de açãoErro de tela no controle de licença (propriedade indefinida)FrontException: An API key with the description provided already exists. An…Frontvwfs34prod, eng-internal, demo, local16.3.24, 16.3.2592282▲ 38%
8Precisa de açãoErro de validação (e-mail sem destinatário)ArgumentException: Erro ao enviar e-mail #210720. Destinatário do e-mail não…Backeng-release-fix6eng-internal, prod, other, hom15.4.11, 15.4.16185208▲ 804%
9Precisa de ação Erro de código (referência nula) na amostraNullReferenceException: Failed to process the job '10343628': an exception…Backallcare16prod, eng-internal, demo15.4.11, 16.3.2486136▲ 134%
10Precisa de açãoAgente de IA de SQL indisponível e erros de sintaxe no ETLBusinessException: datasource/from-file failed (analysisId=11) Agent service…Backeng-release-fix19eng-internal, prod, other, dev, demo15.4.11, 16.3.2475135▲ 125%
11AcompanharFalha EF/DB (interno)EntityException: Failed to execute polling task. The underlying provider…Backsergio5prod16.3.24, 16.3.2531111▲ 34%
12AcompanharFalha de envio de e-mail (limite do servidor)SmtpException: Erro ao enviar e-mail #210712. Service not available, closing…Backdattos (BTG)2prod15.4.11, 16.3.2233102▲ 38%
13AcompanharFalha ao ler do banco (EF/DB)EntityCommandExecutionException: An error occurred while reading from the…Backdattos (BTG)18prod, dev, eng-internal, demo15.4.11, 16.3.242671▲ 39%
14Precisa de açãoErro de código (parâmetro nulo)ArgumentNullException: Value cannot be null. Parameter name: source Value…Backcea11prod, eng-internal, local16.3.24, 16.3.252251▲ 70%
15AcompanharPasta de importação (SFTP) não encontradaDirectoryNotFoundException: Could not find a part of the path…Backccr3prod, hom15.4.11, 15.4.161640▲ 21%
16AcompanharFalha ao confirmar arquivo no armazenamento (tempo esgotado)TaskCanceledException: [SetFileStatusAsync] Failed to set file status for…Backcsf-qa1prod16.3.251737▲ 85%
17Precisa de açãoArquivo de importação ausente no armazenamentoFileNotFoundException: File not found on storage Ttl. Details: FileName…Backdattos (BTG)3prod15.4.11, 16.3.251836▲ 80%
18AcompanharResposta inválida do motor de dados (503)JsonReaderException: DataEngine returned non-parseable JSON on route…Backeng-release-fix6eng-internal, prod, local16.3.25, 16.4.02633▲ 136%
19Precisa de ação Conciliação: base temporária aberta em modo somente-leitura (DuckDB)Error: IO Error: Cannot open database "/mnt/staging/<id>/<hash>_step.duckdb"…Pipeline+Matchingedenred7prod, local, eng-internal16.3.25, 16.4.02428▲ 600%
20Sem impactoGateway/serviço novo falhandosession-init call failed for user=snguser host= Traceback (most recent call…Dattos-GatewayNoWebsite1other16.4.01526▲ 63%
21Precisa de açãoPasta de importação fora da configuração (autorização)AuthorizationException: A pasta atual não é válida de acordo com as pastas…Backeng-release-fix4eng-internal, local, prod16.3.25, 16.4.01020▲ 100%
22AcompanharHttpException (Back)HttpException: An error occurred while communicating with the remote host…Backnatura5prod, eng-internal16.3.24, 16.3.25315▲ 25%
23Acompanhar Falha transitória de importação (banco)NpgsqlException: Erro durante importação ID 2472878 Exception while reading…Backdattos (BTG)2prod15.4.11, 16.3.9213▼ 72%
24Acompanhar IOException (Back)IOException: Erro inesperado durante a importação ID 2482572: The process…Backdattos (BTG)2prod15.4.11, 16.3.2409— sem mudança
25AcompanharInvalidCastException (Back)InvalidCastException: O campo Data de Recebimento possui um valor do tipo…Backbayer1prod16.3.2508— sem mudança
26AcompanharDependencyResolutionException (Back)DependencyResolutionException: An exception was thrown while activating…BackNoWebsite1other16.3.2506— sem mudança
27Precisa de ação OperationCanceledException (Back)OperationCanceledException: Erro ao realizar cancelamento da importação…Backdattos (BTG)1prod15.4.1155novo
28AcompanharBackgroundJobClientException (Back)BackgroundJobClientException: Failed to execute job ISendEmailJob. Background…Backcervejariacidadeimperial2prod16.3.24, 16.3.2544novo
29AcompanharUnauthorizedAccessException (Back)UnauthorizedAccessException: Access to the path…Backdattos-uat (BTG)2hom, prod15.4.16, 16.3.2514— sem mudança
30Acompanhar XmlException (Back)XmlException: Erro durante importação ID 2486125 Name cannot begin with the…Backdattos (BTG)1prod15.4.1134novo
31AcompanharErros sem classe (Matching)Error: IO Error: No files found that match the pattern…Matchingeng-release-fix2eng-internal, prod16.3.25, 16.4.044novo
32Acompanhar ComponentNotRegisteredException (Back)ComponentNotRegisteredException: The requested service 'FlatFile…Backinternal1local16.4.003— sem mudança
33AcompanharSsrfException (Back)SsrfException: The URL 'https://sftp://transfer.dattos.com.br' was blocked by…Backeng-release-fix1eng-internal16.4.003— sem mudança
❓ Ajuda — como ler este painel · seções que ligam quando a coleta acumular dado
❓ Como ler este painel — régua, símbolos e limites (toque para abrir)
Os 3 baldes (regra automática, auditável)
  • Precisa de ação erro de produto/dado que atinge cliente e está crescendo (≥5 ocorrências/24h) ou aparece em ≥3 ambientes sem cair (≥8/24h).
  • Acompanhar ainda não atinge cliente, ou já está diminuindo.
  • Sem impacto só em máquina de desenvolvimento ou infraestrutura, sem cliente.
  • Saturação/capacidade (disco, pool, timeout, fila) sobe para "Precisa de ação" mesmo sem cliente — precede a falha visível.

"Atinge cliente" = ambiente que não é dev (local-*), teste (eng-*), serviço ou NoWebsite. Toda contagem tem link Loki ao lado para conferir na fonte.

Símbolos
  • 🔍 vX? hipótese de regressão de uma versão recente — a confirmar, não veredito.
  • 🔗 N incidente consolidado de N erros da mesma raiz.
  • 🎫 PRD-… card Jira candidato — confirme que é o mesmo problema.
  • 🔥 módulo mais comprometido agora · crônico visto em ≥4 snapshots.
  • em alta / constante / diminuindo = ritmo recente (24h vs 72h). ▲/▼ % = tendência vs o snapshot anterior. Eixos diferentes.
  • NOVO / ESCALANDO / CRÔNICO = apareceu agora / subiu ≥50% vs ontem ou ~7d (base curta, baixa confiança) / recorrente em ≥4 snapshots. vs ontem / vs ~7d compara com o snapshot daquele período.
Cor

vermelho = precisa de ação · amarelo = acompanhar · cinza = sem impacto. Borda esquerda mais grossa = mais volume. Card apagado = perdendo força.

⏱ Horizonte: comparações cobrem ~7 dias (14 snapshots de 12/12h); não há base "vs semana/mês passado" nem horário exato de última ocorrência. 🏷 Tipo de erro é classificado por IA (pode errar — confirme no Loki). Contagens podem ser piso quando a consulta satura.