QA Telemetry — 2026-06-10 14:44

Janela: últimas 24h e 72h · Tenants afetados: 76 (24h) / 94 (72h) de 158 · Queries Loki: 191 · Método: count_over_time (totais reais)

Leia antes do número. O volume de 24h despencou 89% (20.886 → 2.211) porque o stress de 30K arquivos no eng-hotfix cessou (0 hits em 24h; o resíduo de 19K sai da janela 72h em 2026-06-11). Sem ele, os ofensores reais de 24h são: EntityException de polling (▲ 7x, 21 tenants), Hangfire status race (agibank), Catalog Error ETL_* no transform (Back+Pipeline) e um ComponentNotRegisteredException novo concentrado no internal.
Erros (24h)
2.211
▼ 89% vs anterior
Erros (72h)
24.557
— estável
Tenants afetados
76 / 158
94 em 72h
Categorias
18
12 prováveis bugs
Mudanças vs snapshot anterior

Atual: 2026-06-10 14:44 · Anterior: 2026-06-09 14:42 · Delta: 1d atrás

⊕ Erros novos / ressurgidos

·
Erro de negócio (validação)ArgumentException: Mix: componentId (ETL steps) + Erro ao obter campo do · internal, dattos (BTG), eng-hotfix, +2
153
·
Erro de schema ETL (DuckDB)Catalog Error: Catalog Error: Table with name ETL_2462_28118_28203 does · NoWebsite, eng-release-fix, sales, +1
28
·
Arquivo ausente (PDF/staging)IO Error (read-only): IO Error: Cannot open database '<staging>.duckdb' · NoWebsite, local-maiglon, ifoodcorp, +1
19
·
Erro de schema ETL (DuckDB)Conversion Error: Conversion Error: Could not convert string '' / 'SET' · NoWebsite, sales, ifoodcorp
7

⊖ Erros que pararam (extintos)

·
PipelineCodeError: Importação de 'glob' não é permitida no código do pip · bloqueio de import no código do pipeline cessou — 0 hits na janela atual
−60
·
ArgumentException: toRow inválido — ClosedXmlExcelWriter.ValidateAddress · fenômeno toRow do Excel writer cessou (2 hits residuais em 72h); ArgumentException agora é mix de validações de ETL/filtro
−37
Distribuição de impacto
Por ambiente

Produção · 27 grupos · 2.977 hits

Eng interno (hotfix/release-fix/portal) · 17 grupos · 22.205 hits

Outros (NoWebsite/nós de serviço) · 13 grupos · 2.868 hits

Dev (eng-develop) · 1 grupos · 37 hits

Homolog/UAT · 3 grupos · 380 hits

Demo/trial · 7 grupos · 1.189 hits

Local · 14 grupos · 2.146 hits

Categorias
  Stress test (30K arquivos)1 grupos · 19.112 hits
Storm CESSOU: 0 hits nas últimas 24h. O resíduo de 19K domina a janela 72h e sai dela em 2026-06-11. Origem: teste de stress com 30K arquivos no eng-hotfix.
  Erro de schema ETL (DuckDB)3 grupos · 842 hits
▲ 91% em 72h (417 → 798). Erros do Query MS (nós de serviço, não tenants): ASGI envelopando Parser Error (syntax ';'), Binder e Catalog. 56% no nó query-aws-16-3.
NOVO como grupo destacado: o nome da tabela difere por ±1 no ID do step — a view referencia o step antigo. Mesmo fenômeno aparece no Back via 'Error calling service pipeline'.
CAST de string vazia/'SET' para INT32 falhando em transform — erro de dado/config do ETL, não do motor.
  Job/fluxo Hangfire falhando2 grupos · 522 hits
▲ 60% em 72h (323 → 519). Top tenants: agibank (210), BTG (52), bayer (41). Fluxo disparado com status incompatível — padrão de race de agendamento.
Criação de job de e-mail falhando no Hangfire (CSF) — 0 hits em 24h.
  Falha EF/DB6 grupos · 474 hits
▲ 7x vs snapshot anterior (40 → 292 em 72h) e espalhado em 21 tenants. Polling de schedule rules falhando com erro transient de conexão — investigar saúde do SQL/pool de conexões.
Estável vs anterior (49 → 63). Falha de conexão ao resolver tenant — sem website associado (contexto de job).
Amostra mudou: agora é DeleteAsync com entity null (delete de registro já removido?) — antes era columnA em AnalysisMatchingRule.
▲ 89% (27 → 51), BTG 51%. NRE em AnalysisMatchingStep.OnChange ao validar expressão — null-guard ausente.
Ativação de ApiKeyService sem tenant context — request com API key fora de contexto de tenant. 0 hits em 24h.
Confinado ao internal — colisão dos dois motores de matching (MatchingStep legado vs AnalysisMatchingStep). 0 hits em 24h.
  Erro de banco/SQL5 grupos · 732 hits
▲ 73% em 72h (236 → 409), agibank concentra 47%. SQL gerado com alias vazio em SELECT INTO — provável config de processo, não regressão de produto.
▲ 47% em 72h (171 → 252), BTG concentra 73%. Falha ao carregar árvore de workflows (LoadChildrenTreeAsync) — query pesada/timeout no contexto BTG.
100% BTG (Redshift externo). Amostra mudou de syntax error para Spectrum nested query error — query externa do cliente, não produto.
100% BTG: timeout na importação de fonte externa Postgres/Redshift.
100% BTG: host MySQL externo inacessível na importação.
  Erro de DI (Autofac)1 grupos · 93 hits
NOVO e 99% no internal: resolução Autofac de IRefreshStepProvider com chave numérica de step ('27884') não registrada — provável bug em refresh de amostra de step. Não atingiu prod ainda.
  Falha HTTP downstream5 grupos · 532 hits
▲ 113% em 72h (130 → 277). Agora dominado por Catalog Error: a VIEW aponta pra tabela de step N enquanto o staging tem N+1 — cheiro de race/dessincronização de versões de step no transform. Espelha o mesmo erro visto direto no Pipeline.
▲ 61% (135 → 218). Tabela matching_<ID> ausente no staging do DataEngine — análise consultada antes do matching materializar.
▲ vs anterior (16 → 39): nginx respondendo 502 na rota query do DataEngine — gateway/upstream caindo sob carga, maioria em eng-internal.
Cliente fechou a conexão durante o response — ruído de rede do lado do usuário.
Timeout/cancel na chamada ao Agent durante refresh de amostra — volume mínimo.
  Erro de frontend (null/undefined)1 grupos · 254 hits
▲ 40% em 72h (181 → 254), 32 tenants. Amostra atual: null.length no render do UserAvatar — null-guard ausente em componente compartilhado.
  Conexão Rabbit (dev timeout)1 grupos · 123 hits
▼ 97% (3.718 → 123 em 72h) — o burst de timeout do rabbit-dev saiu da janela. Restam ocorrências em ambiente local/dev.
  Pool shutdown race (Pika/multiproc)1 grupos · 480 hits
▼ 71% (536 → 156). Race conhecida de shutdown do pool Pika nos MS Python — segue presente em volume baixo.
  Arquivo ausente (PDF/staging)3 grupos · 92 hits
Arquivo de import do portal ausente no storage (BTG/PAN) — pipeline de import referenciando arquivo já removido.
100% CCR: diretório SFTP de origem (Cielo_MetroBahia) sumiu do disco — config de FileCopy apontando pra pasta inexistente.
NOVO: staging DuckDB sumiu antes da leitura (Matching lê /mnt/local, DataEngine lê C:\efs\staging — este último é ambiente local do Maiglon). Liga com o padrão conhecido de staging perdido/limpo no Pipeline MS.
  Erro de negócio (validação)2 grupos · 274 hits
Composição nova (amostra 24h): 42% componentId em Services.Etls, 25% 'Erro ao obter campo do filtro', 20% 'NextPosition é nulo' em refresh de amostra de step, 8% RBAC de Pasta no Close. 69% no internal — maioria exercício interno; monitorar fatia prod (BTG/Pirelli/MBenz).
▲ 61% (75 → 121). Amostra atual: refresh de amostra referenciando componente que não existe na versão publicada do ETL — drift entre rascunho e versão publicada.
  Falha de SMTP1 grupos · 87 hits
98% BTG: rate limit do servidor SMTP do cliente — throttle de envio, não bug do produto.
  Gateway session-init (novo MS)1 grupos · 112 hits
Novo MS (16.4.0) ainda falhando session-init em ambiente de serviço — caiu pra 3 hits nas últimas 24h.
  Permissão negada (RBAC)1 grupos · 9 hits
RBAC negando configuração de processo — comportamento esperado, volume baixo.
  Bloqueio SSRF (proteção)1 grupos · 37 hits
▲ (6 → 37), 97% eng-develop: proteção SSRF bloqueando chamada interna ao portal-dev — comportamento esperado da proteção, mas indica integração dev tentando rota interna.
  Falha de storage (S3)1 grupos · 3 hits
Assinatura S3 inválida no CSF — 0 hits em 24h.
  Erro de mapeamento (AutoMapper)1 grupos · 12 hits
Tabela completa
#CategoriaErroSourceTop tenantTenantsEnvVersões24h72hTend.Loki
1Stress test (30K arquivos)(none): [SetFileStatusAsync] External storage API returned NotFound, file /30KFIBackeng-hotfix2eng-internal16.3.21019.112— estável
2Erro de schema ETL (DuckDB)ASGI/DuckDB (Query): Exception in ASGI application envelopando Parser Error / BiQuerydattos-data-engine-query-aws-16-36other, eng-internal16.3.21, 16.3.22378807▲ 94%
3Job/fluxo Hangfire falhandoInvalidOperationException: A execução do fluxo não foi realizada porque seu statBackagibank30prod16.3.20, 16.3.21199519▲ 61%
4Pool shutdown race (Pika/multiproc)AssertionError/StreamLost: [!] Critical error in pool process / StreamLostError Pipeline+Matching+DataEngineNoWebsite6other, local16.3.21, 16.3.2271480— estável
5Erro de banco/SQLSqlException: An object or column name is missing or empty (SELECT INTO / alias Backagibank17prod, other, eng-internal, demo15.4.11, 15.4.4194411▲ 74%
6Falha EF/DBEntityException: Failed to execute polling task. Transient failure (SqlAzureExecBacklocal-maiglon21local, prod, other, eng-internal16.3.20, 16.3.21252292▲ 630%
7Falha HTTP downstreamInvalidOperationException: Error calling service 'pipeline', operation 'transforBackagibank20prod, eng-internal, other16.3.20, 16.3.21141268▲ 106%
8Erro de frontend (null/undefined)FrontException: Cannot read properties of null (reading 'length') — vue-componenFrontedenred32prod, hom, eng-internal, demo, local15.4.11, 16.3.1473254▲ 40%
9Erro de banco/SQLEntityCommandExecutionException: An error occurred while executing the command dBackdattos (BTG)25prod, eng-internal, demo, other, local15.4.11, 16.3.1481252▲ 47%
10Falha HTTP downstreamHttpRequestException: Catalog Error: Table with name matching_<ID> does not exisBackgaspar19prod, eng-internal, demo, local16.3.14, 16.3.2083218▲ 61%
11Erro de negócio (validação)ArgumentException: Mix: componentId (ETL steps) + Erro ao obter campo do filtro Backinternal8local, prod, eng-internal15.4.11, 16.3.20117153NOVO
12Conexão Rabbit (dev timeout)AMQP/TCP timeout: AMQPConnectionWorkflowFailed: TCP connection attempt timed outDataEnginelocal-maiglon4local, other16.3.21, 16.3.611123▼ 97%
13Erro de negócio (validação)BusinessException: Error refreshing sample: Componente [CTO.B] não existe na verBacklocal-maiglon14local, eng-internal, prod15.4.11, 16.3.1446121▲ 61%
14Gateway session-init (novo MS)(none): session-init call failed for user=test host= (httpx) — Dattos-Gateway 16Dattos-GatewayNoWebsite1other16.4.03112— estável
15Erro de DI (Autofac)ComponentNotRegisteredException: The requested service '27884 (IRefreshStepProviBackinternal2local, eng-internal16.3.21, 16.3.229293NOVO
16Falha de SMTPSmtpException: 4.4.2 Message submission rate for this client has exceeded the coBackdattos (BTG)3prod, hom15.4.11, 16.3.204287▲ 64%
17Falha EF/DBInvalidOperationException: Error retrieving tenant: network-related error establBackNoWebsite1other16.3.21, 16.3.222663▲ 29%
18Falha EF/DBArgumentNullException: Value cannot be null. Parameter name: entity — BaseServicBackgaspar12prod, eng-internal, local16.3.14, 16.3.151757▲ 39%
19Falha EF/DBNullReferenceException: Object reference not set — AnalysisMatchingStep.OnChangeBackdattos (BTG)11prod, local, eng-internal15.4.11, 16.3.202551▲ 89%
20Erro de banco/SQLPostgresException: XX000: Spectrum nested query error (Redshift, BTG)Backdattos (BTG)1prod15.4.11749— estável
21Falha HTTP downstreamJsonReaderException: DataEngine returned non-parseable JSON on route 'query' (HTBackeng-release-fix4eng-internal, hom, prod16.3.20, 16.3.212339▲ 144%
22Bloqueio SSRF (proteção)SsrfException: URL 'https://eng-portal-dev...' blocked by SSRF protection (only Backeng-develop2dev, prod16.3.21, 16.3.223137▲ 517%
23Arquivo ausente (PDF/staging)FileNotFoundException: File not found on storage Ttl — import\PAN\{data}\portal\Backdattos (BTG)4prod, eng-internal15.4.11, 16.3.20637— estável
24Arquivo ausente (PDF/staging)DirectoryNotFoundException: Could not find a part of the path 'd:\ccr\ttl\importBackccr1prod16.3.20, 16.3.221236— estável
25Erro de schema ETL (DuckDB)Catalog Error: Catalog Error: Table with name ETL_2462_28118_28203 does not exisPipelineNoWebsite21other, eng-internal, prod, demo, local16.3.21, 16.3.22728NOVO
26Arquivo ausente (PDF/staging)IO Error (read-only): IO Error: Cannot open database '<staging>.duckdb' in read-Matching+DataEngineNoWebsite15other, local, prod, demo16.3.21, 16.3.221719NOVO
27Erro de banco/SQLNpgsqlException: Erro durante importação — The operation has timed out (IsTransiBackdattos (BTG)1prod15.4.11312— estável
28Erro de mapeamento (AutoMapper)TargetInvocationException: Exception thrown by the target of an invocation — MapBackeng-release-fix1eng-internal16.3.21012— estável
29Permissão negada (RBAC)AuthorizationException: Você não tem permissão para configurar um Processo (AnalBackfinanceiro3prod16.3.20, 16.3.2109▲ 29%
30Erro de banco/SQLMySqlException: Unable to connect to any of the specified MySQL hosts (import exBackdattos (BTG)1prod15.4.1128▲ 33%
31Erro de schema ETL (DuckDB)Conversion Error: Conversion Error: Could not convert string '' / 'SET' to INT32PipelineNoWebsite10other, prod, demo16.3.21, 16.3.2277NOVO
32Falha EF/DBDependencyResolutionException: Exception activating ApiKeyService -> DattosDbConBackNoWebsite1other16.3.2006— estável
33Falha EF/DBInvalidCastException: Unable to cast 'MatchingStep' to 'AnalysisMatchingStep' (EBackinternal1local16.3.2105— estável
34Falha HTTP downstreamHttpException: The remote host closed the connection (0x800704CD)Backzaffari2prod16.3.2044NOVO
35Falha HTTP downstreamTaskCanceledException: Error refreshing sample — Uma tarefa foi cancelada (AgentBackgaspar2prod16.3.20, 16.3.2223NOVO
36Falha de storage (S3)AmazonS3Exception: The request signature we calculated does not match the signatBackcsf1prod16.3.2103— estável
37Job/fluxo Hangfire falhandoBackgroundJobClientException: Failed to execute job ISendEmailJob. Background joBackcsf1prod16.3.2103— estável