Agent loop

Como funciona

  1. Plan (planejar). O agente decide o próximo passo com base no objetivo e no estado atual. Pode ser planejamento explícito (lista de tarefas) ou implícito (escolha imediata da próxima ferramenta).
  2. Act (executar). O agente chama uma ferramenta com argumentos extraídos do raciocínio. Tool use ou function calling concretizam essa etapa.
  3. Observe (observar). O resultado da ferramenta volta pro agente. Pode ser dado, mensagem de erro ou conteúdo gerado.
  4. Reflect (refletir). O agente avalia se o passo aproximou do objetivo. Pode ajustar o plano, escolher outra ferramenta ou concluir. Volta ao passo 1 até parar.

Por que importa

  • É o que diferencia agente de execução de prompt. Sem loop, o LLM responde uma vez e para. Com loop, ele itera até resolver.
  • Define orçamento operacional. Cada iteração custa tokens. Sem cap, agente entra em loop infinito e a fatura escala.
  • Determina robustez do agente. Erro durante a execução é recuperável quando o loop reflete e tenta diferente. Sem reflexão, qualquer falha derruba o agente.
  • Política de parada é decisão de produto e governança. Quando declarar "missão cumprida" ou "missão impossível" não é detalhe técnico.

O que muda para cada perfil

Para o Translator

Leitura transversal: como o conceito muda o papel de quem alinha tech, dados e negócio.

O que muda pra você. Loop sem condição de parada bem desenhada é onde projeto de IA queima caro. Agente que "tenta de novo" infinitamente consome API, gera relatório poluído e parece estar trabalhando. O Translator define quando o loop para: "se não bateu em 3 tentativas com confiança alta, escala pra humano".

Analogia. É como reunião sem pauta e sem hora pra acabar. Todo mundo discute, ninguém decide, e a reunião continua.

Pergunta-âncora. Qual a condição explícita de parada do nosso agente? Se a resposta for "ele para quando achar que tá pronto", esse agente vai gastar até o limite.

Para DPM

Linguagem e exemplos para Data Product Managers e Analytics Leads.

O que muda pra você. Agent loop é onde se concentra a métrica de produto agêntico: número médio de iterações por tarefa, taxa de conclusão, custo médio. Sem instrumentação dessas métricas, o produto é caixa-preta com fatura crescente.

Analogia. É como medir quantas reuniões cada projeto exige antes de fechar. Demais é desperdício, de menos é precipitado. Tem que medir.

Pergunta-âncora. O nosso agente tem dashboard de iterações por tarefa, taxa de conclusão e custo médio? Sem isso, otimização vira chute.

Para Produto

Linguagem e exemplos para Product Managers.

O que muda pra você. Loop afeta UX: tarefa que leva 1 iteração tem latência baixa; 10 iterações tem latência alta. UX precisa mostrar progresso, permitir interrupção e dar transparência sobre o que o agente está fazendo.

Analogia. É como ver o assistente trabalhando ao vivo. Se o usuário não vê progresso, ele desconfia. Se vê progresso, espera.

Pergunta-âncora. O usuário sabe em qual passo do loop o agente está? Sem visibilidade, espera vira frustração.

Para Engenharia

Linguagem e exemplos para Data Engineers, ML Engineers e Arquitetos.

O que muda pra você. Padrão arquitetural ReAct (reasoning + acting). Variantes: Plan-and-Execute, Reflexion (self-critique). Failure modes: looping (mesma ação repetida), thrashing (oscila), early-termination, hallucinated tool calls. Mitigações: state validation, action diversity penalty, iteration cap, timeout.

Analogia. É while loop com decisão tomada por LLM em cada iteração. Toda boa prática de loop (cap, timeout, idempotência) vale, e mais.

Pergunta-âncora. O loop tem cap de iterações, timeout total e mecanismo de detecção de looping? Sem isso, agente em produção é incidente esperando acontecer.

Para Gestão

Linguagem e exemplos para TPMs, Engineering Managers e líderes de time.

O que muda pra você. Loop é onde a empresa controla custo e risco do agente. Política de orçamento por tarefa, escalonamento pra humano em caso de incerteza, log de iterações pra auditoria. Tudo se decide no desenho do loop.

Analogia. É política de horas extras. Sem cap, custo cresce; sem critério de escalonamento, problema vira incidente.

Pergunta-âncora. Cada agente em produção tem orçamento explícito de iterações e ponto de escalonamento humano? Sem isso, governança é teatro.

Para Negócio

Linguagem e exemplos para Estratégia, Operações e FP&A.

O que muda pra você. Agent loop é o que define se um agente vira ferramenta confiável ou bomba-relógio. Loop bem desenhado conclui tarefas dentro de orçamento previsível. Loop mal desenhado escala custo silenciosamente, e ainda entrega resposta errada com confiança.

Analogia. É a diferença entre projeto com prazo claro e projeto que "rola". O segundo consome orçamento sem entregar.

Pergunta-âncora. Antes de aprovar agente em produção, alguém definiu condição de parada e orçamento por execução? Sem essas duas respostas, o projeto está frouxo.

Citado nestes artigos

1 artigo do blog referencia Agent loop.

Fazer diagnóstico →