Skip to content

Memória do Agent

Pensa num atendente que, toda vez que um cliente liga, começa do zero — sem lembrar que aquela pessoa já ligou ontem com o mesmo problema. Frustrante, né? A memória do Agent resolve exatamente isso.

Com a memória habilitada, o Agent extrai e armazena fatos importantes das conversas (nome do cliente, preferências, problemas recorrentes) e os recupera automaticamente nas próximas interações. O resultado é uma conversa muito mais natural e personalizada.

CAPTURARCAPTURAR: tela de configuração do Agent aberta na aba 'Memória' com o toggle habilitado e os campos de configuração visíveis

Como funciona

  1. Durante a conversa: o Agent identifica fatos relevantes que o cliente mencionou.
  2. Ao final: um modelo de extração (por padrão, gpt-4o-mini) lê a conversa e salva os fatos mais importantes numa base de memória vinculada ao contato.
  3. Na próxima conversa: antes de responder, o Agent busca automaticamente os fatos salvos daquele contato e os inclui no contexto — como se o atendente tivesse relido as anotações antes de atender.
CAPTURARCAPTURAR: diagrama ou fluxo visual mostrando o ciclo de extração → armazenamento → recuperação de memória

Habilitando a memória

Para ativar, acesse a aba Memória nas configurações do Agent e ligue o toggle Habilitar memória.

  1. Acesse as configurações do Agent e clique na aba Memória.

    CAPTURARCAPTURAR: aba 'Memória' na barra de abas da configuração do Agent
  2. Ligue o toggle Habilitar memória (enabled: true).

    CAPTURARCAPTURAR: toggle 'Habilitar memória' na posição ligada (azul/ativo)
  3. Ajuste os parâmetros conforme a necessidade do seu Agent (detalhes abaixo).

  4. Salve as configurações e teste enviando algumas mensagens no painel de teste. Na segunda conversa, verifique se o Agent lembra dos fatos da primeira.

    CAPTURARCAPTURAR: painel de teste com duas conversas e o Agent demonstrando memória da conversa anterior

Parâmetros de memória (memory_config)

ParâmetroPadrãoO que controla
enabledfalseLiga ou desliga a memória
top_k5Quantos fatos são recuperados por conversa. Mais fatos = mais contexto, mas também mais tokens.
threshold0.75Similaridade mínima (0 a 1) para um fato ser considerado relevante para a conversa atual. Valores mais altos = mais precisão.
max_facts200Máximo de fatos armazenados por contato. Quando atinge o limite, os mais antigos são descartados.
extraction_modelgpt-4o-miniModelo usado para extrair fatos da conversa. O gpt-4o-mini já equilibra bem custo e qualidade.
retention_days365Por quantos dias os fatos ficam armazenados antes de expirar.
CAPTURARCAPTURAR: painel de configuração de memória com todos os campos numéricos e o seletor de modelo de extração visíveis

Boas práticas

Dica

Comece com os valores padrão. Eles já funcionam bem para a maioria dos casos. Ajuste top_k (para mais contexto) ou threshold (para mais precisão) só se perceber problemas de comportamento.

Quando usar top_k maior (ex.: 10):

  • Conversas longas com muito contexto acumulado
  • Agents de suporte com histórico rico de problemas

Quando usar threshold mais alto (ex.: 0.85):

  • Quando o Agent está recuperando fatos irrelevantes e "confundindo" as conversas de clientes diferentes