Memória do Agent

Pensa num atendente que, toda vez que um cliente liga, começa do zero — sem lembrar que aquela pessoa já ligou ontem com o mesmo problema. Frustrante, né? A memória do Agent resolve exatamente isso.

Com a memória habilitada, o Agent extrai e armazena fatos importantes das conversas (nome do cliente, preferências, problemas recorrentes) e os recupera automaticamente nas próximas interações. O resultado é uma conversa muito mais natural e personalizada.

CAPTURARCAPTURAR: tela de configuração do Agent aberta na aba 'Memória' com o toggle habilitado e os campos de configuração visíveis

Como funciona

Durante a conversa: o Agent identifica fatos relevantes que o cliente mencionou.
Ao final: um modelo de extração (por padrão, gpt-4o-mini) lê a conversa e salva os fatos mais importantes numa base de memória vinculada ao contato.
Na próxima conversa: antes de responder, o Agent busca automaticamente os fatos salvos daquele contato e os inclui no contexto — como se o atendente tivesse relido as anotações antes de atender.

CAPTURARCAPTURAR: diagrama ou fluxo visual mostrando o ciclo de extração → armazenamento → recuperação de memória

Habilitando a memória

Para ativar, acesse a aba Memória nas configurações do Agent e ligue o toggle Habilitar memória.

Acesse as configurações do Agent e clique na aba Memória.
CAPTURARCAPTURAR: aba 'Memória' na barra de abas da configuração do Agent
Ligue o toggle Habilitar memória (enabled: true).
CAPTURARCAPTURAR: toggle 'Habilitar memória' na posição ligada (azul/ativo)
Ajuste os parâmetros conforme a necessidade do seu Agent (detalhes abaixo).
Salve as configurações e teste enviando algumas mensagens no painel de teste. Na segunda conversa, verifique se o Agent lembra dos fatos da primeira.
CAPTURARCAPTURAR: painel de teste com duas conversas e o Agent demonstrando memória da conversa anterior

Parâmetros de memória (`memory_config`)

Parâmetro	Padrão	O que controla
`enabled`	`false`	Liga ou desliga a memória
`top_k`	`5`	Quantos fatos são recuperados por conversa. Mais fatos = mais contexto, mas também mais tokens.
`threshold`	`0.75`	Similaridade mínima (0 a 1) para um fato ser considerado relevante para a conversa atual. Valores mais altos = mais precisão.
`max_facts`	`200`	Máximo de fatos armazenados por contato. Quando atinge o limite, os mais antigos são descartados.
`extraction_model`	`gpt-4o-mini`	Modelo usado para extrair fatos da conversa. O `gpt-4o-mini` já equilibra bem custo e qualidade.
`retention_days`	`365`	Por quantos dias os fatos ficam armazenados antes de expirar.

CAPTURARCAPTURAR: painel de configuração de memória com todos os campos numéricos e o seletor de modelo de extração visíveis

Boas práticas

Dica

Comece com os valores padrão. Eles já funcionam bem para a maioria dos casos. Ajuste top_k (para mais contexto) ou threshold (para mais precisão) só se perceber problemas de comportamento.

Atenção

Fatos armazenados na memória contêm dados dos clientes — nome, preferências, histórico de problemas. Isso é dado pessoal. Siga as políticas de privacidade da sua empresa e as regras da LGPD ao habilitar essa funcionalidade. Use retention_days para garantir que dados não sejam guardados indefinidamente além do necessário.

Quando usar top_k maior (ex.: 10):

Conversas longas com muito contexto acumulado
Agents de suporte com histórico rico de problemas

Quando usar threshold mais alto (ex.: 0.85):

Quando o Agent está recuperando fatos irrelevantes e "confundindo" as conversas de clientes diferentes

Memória do Agent ​

Como funciona ​

Habilitando a memória ​

Parâmetros de memória (memory_config) ​

Boas práticas ​

Memória do Agent

Como funciona

Habilitando a memória

Parâmetros de memória (`memory_config`)

Boas práticas