Appearance
Memória do Agent
Pensa num atendente que, toda vez que um cliente liga, começa do zero — sem lembrar que aquela pessoa já ligou ontem com o mesmo problema. Frustrante, né? A memória do Agent resolve exatamente isso.
Com a memória habilitada, o Agent extrai e armazena fatos importantes das conversas (nome do cliente, preferências, problemas recorrentes) e os recupera automaticamente nas próximas interações. O resultado é uma conversa muito mais natural e personalizada.
CAPTURARCAPTURAR: tela de configuração do Agent aberta na aba 'Memória' com o toggle habilitado e os campos de configuração visíveis
Como funciona
- Durante a conversa: o Agent identifica fatos relevantes que o cliente mencionou.
- Ao final: um modelo de extração (por padrão,
gpt-4o-mini) lê a conversa e salva os fatos mais importantes numa base de memória vinculada ao contato. - Na próxima conversa: antes de responder, o Agent busca automaticamente os fatos salvos daquele contato e os inclui no contexto — como se o atendente tivesse relido as anotações antes de atender.
CAPTURARCAPTURAR: diagrama ou fluxo visual mostrando o ciclo de extração → armazenamento → recuperação de memória
Habilitando a memória
Para ativar, acesse a aba Memória nas configurações do Agent e ligue o toggle Habilitar memória.
Acesse as configurações do Agent e clique na aba Memória.
CAPTURARCAPTURAR: aba 'Memória' na barra de abas da configuração do AgentLigue o toggle Habilitar memória (
enabled: true).CAPTURARCAPTURAR: toggle 'Habilitar memória' na posição ligada (azul/ativo)Ajuste os parâmetros conforme a necessidade do seu Agent (detalhes abaixo).
Salve as configurações e teste enviando algumas mensagens no painel de teste. Na segunda conversa, verifique se o Agent lembra dos fatos da primeira.
CAPTURARCAPTURAR: painel de teste com duas conversas e o Agent demonstrando memória da conversa anterior
Parâmetros de memória (memory_config)
| Parâmetro | Padrão | O que controla |
|---|---|---|
enabled | false | Liga ou desliga a memória |
top_k | 5 | Quantos fatos são recuperados por conversa. Mais fatos = mais contexto, mas também mais tokens. |
threshold | 0.75 | Similaridade mínima (0 a 1) para um fato ser considerado relevante para a conversa atual. Valores mais altos = mais precisão. |
max_facts | 200 | Máximo de fatos armazenados por contato. Quando atinge o limite, os mais antigos são descartados. |
extraction_model | gpt-4o-mini | Modelo usado para extrair fatos da conversa. O gpt-4o-mini já equilibra bem custo e qualidade. |
retention_days | 365 | Por quantos dias os fatos ficam armazenados antes de expirar. |
CAPTURARCAPTURAR: painel de configuração de memória com todos os campos numéricos e o seletor de modelo de extração visíveis
Boas práticas
Dica
Comece com os valores padrão. Eles já funcionam bem para a maioria dos casos. Ajuste top_k (para mais contexto) ou threshold (para mais precisão) só se perceber problemas de comportamento.
Atenção
Fatos armazenados na memória contêm dados dos clientes — nome, preferências, histórico de problemas. Isso é dado pessoal. Siga as políticas de privacidade da sua empresa e as regras da LGPD ao habilitar essa funcionalidade. Use retention_days para garantir que dados não sejam guardados indefinidamente além do necessário.
Quando usar top_k maior (ex.: 10):
- Conversas longas com muito contexto acumulado
- Agents de suporte com histórico rico de problemas
Quando usar threshold mais alto (ex.: 0.85):
- Quando o Agent está recuperando fatos irrelevantes e "confundindo" as conversas de clientes diferentes