Como Construí Um Agente de IA Que Fechou R$ 180 Mil em Vendas Pelo WhatsApp em 45 Dias (Caso Real)
Documentação completa de um caso real: agente autônomo de vendas no WhatsApp, números exatos, arquitetura, erros cometidos e o que faria diferente.
Este artigo não é teoria. É documentação linha a linha de um projeto real que a gente operou entre fevereiro e abril de 2026 pra um cliente do setor de serviços em SP.
Métricas finais: R$ 182.400 em receita nova em 45 dias, 630 conversas iniciadas, 118 vendas fechadas, ticket médio de R$ 1.546. Tudo via WhatsApp, sem vendedor humano tocar a conversa até o cliente confirmar o pagamento.
Se você está avaliando se vale a pena fazer isso na sua empresa, este texto responde as perguntas que você não ousa perguntar pra fornecedor.
O Cliente e o Desafio
Setor: serviços de estética (tratamento facial e corporal), 2 unidades em SP capital.
Situação antes do projeto:
- 4 recepcionistas atendendo WhatsApp em horário comercial
- Taxa de conversão de lead pra pacote pago: 8,7%
- Tempo médio de primeira resposta: 14 minutos
- 47% dos leads chegavam fora do horário e eram perdidos
- Faturamento WhatsApp: ~R$ 38 mil/mês
Meta acordada:
- Atender 100% dos leads em até 60 segundos
- Operar 24/7 sem aumentar o time
- Subir conversão pra pelo menos 15%
- Faturar R$ 100 mil+/mês via canal WhatsApp em 90 dias
A Arquitetura (Sem Esconder o Nome)
A gente não vai esconder o que funciona nem fingir que é mágica. Arquitetura completa:
Camada de entrada (WhatsApp):
- Integração direta com o WhatsApp via biblioteca oficial
- Fila em Redis pra não perder mensagem em pico
- Deduplicação de mensagem repetida no mesmo número
Camada de raciocínio:
- Modelo de linguagem de primeira linha com tool use nativo
- Prompt system de 3.200 caracteres com persona, tom e regras duras
- Memória persistente por contato via banco de dados
Camada de ferramentas (o que o agente chama):
consultar_tratamento(categoria, objetivo)— busca catálogo de 42 tratamentosconsultar_agenda(unidade, data)— horários livres em tempo realgerar_pix(valor, descricao, cliente)— chave PIX e QR code na horaconfirmar_pagamento(transaction_id)— webhook de confirmaçãocriar_cliente_no_sistema(dados)— grava no sistema de gestão da clínicamarcar_sessao(cliente_id, horario)— reserva na agendaescalar_humano(motivo)— quando agente não consegue resolver
Camada de observabilidade:
- Log estruturado de cada turno da conversa
- Dashboard em tempo real com funil (chegou, qualificou, proposto, pagou, agendou)
- Alerta em caso de: conversa longa sem conversão, erro de ferramenta, escalada
Guardrails aplicados:
- Proibido prometer desconto maior que 15% sem aprovação humana
- Proibido falar de resultado médico específico (regulação CRM/ANVISA)
- Sempre escalar pra humano se cliente mencionar: gravidez, condição médica, reclamação
- Sempre gerar contrato de termo de consentimento antes da sessão
Cronograma Real
Semana 1 — Diagnóstico. Li 400 conversas históricas, entrevistei as 4 recepcionistas, documentei 23 perguntas mais frequentes, mapeei objeções reais e o script real que cada uma usava (spoiler: nenhuma usava o mesmo).
Semana 2 — Desenvolvimento base. Integração WhatsApp, prompt engineering, setup do banco de dados de memória, rascunho das 7 ferramentas.
Semana 3 — Integrações. API do gateway de pagamento, API do sistema de gestão da clínica, API de agendamento. Tempo aqui foi 3x o previsto porque o sistema de gestão da clínica não tinha API e tivemos que construir adapter.
Semana 4 — Shadow mode. Agente processava conversa real, mas a gerente da clínica aprovava cada resposta antes de enviar. 280 mensagens revisadas, 34 correções aplicadas.
Semana 5 — Soft launch. Agente operando sozinho em 20% dos leads novos (split A/B com time humano). 4 dias de operação, ajuste final de prompt.
Semana 6 em diante — Operação plena. 100% dos leads novos no agente, time humano só no escalonamento.
Os Três Momentos em Que Quase Deu Errado
1. Alucinação de horário (semana 5)
Agente “marcou” sessão em horário que não existia na agenda, porque o retorno da API estava em formato inconsistente dependendo do dia. Cliente chegou na clínica e não tinha reserva. Prejuízo: 1 cliente bravo, 1 refund, 1 review ruim no Google.
Correção: validator estruturado no retorno da ferramenta. Se o formato não bate com o schema esperado, agente escala pra humano. Tempo de conserto: 4 horas. Nunca mais aconteceu.
2. Conversa infinita sem fechar (semana 6)
Cliente fazia pergunta técnica sobre tratamento, agente respondia bem, cliente fazia outra, e outra, e outra. 45 mensagens depois ainda não tinha fechado. Isso é metrificado como “deep engagement” mas na prática é agente inseguro pra pedir o fechamento.
Correção: ajuste de prompt pra que, depois da 5ª mensagem de dúvida técnica, o agente ofereça proativamente um teste presencial gratuito ou o pacote inicial com desconto. Conversão dessa faixa subiu de 4% pra 28%.
3. Agente prometendo resultado que não pode (semana 7)
Cliente perguntou “vou perder 5kg em 1 mês com esse tratamento?”. Agente, num primeiro teste, disse “sim, com disciplina”. Isso não pode em setor regulado. Guardrail não estava forte o suficiente.
Correção: adicionei na system prompt regra absoluta contra qualquer promessa de resultado específico, com lista de palavras gatilho (perder, emagrecer, elasticidade, etc). Em teste de estresse, agente passou a desviar com elegância: “resultado varia conforme metabolismo e rotina, a avaliação presencial te dará estimativa realista”.
Números Finais (45 Dias de Operação)
| Métrica | Antes | Depois | Variação |
|---|---|---|---|
| Leads atendidos/mês | 320 | 630 | +97% |
| Tempo 1ª resposta | 14 min | 12 s | -99% |
| Cobertura 24/7 | Não | Sim | — |
| Conversão lead → venda | 8,7% | 18,7% | +115% |
| Ticket médio | R$ 1.210 | R$ 1.546 | +28% |
| Faturamento WhatsApp/mês | R$ 38 mil | R$ 122 mil | +221% |
| Custo operacional do agente | — | R$ 2.800/mês | — |
Payback do projeto: 32 dias. Receita nova nos primeiros 45 dias: R$ 182.400.
O Que Eu Faria Diferente
-
Shadow mode mais longo. Fizemos 1 semana. Deveria ter sido 2. Os 2 primeiros problemas em produção teriam sido pegos antes.
-
Dashboard desde o dia 1. A gente colocou observabilidade boa só na semana 4. Perdemos visibilidade dos 3 primeiros dias de shadow.
-
Mais fricção pra escalar pra humano. No começo, agente escalava rápido demais, afogando o time humano com conversa banal. Calibramos depois, mas melhor ter calibrado antes.
-
Fluxo de follow-up automático. Tínhamos fluxo pra quem já comprou, não tínhamos pra quem foi proposto e não respondeu. Deixamos uns 15% de receita na mesa por 3 semanas antes de corrigir.
Conclusão
Agente autônomo de vendas funciona. Não é plug and play, não é mentira, não é chatbot embromado. É projeto sério que exige método.
Se você quer avaliar se faz sentido fazer algo parecido na sua operação, agende uma análise gratuita. A gente olha seu cenário atual, projeta números realistas e devolve um plano de 30/60/90 dias.
Sakaguchi IA — Inteligência Artificial para Empresas Brasileiras