2. Imagine que...
Cliente pergunta "minha NF saiu?" no WhatsApp. Hoje, alguém atende, abre 3 telas, copia, cola, responde. 5 minutos pra cada cliente. Volume = 60 atendimentos/dia = 5h/dia da pessoa.
WhatsApp IA: cliente pergunta → IA consulta sua base de NFe (com tool use), responde "sim, NFe 12345 emitida ontem 14h, chave de acesso XX, link DANFE:...". 5 segundos.
Mais: alerta proativo de pagamento, regra de cobrança, status fiscal, dúvida sobre nota fiscal — tudo no canal preferido do cliente.
3. Sem × Com
| Sem | Com | |
|---|---|---|
| Atendimento | Pessoa atende | IA com tool use |
| Volume | 60 atendimentos/dia × 5 min = 5h | 60 × 30s = 30 min |
| Resposta fiscal | Vai pro contador | IA com RAG LR responde |
| Cliente irritado | Pessoa percebe tarde | Sentiment alert imediato |
| Loop com cliente abusivo | Suga atendente | Rate limit 2 níveis |
| AI errando 3 vezes | Continua mandando errado | Circuit breaker |
| Eco de IA imitando IA | Drift de qualidade | Few-shot exclui resposta gerada por AI anterior |
4. O que faz
- WhatsApp Business API integrada (Meta + Twilio + alternativas).
- AI Responder autônomo — modo
autonomousMode=truepermite envio direto sem aprovação humana, controlado por categoria. - Categorias auto-enviadas (default): status, general, deadline, price (com tool use, IA tem dados reais).
- Categorias sempre-aprovação (default): nfe, tax, complaint (Lucro Real + risco legal).
- Tool use loop — máximo 5 iterações + 5s timeout interno. Modelo recomendado: Sonnet 4.6 (Haiku alucinou no POC).
- Rate limit 2 níveis —
limitPerPhone(default 10/h) +limitPerTenant(default 50/h). Redis-first + Prisma fallback. Bloqueia em erro. - Few-shot anti-eco — exemplos buscados em respostas humanas anteriores, excluindo respostas geradas pela própria AI.
- Circuit breaker — N rejeições consecutivas → força aprovação humana até admin resetar.
- Sentiment negativo — sempre notifica Telegram, mesmo em modo autônomo.
- Dry-run — testa config nova em produção sem enviar mensagem.
- Kill switch global —
WHATSAPP_AI_GLOBAL_DISABLE=truedesliga tudo imediatamente.
5. Quanto vale
| Item | Custo |
|---|---|
| Atendente WhatsApp (CLT) | R$ 3.500 - R$ 5.500 |
| WhatsApp API + chatbot legado | R$ 800 - R$ 3.000 |
| Cliente perdido por demora | variável |
6. Vídeo demo
Placeholder.
7. Para quem é
- Empresa com volume alto WhatsApp.
- SaaS com cliente B2B perguntando status.
- Empresa de serviço com dúvida fiscal recorrente.
- Distribuidor com motorista cliente.
- Atendimento técnico.
8. Como funciona
- Mensagem WhatsApp entra. AI classifica categoria.
- Rate limit 2 níveis check.
- Few-shot busca exemplo humano (excluindo eco AI).
- Tool use loop (max 5 iter, 5s timeout): IA chama tools (consulta NFe, status pedido, saldo, etc.).
- Resposta gerada. Categoria decide se auto-envia ou pede aprovação.
- Sentiment check → alert Telegram se negativo.
- Circuit breaker monitora — N rejeições força aprovação humana.
9. Case (placeholder)
[TBD.]
10. Integrações
- /modulos/rag-chat-empresa
- /modulos/ia-orquestrador
- /modulos/nfe-nfse-cte
- /modulos/contas-pagar-receber
- /modulos/ordens-de-servico
11. FAQ
Quais categorias a IA pode responder sozinha?
Default auto: status, general, deadline, price. Default sempre-aprovação: nfe, tax, complaint. Cada tenant configura.
E se a IA errar?
Circuit breaker: 3 rejeições consecutivas → força aprovação humana até admin resetar. Reset via POST /whatsapp/ai-responses/reset-circuit-breaker (admin only).
Vocês usam Haiku ou Sonnet?
Sonnet 4.6 recomendado. Haiku alucinou no POC com 4+ tools — não usar pra tool use complexo.
Como evitam loop com cliente abusivo?
Rate limit limitPerPhone (default 10 mensagens/h) e limitPerTenant (50/h). Redis-first + Prisma fallback. Bloqueia em erro.
Como evitam IA imitando IA?
Few-shot busca exemplos de respostas humanas anteriores, excluindo pares onde a outbound foi gerada por AI anterior. Sem isso, drift de estilo após 30 dias.
Cliente irritado é detectado?
Sim. Sentiment negativo SEMPRE notifica Telegram, mesmo em modo autônomo. Humano fica no loop em casos críticos.
Posso testar sem enviar?
Sim. whatsappAiDryRun=true grava status=DRY_RUN, NÃO envia, NÃO notifica aprovação.
12. Módulos relacionados
13. CTA final
- Primário: "Quero WhatsApp com IA" → /demo