Pus um agente de voz ao telefone para um estúdio de Pilates
Há algumas semanas lancei um agente de voz que atende o telefone para dois estúdios de Pilates — por isso, os donos nunca tiveram de contratar uma rececionista.

Há algumas semanas lancei um agente de voz que atende o telefone para dois estúdios de Pilates — por isso, os donos nunca tiveram de contratar uma rececionista.
Aqui está a stack, por mais pouco glamorosa que seja:
- O Vapi trata da camada de voz: text-to-speech, speech-to-text, orquestração de chamadas.
- A Vonage fornece o número de telefone português e SIP trunking.
- Um webhook em AWS Lambda recebe o contexto da conversa em direto e chama a OpenAI com um pequeno conjunto de ferramentas: verificar disponibilidade das aulas, reservar, reagendar, encaminhar para um humano.
- As reservas entram no mesmo backend PostgreSQL (medallion: raw → core → mart) que alimenta os nossos dashboards no Metabase.
- O Pulumi provisiona tudo em Python — sem click-ops.
Custo de execução: um valor residual para o negócio.
Valor: sem custos de rececionista, sem chamadas perdidas e horas por semana devolvidas aos donos para ensinarem e fazerem crescer o estúdio.
Nos próximos dois posts, vou partilhar três coisas nada óbvias que aprendi ao lançar isto — começando pela que mais me surpreendeu: o modelo é a parte mais fácil.
Já lançaste alguma Gen-AI em produção? Qual foi a complexidade inesperada?
P.S. Novo post tech toda a quarta-feira.
#GenAI #AppliedAI #Serverless