Construir ou comprar o teu agente de voz de IA? Essa é a pergunta errada.
Os líderes de tecnologia fazem-me uma pergunta recorrente: devemos comprar uma plataforma IVR ou de contact centre pronta a usar, ou construir nós próprios um agente de voz Gen-AI?

Os líderes de tecnologia fazem-me uma pergunta recorrente: devemos comprar uma plataforma IVR ou de contact centre pronta a usar, ou construir nós próprios um agente de voz Gen-AI?
Na minha experiência, esse enquadramento leva à conversa errada. A decisão que importa é que camadas compras e onde traças a linha entre construir e comprar.
Para contexto: lancei um agente de voz para dois estúdios de Pilates em Portugal — Vonage para telephony, Vapi para a camada de voz, OpenAI para raciocínio, AWS Lambda para o webhook de orquestração, PostgreSQL para o sistema de reservas, Pulumi para a infraestrutura. Os donos dos estúdios nunca tiveram de contratar uma rececionista.
A framework em camadas que eu recomendaria:
Compra sempre
— Telefonia e SIP trunking (Vonage, Twilio, Bandwidth). As relações com as operadoras e o trabalho regulatório levam anos.
— Infraestrutura de voz — TTS, STT, turn-taking (Vapi, Deepgram, Speechmatics, ElevenLabs, Azure Speech). Os orçamentos de latência e a deriva dos modelos são problemas a tempo inteiro para estes fornecedores.
— O foundation model em si (OpenAI, Anthropic, Google, Mistral). Já não se discute, neste ponto.
Considera comprar uma plataforma completa
Uma plataforma CCaaS ou de conversational AI chave-na-mão — Talkdesk, Genesys Cloud, AWS Connect, Five9, NICE CXone, Cognigy, Voiceflow — merece o seu lugar quando:
— Os volumes de chamadas estão na faixa dos 10k+ por dia, com gestão de filas, failover de agentes e monitorização de supervisores necessária logo de origem.
— A lógica de negócio pode ser expressa num visual flow builder sem perder fidelidade.
— A postura de compliance (PCI DSS, HIPAA, SOC 2) é algo que preferes herdar de um fornecedor certificado em vez de construir internamente.
— A capacidade de engenharia é o constrangimento, e assumir o agent loop não é realista nos próximos doze meses.
Constrói sempre
— O raciocínio do agente, os prompts e as definições das tools. A diferenciação do teu negócio vive aqui.
— Integrações com os teus sistemas de domínio — booking, CRM, ERP, billing. Nenhum fornecedor conhece o teu data model.
— A suite de avaliação que corre em cada deploy. Um pequeno conjunto de cenários canónicos com tool calls esperadas e estado final esperado é o que separa "lançamos Gen-AI" de "lançamos Gen-AI com confiança." As plataformas dos fornecedores não vão testar aquilo que realmente te importa.
Para os dois estúdios, a conta era clara. Nem de perto 10k chamadas por dia. Nenhuma equipa de supervisão para alocar. Lógica de negócio demasiado específica de cada estúdio para qualquer flow builder. Construir foi a decisão certa — mas comprei cerca de 70 por cento da stack a fornecedores especializados.
A pergunta certa para a maioria dos líderes de tecnologia não é "construir ou comprar." É "que 70 por cento estamos a comprar, e os 30 por cento restantes são a parte do sistema que nos deve diferenciar?"
Como traçaste a linha na tua última decisão de construir uma solução de AI?
P.S. Novo post tech toda a quarta-feira.
#GenAI #AppliedAI #TechLeadership