🎯 O que você vai aprender neste artigo
• Como o cenário mudou com a redução de preços (até 55%) e a introdução do modelo Pay-As-You-Go (PAYG) em maio de 2026
• Flash vs Multilingual v2 vs Eleven v3 — Guia rápido para escolher o melhor modelo
• Tabela de planos e créditos (Free $0 a Business $990)
• Código prático para gerar seu primeiro áudio com Python
• Simulação de custos reais: 10 dublagens para YouTube / 1 audiolivro completo
📌 Introdução
Olá, aqui é o ElevenLabs Lab.
Muitos desenvolvedores evitavam integrar a API da ElevenLabs por considerá-la "cara demais". Contudo, tudo mudou no dia 7 de maio de 2026, quando a ElevenLabs anunciou oficialmente uma redução de preços de até 55% na API e a implementação do modelo Pay-As-You-Go (pagamento por uso).
Para o modelo Flash, o custo caiu de $0,11 para $0,05 por cada 1.000 caracteres.
Este guia foi elaborado para você, desenvolvedor que deseja começar agora. Se ainda estiver comparando soluções, recomendo ler nosso artigo Comparativo: ElevenLabs vs Google TTS vs Polly antes de seguir.
📖 Se você é iniciante, aqui estão 4 termos essenciais ⚡
• API = A interface que permite ao seu software acessar os recursos da ElevenLabs.
• API Key (Chave de API) = O seu "crachá" de acesso. Nunca compartilhe ou exponha essa chave publicamente.
• Créditos = Sua cota de caracteres. Renovada mensalmente conforme o plano, é consumida a cada áudio gerado.
• Streaming = Técnica onde o áudio começa a ser reproduzido enquanto ainda está sendo gerado, sem esperar o arquivo completo. Essencial para chatbots com resposta imediata.
🧠 1. Escolha do modelo — A tabela definitiva
Modelo | Preço (1k caracteres) | Idiomas | Ideal para |
|---|---|---|---|
Flash v2.5 / Turbo | $0,05 | 32 (Português ✓) | Chatbots, respostas em tempo real e processamento em massa. Latência de inferência de 75ms. |
Multilingual v2 | $0,10 | 29 (Português ✓) | Narração de textos longos, audiolivros e dublagens com qualidade consolidada. |
Eleven v3 | $0,10 | 70+ | Conteúdos que exigem nuances emocionais usando Audio Tags como [excited] ou [whispers] (Review do v3). |
▲ Fonte: elevenlabs.io/pricing/api · Documentação oficial (junho de 2026).
Em resumo: Para interações em tempo real, use o Flash. Para conteúdos que focam na emoção, use o v3 (ou Multilingual v2).
Como o modelo Flash consome menos créditos, ele é a escolha estratégica para fluxos de trabalho sensíveis ao custo, permitindo escalar para modelos superiores apenas onde a qualidade artística for a prioridade.
💳 2. Planos e estrutura de créditos
Plano | Valor/Mês | Créditos/Mês | Observações |
|---|---|---|---|
Free | $0 | 10K | Uso não comercial + atribuição obrigatória. |
Starter | $6 | 30K | Início do licenciamento comercial + Clonagem instantânea. |
Creator | $22 (50% off no 1º mês) | ~120K | Clonagem profissional (30min+ de áudio). |
Pro | $99 | 600K | |
Scale | $299 | 1.8M | |
Business | $990 | 6M | Excedente cobrado via PAYG. |
▲ Fonte: elevenlabs.io/pricing (junho de 2026).
💡 Por que o PAYG é um divisor de águas — Anteriormente, se os créditos acabassem, era necessário fazer upgrade para um plano superior. Agora, você paga apenas pelo excedente, permitindo que serviços com tráfego sazonal comecem em planos menores sem restrições.
🐍 3. Primeira chamada — Exemplo em Python
Usando o SDK oficial (`elevenlabs`), veja como converter texto em áudio:
from elevenlabs.client import ElevenLabs
client = ElevenLabs(api_key="SUA_CHAVE_API")
audio = client.text_to_speech.convert(
voice_id="VOICE_ID",
model_id="eleven_flash_v2_5", # Flash para tempo real, v3 para alta qualidade
text="Olá, este é um teste da API da ElevenLabs.",
)
with open("output.mp3", "wb") as f:
for chunk in audio:
f.write(chunk)Dicas práticas:
Precisa de streaming? Utilize o endpoint `stream` em vez de `convert` para enviar blocos de áudio ao buffer assim que chegarem. Essencial para chatbots e agentes de IA.
Segurança — Mantenha sua API Key sempre no backend. Utilize um proxy no seu servidor para evitar exposição no frontend.
Latência — Lembre-se de diferenciar a "inferência do modelo" do "TTFB (Time To First Byte)". O valor de 75ms da documentação refere-se estritamente à inferência.
Gerar API Key e começar gratuitamente →
🧮 4. Simulação de custos — Quanto você vai gastar?
Cálculo baseado nas taxas (Flash $0,05 / v3 $0,10 por 1k caracteres):
Cenário | Volume Estimado | Flash | v3 / Multilingual v2 |
|---|---|---|---|
10 vídeos/mês (YouTube) | 60k caracteres/mês | $3.00 | $6.00 |
1 Audiolivro | 300.000 caracteres | $15.00 | $30.00 |
Notificações em escala | 1.000.000 caracteres | $50.00 | $100.00 |
▲ Cálculo baseado nas taxas da API. Planos mensais podem reduzir ainda mais o custo efetivo.
Como você pode observar, o custo para criação de conteúdo mensal tornou-se extremamente acessível. Para a maioria dos criadores, a ElevenLabs é hoje o padrão ouro do mercado.
⚠️ 5. Checklist de boas práticas
Plano Free — Destinado apenas para uso não comercial.
Clonagem de voz — Disponível instantaneamente no plano Starter; a versão profissional exige o plano Creator.
Monitoramento — Acompanhe o uso no seu dashboard para gerenciar o consumo de créditos.
Teste comparativo — Antes de grandes projetos, compare o resultado de diferentes modelos. Seu ouvido é o melhor auditor.
🚀 Conclusão
Em 2026, a API da ElevenLabs consolidou-se como uma solução flexível com modelo "pay-as-you-go". Comece gratuitamente, teste os modelos e escolha o que melhor se adapta à sua aplicação.
Se você também planeja integrar reconhecimento de voz (STT), recomendo a leitura de Scribe vs Whisper vs Deepgram, e para aprender sobre o fluxo geral, confira nosso Guia de API de Voz AI.
Começar a usar a API da ElevenLabs (Grátis) →
Equipe ElevenLabs Lab. ⚡