Redução de até 55% na API da ElevenLabs: Guia completo de uso sob demanda

Com a redução de preços de até 55% e a introdução do modelo de cobrança sob demanda em maio de 2026, integrar a API da ElevenLabs ficou muito mais acessível. Este guia, idealizado para desenvolvedores como Beatriz Silva, detalha como escolher entre os modelos Flash, Multilingual v2 e v3, além de explicar a nova estrutura de créditos e custos. Incluímos exemplos de integração em Python e simulações de gastos para dublagem de vídeos e audiolivros. Otimize seus custos de IA pagando apenas pelo que usar via WhatsApp ou sistemas próprios.

🎯 O que você vai aprender neste artigo

• Como o cenário mudou com a redução de preços (até 55%) e a introdução do modelo Pay-As-You-Go (PAYG) em maio de 2026
• Flash vs Multilingual v2 vs Eleven v3 — Guia rápido para escolher o melhor modelo
• Tabela de planos e créditos (Free $0 a Business $990)
Código prático para gerar seu primeiro áudio com Python
• Simulação de custos reais: 10 dublagens para YouTube / 1 audiolivro completo

 

📌 Introdução

Olá, aqui é o ElevenLabs Lab.

Muitos desenvolvedores evitavam integrar a API da ElevenLabs por considerá-la "cara demais". Contudo, tudo mudou no dia 7 de maio de 2026, quando a ElevenLabs anunciou oficialmente uma redução de preços de até 55% na API e a implementação do modelo Pay-As-You-Go (pagamento por uso).

Para o modelo Flash, o custo caiu de $0,11 para $0,05 por cada 1.000 caracteres.

Este guia foi elaborado para você, desenvolvedor que deseja começar agora. Se ainda estiver comparando soluções, recomendo ler nosso artigo Comparativo: ElevenLabs vs Google TTS vs Polly antes de seguir.

 

 

📖 Se você é iniciante, aqui estão 4 termos essenciais ⚡

API = A interface que permite ao seu software acessar os recursos da ElevenLabs.
API Key (Chave de API) = O seu "crachá" de acesso. Nunca compartilhe ou exponha essa chave publicamente.
Créditos = Sua cota de caracteres. Renovada mensalmente conforme o plano, é consumida a cada áudio gerado.
Streaming = Técnica onde o áudio começa a ser reproduzido enquanto ainda está sendo gerado, sem esperar o arquivo completo. Essencial para chatbots com resposta imediata.

 

🧠 1. Escolha do modelo — A tabela definitiva

Modelo

Preço (1k caracteres)

Idiomas

Ideal para

Flash v2.5 / Turbo

$0,05

32 (Português ✓)

Chatbots, respostas em tempo real e processamento em massa. Latência de inferência de 75ms.

Multilingual v2

$0,10

29 (Português ✓)

Narração de textos longos, audiolivros e dublagens com qualidade consolidada.

Eleven v3

$0,10

70+

Conteúdos que exigem nuances emocionais usando Audio Tags como [excited] ou [whispers] (Review do v3).

▲ Fonte: elevenlabs.io/pricing/api · Documentação oficial (junho de 2026).

 

Em resumo: Para interações em tempo real, use o Flash. Para conteúdos que focam na emoção, use o v3 (ou Multilingual v2).

Como o modelo Flash consome menos créditos, ele é a escolha estratégica para fluxos de trabalho sensíveis ao custo, permitindo escalar para modelos superiores apenas onde a qualidade artística for a prioridade.

 

💳 2. Planos e estrutura de créditos

Plano

Valor/Mês

Créditos/Mês

Observações

Free

$0

10K

Uso não comercial + atribuição obrigatória.

Starter

$6

30K

Início do licenciamento comercial + Clonagem instantânea.

Creator

$22 (50% off no 1º mês)

~120K

Clonagem profissional (30min+ de áudio).

Pro

$99

600K

Scale

$299

1.8M

Business

$990

6M

Excedente cobrado via PAYG.

▲ Fonte: elevenlabs.io/pricing (junho de 2026).

 

💡 Por que o PAYG é um divisor de águas — Anteriormente, se os créditos acabassem, era necessário fazer upgrade para um plano superior. Agora, você paga apenas pelo excedente, permitindo que serviços com tráfego sazonal comecem em planos menores sem restrições.

 

🐍 3. Primeira chamada — Exemplo em Python

Usando o SDK oficial (`elevenlabs`), veja como converter texto em áudio:

from elevenlabs.client import ElevenLabs

client = ElevenLabs(api_key="SUA_CHAVE_API") 

audio = client.text_to_speech.convert(
    voice_id="VOICE_ID",            
    model_id="eleven_flash_v2_5",   # Flash para tempo real, v3 para alta qualidade
    text="Olá, este é um teste da API da ElevenLabs.",
)

with open("output.mp3", "wb") as f:
    for chunk in audio:
        f.write(chunk)

Dicas práticas:

  • Precisa de streaming? Utilize o endpoint `stream` em vez de `convert` para enviar blocos de áudio ao buffer assim que chegarem. Essencial para chatbots e agentes de IA.

  • Segurança — Mantenha sua API Key sempre no backend. Utilize um proxy no seu servidor para evitar exposição no frontend.

  • Latência — Lembre-se de diferenciar a "inferência do modelo" do "TTFB (Time To First Byte)". O valor de 75ms da documentação refere-se estritamente à inferência.

 

Gerar API Key e começar gratuitamente →

 

🧮 4. Simulação de custos — Quanto você vai gastar?

Cálculo baseado nas taxas (Flash $0,05 / v3 $0,10 por 1k caracteres):

Cenário

Volume Estimado

Flash

v3 / Multilingual v2

10 vídeos/mês (YouTube)

60k caracteres/mês

$3.00

$6.00

1 Audiolivro

300.000 caracteres

$15.00

$30.00

Notificações em escala

1.000.000 caracteres

$50.00

$100.00

▲ Cálculo baseado nas taxas da API. Planos mensais podem reduzir ainda mais o custo efetivo.

 

Como você pode observar, o custo para criação de conteúdo mensal tornou-se extremamente acessível. Para a maioria dos criadores, a ElevenLabs é hoje o padrão ouro do mercado.

 

⚠️ 5. Checklist de boas práticas

  • Plano Free — Destinado apenas para uso não comercial.

  • Clonagem de voz — Disponível instantaneamente no plano Starter; a versão profissional exige o plano Creator.

  • Monitoramento — Acompanhe o uso no seu dashboard para gerenciar o consumo de créditos.

  • Teste comparativo — Antes de grandes projetos, compare o resultado de diferentes modelos. Seu ouvido é o melhor auditor.

 

🚀 Conclusão

Em 2026, a API da ElevenLabs consolidou-se como uma solução flexível com modelo "pay-as-you-go". Comece gratuitamente, teste os modelos e escolha o que melhor se adapta à sua aplicação.

Se você também planeja integrar reconhecimento de voz (STT), recomendo a leitura de Scribe vs Whisper vs Deepgram, e para aprender sobre o fluxo geral, confira nosso Guia de API de Voz AI.

 

Começar a usar a API da ElevenLabs (Grátis) →

 

Equipe ElevenLabs Lab. ⚡