🎯 Cosa imparerai in questo articolo
• Le novità dopo il taglio dei prezzi di maggio 2026 (fino al -55%) e l'introduzione del sistema Pay-As-You-Go
• Flash vs Multilingual v2 vs Eleven v3 — Guida rapida alla scelta del modello
• Panoramica di piani e crediti (dal piano Free a $0 al Business a $990)
• Esempio minimo di codice in Python per generare il primo output audio
• Simulazione costi: 10 video YouTube/mese o 1 audiolibro — quanto spenderai realmente?
📌 Introduzione
Un saluto a tutti da ElevenLabs Lab.
Molti sviluppatori hanno a lungo considerato le API di ElevenLabs come soluzioni estremamente potenti, ma spesso percepite come onerose. Tuttavia, dal 7 maggio 2026, ElevenLabs ha annunciato un taglio dei prezzi delle API fino al 55% e l'adozione del modello Pay-As-You-Go, cambiando radicalmente le regole del settore.
Per il modello Flash, il costo per 1.000 caratteri è sceso da $0,11 a soli $0,05.
Questa guida è pensata per chiunque desideri integrare le nostre API fin da oggi. Se stai valutando alternative, ti consigliamo di leggere prima il nostro approfondimento: ElevenLabs vs Google TTS vs Amazon Polly.
📖 Se sei alle prime armi, chiariamo 4 concetti chiave ⚡
• API = Il "canale di comunicazione" che consente al tuo software di interfacciarsi con le funzioni di ElevenLabs.
• API Key = Il tuo "pass d'accesso" personale. Custodiscila con la massima cura e non condividerla mai.
• Crediti = La valuta utilizzata per il conteggio dei caratteri. Vengono assegnati ogni mese e scalati in base all'utilizzo.
• Streaming = La tecnologia che permette di riprodurre l'audio in tempo reale man mano che viene generato, ideale per chatbot o assistenti vocali.
🧠 1. Scegliere il modello ideale
Modello | Costo (1.000 car.) | Lingue | Uso consigliato |
|---|---|---|---|
Flash v2.5 / Turbo | $0,05 | 32 | Chatbot, interazioni real-time, alti volumi. Latenza ridotta (~75ms, il TTFB effettivo dipende dalla rete). |
Multilingual v2 | $0,10 | 29 | Narrazioni prolungate, audiolibri, doppiaggio professionale. |
Eleven v3 | $0,10 | 70+ | Contenuti espressivi che richiedono Audio Tags come [excited] o [whispers] (Recensione v3). |
▲ Fonte: elevenlabs.io/pricing/api · Documentazione ufficiale (aggiornata a giugno 2026)
Regola aurea: Flash per il tempo reale, v3 (o Multilingual v2) per produzioni editoriali di alta qualità.
La famiglia Flash consuma meno crediti anche a parità di testo, risultando ottimale per pipeline sensibili ai costi. Molti sviluppatori iniziano con Flash per poi passare ai modelli superiori solo laddove la qualità della voce sia il fattore determinante.
💳 2. Piani e Crediti
Piano | Costo/mese | Crediti/mese | Note |
|---|---|---|---|
Free | $0 | 10K | Uso non commerciale + obbligo di attribuzione. |
Starter | $6 | 30K | Licenza commerciale + Instant Voice Cloning. |
Creator | $22 (50% off primo mese) | ~120K | Professional Voice Cloning (30+ min audio). |
Pro | $99 | 600K | - |
Scale | $299 | 1.8M | - |
Business | $990 | 6M | Eventuali eccedenze tramite Pay-As-You-Go. |
▲ Fonte: elevenlabs.io/pricing (verificata a giugno 2026). Consulta la pagina pricing/api per i dettagli tecnici.
💡 Perché il Pay-As-You-Go cambia tutto? — In passato, terminati i crediti, eri obbligato a passare al piano superiore. Ora, paghi solo l'eccedenza. Questo permette ai servizi con picchi di traffico imprevedibili di ottimizzare le risorse partendo dal piano più adatto alle proprie necessità.
🐍 3. Primo step — Esempio minimo in Python
Utilizzando il nostro SDK ufficiale, ecco come convertire un testo in un file MP3:
from elevenlabs.client import ElevenLabs
client = ElevenLabs(api_key="TUA_API_KEY") # Recuperala dalla dashboard
audio = client.text_to_speech.convert(
voice_id="ID_VOCE", # Scegli una voce dalla Voice Library
model_id="eleven_flash_v2_5", # flash per real-time, v3 per alta qualità
text="Buongiorno, questo è un test delle API di ElevenLabs.",
)
with open("output.mp3", "wb") as f:
for chunk in audio:
f.write(chunk)Consigli pratici:
Per lo streaming: utilizza l'endpoint stream invece di convert. È fondamentale per chatbot e assistenti in cui la latenza di risposta (TTFB) è critica.
Sicurezza: non inserire mai la tua API Key lato frontend. Utilizza sempre un server proxy per proteggerla.
Latenza: ricorda di distinguere tra "tempo di inferenza del modello" e "TTFB includendo la rete". Se il tuo server è situato in Italia, effettua dei test per misurare la latenza reale nel tuo ambiente.
Ottieni la tua API Key e inizia gratis →
🧮 4. Simulazione costi — Quale budget prevedere?
Basato sulle tariffe correnti ($0,05/1K caratteri per Flash, $0,10/1K per v3/Multilingual v2):
Scenario | Volume stimato | Flash | v3 / Multilingual v2 |
|---|---|---|---|
10 video YouTube/mese | 60K car./mese | $3,00 | $6,00 |
1 Audiolibro | 300.000 car. | $15,00 | $30,00 |
Notifiche audio | 1.000.000 car. | $50,00 | $100,00 |
▲ Calcolo basato sulle tariffe API. I crediti inclusi nei piani mensili ottimizzano ulteriormente la spesa.
Come puoi notare, per la creazione di contenuti su scala media, i costi risultano estremamente competitivi. Pianificare il budget basandosi su questi dati ti consentirà di scalare il progetto con la massima precisione.
⚠️ 5. Checklist prima di partire
Limiti del piano Free — Il piano gratuito è destinato esclusivamente a usi personali con obbligo di attribuzione. Per scopi commerciali, il piano Starter ($6/mese) è il punto di partenza.
Clonazione vocale — L'Instant Cloning è incluso dal piano Starter, mentre quello Professional (per campioni audio di oltre 30 minuti) è disponibile dal piano Creator.
Monitoraggio crediti — Controlla regolarmente la dashboard. Se i consumi eccedono le aspettative, valuta il modello in uso.
Testa la qualità — Ascolta sempre la resa del modello con i tuoi testi prima di passare alla produzione su larga scala.
🚀 Conclusioni
Nel 2026, le API di ElevenLabs si sono evolute da "soluzione premium" a uno "strumento flessibile basato sull'effettivo utilizzo". Sperimenta gratuitamente, confronta i modelli e scala il progetto insieme alla tua crescita.
Se stai integrando anche la tecnologia STT, dai uno sguardo a Scribe vs Whisper vs Deepgram, mentre per un workflow standard consulta la nostra Guida all'integrazione Voice AI.
Inizia subito con ElevenLabs API (gratis) →
Un saluto da ElevenLabs Lab. ⚡