🎯 Czego dowiesz się z tego artykułu?
• Co zmieniło się po obniżce cen w maju 2026 r. (nawet o 55%) oraz wprowadzeniu modelu płatności Pay-As-You-Go
• Flash vs Multilingual v2 vs Eleven v3 — szybkie zestawienie, który model wybrać
• Tabela planów i kredytów (od Free $0 do Business $990)
• Minimalny kod w Pythonie do wygenerowania pierwszej próbki głosu
• Symulacja rzeczywistych kosztów dla projektów typu: 10 odcinków na YouTube / 1 audiobook
📌 Wstęp
Cześć, tu ElevenLabs Lab.
Przez długi czas wielu deweloperów powtarzało: „ElevenLabs API jest świetne, ale zbyt drogie”. Sytuacja zmieniła się 7 maja 2026 roku, kiedy to oficjalnie ogłoszono obniżkę cen API o nawet 55% oraz wdrożenie elastycznego modelu Pay-As-You-Go.
Dla modelu Flash cena za 1000 znaków spadła z $0.11 do zaledwie $0.05.
Ten artykuł to przewodnik „od zera” dla programistów, którzy chcą zintegrować nasze rozwiązanie. Jeśli potrzebujesz najpierw porównania z konkurencyjnymi narzędziami, sprawdź nasz wpis o ElevenLabs vs Google TTS vs Polly.
📖 Jeśli dopiero zaczynasz — szybka lekcja pojęć ⚡
• API = „kanał komunikacji”, dzięki któremu Twój program może korzystać z funkcji ElevenLabs.
• Klucz API = „przepustka” do Twojego konta. Nigdy nie udostępniaj go publicznie.
• Kredyty = jednostki rozliczeniowe przeliczane na liczbę znaków. Są odnawiane co miesiąc i zużywane przy każdej generacji mowy.
• Streaming = sposób odtwarzania dźwięku bez czekania na wygenerowanie całego pliku. Niezbędny w czatach głosowych, gdzie liczy się natychmiastowa reakcja.
🧠 1. Wybór modelu — ta tabela wystarczy
Model | Cena (1k znaków) | Języki | Zastosowanie |
|---|---|---|---|
Flash v2.5 / Turbo | $0.05 | 32 (w tym PL ✓) | Czaty, reakcje w czasie rzeczywistym, duże wolumeny danych. Opóźnienie wnioskowania ok. 75ms (uwaga: TTFB z siecią może być dłuższy). |
Multilingual v2 | $0.10 | 29 (w tym PL ✓) | Długie narracje, audiobooki, sprawdzona jakość dla dubbingu. |
Eleven v3 | $0.10 | 70+ (w tym PL ✓) | Wymaga emocji typu [excited], [whispers] za pomocą Audio Tags (recenzja v3). |
▲ Źródło: elevenlabs.io/pricing/api · Dokumentacja oficjalna (stan na czerwiec 2026).
Krótka zasada: jeśli potrzebujesz szybkości, wybierz Flash; jeśli liczy się jakość treści, wybierz v3 (lub Multilingual v2).
Modele z serii Flash zużywają mniej kredytów, dlatego w projektach wrażliwych na koszty warto zaczynać od Flash, a tylko wybrane, wymagające segmenty audio przekierowywać na wyższe modele.
💳 2. Plany i struktura kredytów
Plan | Cena/mc | Kredyty/mc | Uwagi |
|---|---|---|---|
Free | $0 | 10K | Użytek niekomercyjny + obowiązkowe oznaczenie źródła |
Starter | $6 | 30K | Licencja komercyjna + Instant Voice Cloning (1–2 min próbki) |
Creator | $22 (pierwszy miesiąc -50%) | ~120K | Professional Voice Cloning (30+ min próbki audio) |
Pro | $99 | 600K | - |
Scale | $299 | 1.8M | - |
Business | $990 | 6M | Po przekroczeniu limitu: Pay-As-You-Go |
▲ Źródło: elevenlabs.io/pricing. Plany API są oddzielne od planów typu „Creator” — sprawdź zakładkę pricing/api.
💡 Dlaczego PAYG (Pay-As-You-Go) jest tak ważne? — Wcześniej, gdy kończyły się kredyty, trzeba było przechodzić na wyższy plan subskrypcyjny. Teraz płacisz tylko za nadwyżkę, co pozwala znacznie lepiej zarządzać budżetem przy zmiennym obciążeniu.
🐍 3. Pierwsza integracja — przykładowy kod w Pythonie
Używając oficjalnego SDK (pakiet `elevenlabs`), oto kod zmieniający tekst na plik mp3:
from elevenlabs.client import ElevenLabs
client = ElevenLabs(api_key="TWÓJ_KLUCZ_API") # Pobierz z panelu użytkownika
audio = client.text_to_speech.convert(
voice_id="VOICE_ID", # Wybrany ID głosu z biblioteki
model_id="eleven_flash_v2_5", # flash dla real-time, eleven_v3 dla contentu
text="Cześć, to test API od ElevenLabs.",
)
with open("output.mp3", "wb") as f:
for chunk in audio:
f.write(chunk)Kilka praktycznych porad:
Potrzebujesz streamingu? Zamiast `convert`, użyj endpointu `stream` i przekazuj pakiety (chunk) bezpośrednio do bufora odtwarzacza. To kluczowe w agentach AI, gdzie czas reakcji jest wszystkim.
Bezpieczeństwo przede wszystkim — Klucz API przechowuj tylko na serwerze. Nigdy nie umieszczaj go bezpośrednio w kodzie front-endu. Skorzystaj z proxy endpointu.
Pomiar opóźnień — Zawsze rozróżniaj „czas wnioskowania modelu” od „TTFB (Time To First Byte)”. Oficjalne 75ms to czas przetwarzania; sieć dorzuci swoje.
Odbierz klucz API i zacznij za darmo →
🧮 4. Symulacja kosztów — ile zapłacisz?
Oto obliczenia oparte na oficjalnych stawkach ($0.05 za 1k znaków dla Flash, $0.10 dla v3/Multilingual v2):
Scenariusz | Założenie | Flash | v3 / Multilingual v2 |
|---|---|---|---|
YouTube: 10 odcinków | 6k znaków na odcinek | $3.00 | $6.00 |
Audiobook | 300,000 znaków | $15.00 | $30.00 |
Automatyzacja powiadomień | 1,000,000 znaków | $50.00 | $100.00 |
▲ Symulacja oparta na stawkach API. Pamiętaj, że plan subskrypcyjny zawiera pulę kredytów, co realnie obniża koszty dodatkowe.
Jak widzisz, przy standardowej produkcji treści (kilkadziesiąt/kilkaset tysięcy znaków) koszty są minimalne. Przy skali powyżej miliona znaków miesięcznie, warto rozważyć nasze plany Enterprise.
⚠️ 5. Lista kontrolna przed startem
Nie używaj planu Free do celów komercyjnych — Plan Free służy do testów i wymaga oznaczenia źródła. Komercyjna licencja zaczyna się od planu Starter ($6/mc).
Sprawdź uprawnienia klonowania — Instant Cloning dostępny od planu Starter, Professional Cloning od planu Creator.
Monitoring zużycia — Regularnie sprawdzaj panel użytkownika. Jeśli zauważysz gwałtowny spadek kredytów, sprawdź, czy aplikacja nie używa zbyt kosztownego modelu tam, gdzie wystarczyłby Flash.
Testy odsłuchowe — Zawsze porównuj próbki na własnym tekście. Każdy model brzmi inaczej w zależności od intonacji i języka.
🚀 Podsumowanie
API ElevenLabs w 2026 roku to już nie „droga zabawa”, a elastyczne narzędzie, z którym zaczniesz nawet od $0 i zapłacisz dokładnie za to, co zużyjesz.
Jeśli planujesz też wdrożyć rozpoznawanie mowy (STT), koniecznie zobacz nasze porównanie Scribe vs Whisper vs Deepgram, a podstawy integracji znajdziesz w przewodniku Voice AI API.
Zacznij korzystać z ElevenLabs API (za darmo) →
Pozdrowienia od ElevenLabs Lab! ⚡