🎯 Yang Akan Anda Pelajari di Artikel Ini
• Apa saja perubahan setelah penurunan harga hingga 55% + sistem Pay-As-You-Go (PAYG) per Mei 2026
• Flash vs Multilingual v2 vs Eleven v3 — Panduan ringkas memilih model terbaik
• Tabel struktur paket & kredit (Free $0 hingga Business $990)
• Kode Python paling sederhana untuk memulai pembuatan suara pertama Anda
• Simulasi biaya nyata: 10 video YouTube sebulan / 1 buku audio
📌 Pendahuluan
Halo, selamat datang di Elevenlabs Lab.
Selama ini, banyak pengembang melirik API ElevenLabs dan berpikir, "Kualitasnya memang bagus, tapi harganya cukup tinggi," sehingga mereka ragu untuk mencobanya.
Namun, keadaan berubah drastis setelah ElevenLabs resmi mengumumkan penurunan harga API hingga 55% + pengenalan sistem Pay-As-You-Go (PAYG) melalui blog resminya pada tanggal 7 Mei 2026.
Sebagai contoh, biaya untuk model Flash turun dari $0,11 per 1.000 karakter menjadi hanya $0,05.
Artikel ini adalah panduan awal yang dirancang khusus bagi para pengembang yang ingin mengintegrasikan API ini ke dalam proyek mereka.
Jika Anda ingin membandingkannya terlebih dahulu dengan API pesaing, silakan baca artikel Perbandingan ElevenLabs vs Google TTS vs Polly.
📖 Baru Pertama Kali Belajar Development? — Mari Pahami 4 Istilah Ini ⚡
• API = "Jalur penghubung" yang memungkinkan aplikasi Anda menggunakan fitur-fitur dari ElevenLabs.
• API Key = "Kunci akses" akun Anda untuk menggunakan layanan tersebut. Jangan pernah membagikan kunci ini kepada siapa pun!
• Kredit = Kuota penggunaan yang dihitung berdasarkan jumlah karakter. Kredit ini diperbarui setiap bulan sesuai paket Anda dan berkurang setiap kali Anda menghasilkan suara.
• Streaming = Metode pemutaran audio secara langsung saat proses pembuatan masih berjalan, tanpa harus menunggu seluruh file selesai. Sangat berguna untuk kebutuhan respons instan seperti pada chatbot.
🧠 1. Memilih Model — Cukup Lihat Tabel Ini
Model | Harga (1.000 Karakter) | Bahasa | Gunakan Jika... |
|---|---|---|---|
Flash v2.5 / Turbo | $0.05 | 32 Bahasa (Termasuk Bhs. Indonesia ✓) | Chatbot, respons real-time, pemrosesan massal. Latensi inferensi model sekitar 75ms (Perlu diingat, TTFB aktual akan bergantung pada latensi jaringan). |
Multilingual v2 | $0.10 | 29 Bahasa (Termasuk Bhs. Indonesia ✓) | Narasi panjang, buku audio, dubbing dengan kualitas dasar yang stabil |
Eleven v3 | $0.10 | 70+ Bahasa (Termasuk Bhs. Indonesia ✓) | Konten yang membutuhkan ekspresi emosi mendalam menggunakan Audio Tags seperti [excited] atau [whispers] (Review v3) |
▲ Sumber: elevenlabs.io/pricing/api · Dokumentasi resmi (Dikonfirmasi per Juni 2026)
Saran praktis: Gunakan Flash untuk kebutuhan real-time, gunakan v3 (atau Multilingual v2) untuk konten yang memerlukan kualitas narasi tinggi.
Struktur pengurangan kredit untuk seri Flash dirancang agar lebih ekonomis. Oleh karena itu, pola yang paling efisien untuk pipeline Anda adalah memulai dengan Flash, lalu beralih ke model yang lebih tinggi pada bagian-bagian spesifik yang membutuhkan kualitas audio lebih prima.
💳 2. Paket & Struktur Kredit
Paket | Biaya/Bulan | Kredit/Bulan | Catatan |
|---|---|---|---|
Free | $0 | 10K | Non-komersial + Wajib Atribusi — Tidak boleh digunakan untuk konten berbayar/monetisasi |
Starter | $6 | 30K | Lisensi komersial mulai berlaku + Instant Voice Cloning (audio 1–2 menit) |
Creator | $22 (Diskon 50% bulan pertama) | ~120K | Professional Voice Cloning (audio 30+ menit) |
Pro | $99 | 600K | |
Scale | $299 | 1.8M | |
Business | $990 | 6M | Kelebihan kuota akan dikenakan sistem Pay-As-You-Go (PAYG) |
▲ Sumber: elevenlabs.io/pricing (Dikonfirmasi per Juni 2026). Paket Kreatif dan paket API bersifat terpisah. Pastikan Anda merujuk pada halaman pricing/api untuk kebutuhan development.
💡 Mengapa Pay-As-You-Go (PAYG) Sangat Penting? — Sebelumnya, jika kredit habis di tengah bulan, Anda harus meningkatkan paket secara manual.
Kini, Anda cukup membayar biaya ekstra sesuai pemakaian yang melebihi kuota. Hal ini sangat memudahkan layanan dengan "lonjakan trafik tidak terduga" untuk tetap efisien tanpa harus langsung beralih ke paket yang lebih mahal.
🐍 3. Panggilan Pertama — Contoh Kode Python Sederhana
Berikut adalah contoh kode minimal untuk mengubah teks menjadi file MP3 menggunakan SDK resmi (package elevenlabs):
from elevenlabs.client import ElevenLabs
client = ElevenLabs(api_key="YOUR_API_KEY") # Masukkan kunci API Anda
audio = client.text_to_speech.convert(
voice_id="VOICE_ID", # ID suara yang dipilih dari Voice Library
model_id="eleven_flash_v2_5", # Gunakan flash untuk real-time, v3 untuk kualitas narasi
text="Halo, ini adalah uji coba API ElevenLabs dalam Bahasa Indonesia.",
)
with open("output.mp3", "wb") as f:
for chunk in audio:
f.write(chunk)Beberapa tips praktis:
Jika memerlukan streaming, gunakan endpoint stream alih-alih convert, lalu kirimkan chunk ke buffer pemutar segera setelah diterima. Hal ini sangat krusial untuk menurunkan waktu tunggu respons pada chatbot atau agen AI.
Simpan API Key hanya di server — Jangan pernah meletakkan API Key di sisi frontend (client-side) karena rawan dicuri. Selalu gunakan proxy endpoint sebagai langkah keamanan dasar.
Saat membandingkan latensi, selalu bedakan antara "waktu inferensi model" dan "TTFB (Time To First Byte) termasuk jaringan".
Dokumentasi menyebutkan 75ms untuk inferensi model. Untuk performa riil di Indonesia, disarankan melakukan benchmarking sendiri dari lokasi server Anda.
Dapatkan API Key dan Mulai Gratis →
🧮 4. Simulasi Biaya — Berapa Estimasi untuk Proyek Anda?
Berikut adalah simulasi biaya berdasarkan tarif API resmi (Flash $0.05/1.000 karakter, v3 & Multilingual v2 $0.10/1.000 karakter):
Skenario | Asumsi Volume | Flash | v3 / Multilingual v2 |
|---|---|---|---|
10 Video Narasi YouTube sebulan | 6.000 karakter/video | $3.00 (Sekitar Rp48.000) | $6.00 (Sekitar Rp96.000) |
1 Buku Audio | 300.000 karakter | $15.00 (Sekitar Rp240.000) | $30.00 (Sekitar Rp480.000) |
Notifikasi Pelanggan | 1.000.000 karakter/bulan | $50.00 (Sekitar Rp800.000) | $100.00 (Sekitar Rp1.600.000) |
▲ Estimasi konversi biaya. Biaya aktual mungkin lebih rendah jika Anda berlangganan paket yang menyertakan kuota karakter bulanan.
Seperti yang Anda lihat, untuk skala produksi konten menengah, biaya ElevenLabs sangat terjangkau. Namun, untuk kebutuhan massal (skala jutaan karakter per bulan), layanan seperti Polly atau opsi self-hosted mungkin lebih efisien secara biaya. Selalu pertimbangkan batasan ini sebelum memilih skala infrastruktur Anda.
⚠️ 5. Checklist Sebelum Memulai
Patuhi Lisensi Komersial — Paket Free ditujukan untuk penggunaan non-komersial dan wajib mencantumkan atribusi. Untuk konten monetisasi, Anda wajib berlangganan paket Starter ke atas.
Cek Fitur Kloning Suara — Instant Voice Cloning tersedia di paket Starter, sedangkan Professional Voice Cloning (butuh 30 menit+ data audio) tersedia mulai dari paket Creator.
Pantau Penggunaan — Cek grafik konsumsi kredit di dashboard secara berkala untuk menghindari tagihan yang tidak terduga dari sistem PAYG.
Lakukan Benchmarking — Selalu bandingkan kualitas audio dengan penyedia lain (Google/Polly) menggunakan teks yang sama untuk hasil terbaik sesuai kebutuhan proyek Anda.
🚀 Penutup
Di tahun 2026, API ElevenLabs telah bertransformasi dari layanan premium yang cukup eksklusif menjadi platform yang sangat fleksibel berkat sistem bayar sesuai pemakaian (PAYG).
Silakan manfaatkan paket gratis untuk melakukan eksperimen, lalu gunakan simulasi biaya di atas untuk menyusun anggaran operasional Anda dengan lebih presisi.
Jika Anda berencana mengintegrasikan fitur pengenalan suara (STT), pelajari artikel Perbandingan Scribe vs Whisper vs Deepgram, dan untuk panduan teknis lebih lanjut, silakan baca Panduan Integrasi Voice AI API.
Mulai Menggunakan API ElevenLabs (Gratis) →
Kami adalah Elevenlabs Lab. Sampai jumpa di artikel berikutnya! ⚡