🎯 Bu yazıdan neler öğreneceksiniz?
• 1 Milyon Karakter Başına Fiyat Listesi — ElevenLabs / Google / Polly seviyelerine göre güncel maliyetler (Haziran 2026 resmi verileri)
• İçerik üretimi ve toplu bildirimler için doğru karar verme kriterleri
• Bireysel kullanıcılar için ses klonlamanın en pratik yolu
• Türkçe ses teknolojisi güncel durumu (Eleven v3, Multilingual v2, Flash v2.5)
• ElevenLabs’in dürüstçe açıklanan 4 dezavantajı — Fiyatlandırma, arena sıralaması, ücretsiz plan kısıtlamaları ve gecikme süresi
📌 Giriş
Merhaba, ElevenLabs Lab ekibi olarak karşınızdayız.
“Hangi TTS API’sini seçmeliyim?” sorusuna internetteki yanıtlar genellikle ikiye bölünür: “Kesinlikle ElevenLabs” diyen tutkulu kullanıcılar ve “Google veya Polly çok daha ekonomik” diyen maliyet odaklı geliştiriciler.
Her iki taraf da kısmen haklı. Çünkü bu, ihtiyacınıza göre cevabı tamamen değişen bir konu.
Bugün, Haziran 2026 itibarıyla resmi fiyatlandırma sayfalarını ve bağımsız verileri (kör arena sonuçları vb.) baz alarak bu üç API’yi kullanım senaryolarına göre kıyaslayacağız. ElevenLabs laboratuvarı olsak da, dezavantajlarımızı da tüm şeffaflığıyla paylaşıyoruz!
⚡ Vakit bulamayanlar için 3 maddede özet
1️⃣ YouTube dublajı, sesli kitaplar ve karakter seslendirmeleri gibi duygu aktarımının kritik olduğu içerikler → ElevenLabs (Duygu ifadesi + Bireysel ses klonlama)
2️⃣ Toplu bildirimler, IVR sistemleri, şirket içi projeler gibi karakter sayısının maliyeti doğrudan etkilediği iş yükleri → Polly Generative veya Google Chirp 3 HD (1 milyon karakter için 30 USD)
3️⃣ Zaten GCP/AWS ekosistemindeyseniz → Mevcut bulut TTS çözümünü korumak, operasyonel açıdan en verimli yoldur.
📖 Başlamadan önce — 4 temel kavramı netleştirelim ⚡
• TTS = Text-to-Speech, metinleri doğal insan sesine dönüştüren "konuşan yapay zeka".
• 1 Milyon Karakter Başına Fiyat = TTS ücretlendirmesinin standart birimi. 1 milyon karakter, yaklaşık 700 sayfalık A4 dokümanına denk gelir.
• Ses Klonlama = Kendi sesinizi modele tanıtarak, siz okumasanız bile sizin sesinizle konuşmasını sağlayan özellik.
• Self-Serve (Self-servis) = Satış ekibiyle görüşmeye veya sözleşme imzalamaya gerek kalmadan, kredi kartıyla hemen kullanmaya başlayabileceğiniz sistem.
💰 1. Fiyatlandırma — 1 milyon karakter üzerinden karşılaştırma
Seviye | ElevenLabs | Google Cloud TTS | Amazon Polly |
|---|---|---|---|
Giriş (Eski nesil) | — | Standard/WaveNet 4 USD | Standard 4 USD |
Orta (Neural) | — | Neural2 16 USD | Neural 16 USD |
En Yeni Nesil | Flash v2.5/Turbo 50 USD | Chirp 3 HD 30 USD | Generative 30 USD |
Flagship (En üst) | Eleven v3·Multilingual v2 100 USD | Studio 160 USD | Long-Form 100 USD |
▲ 1 milyon karakter başına USD. Kaynak: elevenlabs.io/pricing/api · cloud.google.com/text-to-speech/pricing · aws.amazon.com/polly/pricing (Haziran 2026 itibarıyla)
Rakamların anlattıkları:
ElevenLabs, “En Yeni Nesil” kategorisinde Google ve Polly’den (30 USD) yaklaşık 1,7 kat (50 USD) daha maliyetlidir.
1 milyon karakteri aşan yüksek hacimli işlemler (bildirimler, haber okumaları, IVR sistemleri) için bu maliyetle kullanılmasını önermiyoruz.Bununla birlikte, 7 Mayıs 2026 itibarıyla API fiyatlarında yapılan %55’e varan indirimler ve kullandıkça öde (PAYG) modeline geçişle aradaki makas oldukça daraldı.
Flash modeli için 1.000 karakter başına maliyetin 0,05 USD’ye düşmesi, “ElevenLabs = Lüks” algısının artık geride kaldığını gösteriyor.Google ve Polly’nin eski nesil sesleri (4 USD) ucuzdur ancak mekanik tınıları hemen fark edilir. Adil bir kıyaslama için her zaman aynı sınıf modelleri karşılaştırmalısınız.
🎭 2. Ses Kalitesi ve İfade — "Her zaman 1 numara" söylemi gerçeği yansıtmıyor
Ses kalitesi kıyaslamasında en dürüst veri kaynağı kör arena (blind arena) testleridir. Burada dürüst olmamız gereken bir nokta var:
Haziran 2026 itibarıyla Artificial Analysis Speech Arena Top 5 listesinde ElevenLabs yoktur. Zirvede Alibaba Fun-Realtime-TTS (ELO 1228) ve Gemini 3.1 Flash TTS (1225) gibi modeller yer almaktadır.
"ElevenLabs her zaman en iyi ses kalitesine sahiptir" diyen makaleleri ciddiye almamanızı öneririz.
Buna rağmen içerik üretiminde hala ElevenLabs’i önermemizin nedeni sıralama değil, performans kontrolü ve iş akışıdır:
Eleven v3 ve Audio Tags — [excited], [whispers] gibi etiketlerle duygu ve tonlamayı doğrudan metin içerisinden kontrol edebilirsiniz.
70'ten fazla dil desteği ile içeriğin tonunun ürünün kendisi olduğu projelerde bu, belirleyici bir farktır.Multilingual v2 — 29 dilde uzun metin anlatımı ve dublaj için lider modelimizdir, dublaj iş akışlarımızla kusursuz uyum sağlar.
Google Chirp 3 HD ise 51 yerel ayar, yayın akışı sentezleme ve [pause] komutları ile fonksiyonel açıdan oldukça güçlüdür; fiyat/performans noktasında öne çıkabilir.
🎤 3. Ses Klonlama — Bireysel erişimdeki tek gerçek adres
“Kendi sesimle içerik üretmek istiyorum” diyorsanız seçenekleriniz oldukça sınırlıdır.
Hizmet | Ses Klonlama Yöntemi | Bireysel Erişim |
|---|---|---|
ElevenLabs | Instant (1–2 dk ses) / Professional (30 dk+) | Self-servis — Ödemeden hemen sonra |
Google (Instant Custom Voice) | İzin listesi (allowlist) — Satış ekibiyle görüşme + yazılı onay şart | Bireysel kullanım yok |
Polly (Brand Voice) | AWS ekibiyle ayrı sözleşme ile özel ses üretimi | Sadece kurumsal |
▲ Kaynak: Kurumsal dokümantasyonlar (Haziran 2026 itibarıyla)
🇹🇷 4. Türkçe Ses Teknolojisi Durumu
Polly: Kasım 2025'te Generative motoruna eklenen 'Seoyeon', aslında Korece bir ses; aynı duyurudaki bölge genişlemesi de Seul, Singapur ve Tokyo'yu kapsıyor. Türkçe sesler için güncel durumu AWS'nin resmi ses listesinden kontrol etmenizi öneririz.
Google: Chirp 3 HD toplam 51 yerel ayar (locale) ve IPA ile özel telaffuz kontrolü sunuyor; tr-TR'nin kapsamını resmi dokümantasyondan doğrulamakta fayda var. Özel isimlerin doğru okunması kritikse IPA gerçekten pratik.
ElevenLabs: Flash v2.5 32 dili, Multilingual v2 29 dili, Eleven v3 ise 70'ten fazla dili destekliyor — Türkçe kapsamını resmi model dokümanlarından teyit edebilirsiniz. Duygu gerektiren anlatımlarda v3'ün Audio Tags özelliği en büyük fark. ⚡
Bonus (STT): ElevenLabs Scribe'ın resmi dil sınıflandırmasında Türkçe, Excellent Accuracy (WER %5 ve altı) kademesinde — Türkçe içerik üretenler için sevindirici bir haber.
⚠️ 5. ElevenLabs’in dürüstçe 4 dezavantajı
① Pahalıdır — Benzer kategoride 1,7 kat daha yüksek maliyetlidir. Ayda 1 milyon karakteri geçen bir iş yükünüz varsa, Polly Generative veya Chirp 3 HD (30 USD) daha rasyoneldir.
② Arena Top 5'inde değil — "Ses kalitesinde tartışmasız lider" dönemi kapandı (Haziran 2026). Lütfen kendi kulaklarınızla test edin.
③ Ücretsiz plan kısıtlamaları — Ücretsiz sürümle oluşturulan sesleri ticari projelerde kullanmak lisans ihlalidir ve kaynak belirtme zorunluluğu vardır. Ticari lisanslar Starter (6 USD/ay) planından başlar.
④ "75ms Gecikme" sadece model işleme süresidir — Teknik dokümanlarımızda da belirtildiği üzere, ağ gecikmesi dahil toplam TTFB (Time To First Byte) daha yüksektir. Canlı etkileşimli servislerde kendi altyapınızda ölçüm yapmanız şarttır.
🆓 6. Ücretsiz Planlar — Polly ile ilgili küçük bir uyarı
Google: Aylık 4 milyon karakter Standard + 1 milyon karakter Chirp 3 HD — Süre kısıtlaması olmayan ücretsiz hak ile en cömert olanıdır.
Polly: Aylık 5 milyon karakter — Ancak bu sadece ilk 12 ay ile sınırlıdır ve 15 Temmuz 2025'ten sonra açılan AWS hesapları 200 USD kredi sistemine geçmiştir.
ElevenLabs: Ücretsiz planda aylık 10.000 karakter — Ticari olmayan kullanım ve kaynak gösterme şartı vardır.
🚀 Sonuç
“İzleyicinin veya müşterinin kalbine dokunmam gerekiyor” diyorsanız ElevenLabs, “sadece metni sese dönüştürmem yetiyor” diyorsanız Polly veya Google doğru tercihtir.
Mayıs 2026 fiyat indirimleri ve PAYG sistemi, ElevenLabs’i denemek için en uygun zamanı sunuyor.
API entegrasyonu için ElevenLabs API Geliştirici Başlangıç Rehberi’ne göz atabilirsiniz.
Ücretsiz planla kıyaslamaya başlayın →
ElevenLabs Lab ekibi olarak çalıştık. ⚡