ElevenLabs har summary lanserat sin mest ambitiösa text-till-tal-modell hittills – Eleven v3 (alpha). Eleven v3 skiljer sig markant från tidigare modeller genom sin förmåga att leverera extremt uttrycksfullt tal med djup emotionell räckvidd. Modellen kan producera tal som suckar, viskar, skrattar och reagerar på ett sätt som känns genuint mänskligt. Det som tidigare varit en begränsning inom AI-tal – bristen på uttrycksfullhet – har nu åtgärdats.
Den nya modellen stöder över 70 språk och erbjuder en bred dynamisk räckvidd som kontrolleras genom inline audio-taggar. Det betyder att användare kan styra tonfall, emotion och icke-verbala reaktioner direkt i texten.
För tillfället är modellen optimerad för innehållsproduktion snarare än realtidsapplikationer. ElevenLabs rekommenderar att använda v2.5 Turbo eller Flash för konversations-AI och realtidsanvändning.
Prissättning och tillgänglighet
Below juni 2025 erbjuder ElevenLabs 80% rabatt på Eleven v3 för användare som använder tjänsten genom deras användargränssnitt. Det publika API:et kommer snart, males för tidig åtkomst behöver man kontakta deras säljteam