
Index TTS
IndexTTS ist Bilibili’s Open-Source-System für industrielle, steuerbare und effiziente Zero-Shot-Text-to-Speech-Synthese. Es richtet sich eher an Speech-Forscher und Entwickler als an Nutzer einer fertigen Web-App.


VoxCPM2 ist ein Open-Source-TTS-Modell von OpenBMB mit 30 Sprachen, Voice Design, steuerbarem Cloning und 48kHz-Ausgabe unter Apache-2.0.
1
Views
0
Likes
Jun 2026
Added
github.com
Website
A quick visual look at VoxCPM2 before you visit the official site.

Editorial Review
VoxCPM2 ist mehr als ein nettes Sprachdemo. Das Projekt liefert ein 2B tokenizer-freies Modell fur naturliche Sprachsynthese, neue Stimmen per Textbeschreibung, kontrolliertes Cloning und realistische Self-Hosting-Pfade fur Teams, die ihre Audiostack nicht komplett outsourcen wollen.
Gerade jetzt ist das Projekt sichtbar, weil es am 2. Juni 2026 auf GitHub Trending stand und die aktuelle Release-Story deutlich starker ist als bei fruheren Versionen: 30 Sprachen, 48kHz, steuerbares Cloning und eine kommerziell gut nutzbare Lizenz.
Die Begeisterung fur ein starkes offenes TTS-Modell ist nachvollziehbar. Die vorsichtigeren Stimmen fragen vor allem, wie stabil das Cloning bei schwierigen Referenzen bleibt und ob der Star-Schub wirklich in robuste Produktionseinsatze ubergeht.
Offene Sprachmodelle brauchen trotzdem ernsthafte Tests. Latenz, Hardwarebedarf, Artefakte, Konsistenz uber langere Generierungen und Fragen rund um Einwilligung und Missbrauch mussen sauber bewertet werden.
Naheliegende Alternativen sind ElevenLabs, Cartesia, PlayAI, Kokoro-basierte lokale Setups und andere Open-Source-TTS-Projekte mit anderen Abwagungen bei Qualitat, Kosten und Kontrolle.
Visit the official website to get started
Have an AI tool to share?
Get your product in front of people actively exploring AI tools.
Submit Your Tool
IndexTTS ist Bilibili’s Open-Source-System für industrielle, steuerbare und effiziente Zero-Shot-Text-to-Speech-Synthese. Es richtet sich eher an Speech-Forscher und Entwickler als an Nutzer einer fertigen Web-App.

The best and most realistic voice tools currently available - Intelligentes KI-Tool für mehr Produktivität.

Hailuo AI TTS ist ein mit MiniMax Audio verbundenes Tool für mehrsprachige Text-to-Speech-Erzeugung, KI-Stimmen und Voice Cloning.

A deep learning toolkit for Text-to-Speech, battle-tested in research and production - Intelligentes KI-Tool für mehr Produktivität.