
Index TTS
IndexTTS는 Bilibili의 오픈소스 산업급 제어 가능 고효율 제로샷 TTS 시스템입니다. 완성형 웹 음성 앱이 아니라 음성 연구자와 개발자를 위한 실험 프로젝트에 가깝습니다.


VoxCPM2는 OpenBMB가 공개한 오픈소스 다국어 TTS 모델로, 음성 디자인과 제어 가능한 클로닝, 48kHz 출력을 Apache-2.0 조건으로 제공합니다.
1
Views
0
Likes
Jun 2026
Added
github.com
Website
A quick visual look at VoxCPM2 before you visit the official site.

Editorial Review
VoxCPM2는 최근 오픈 음성 스택에서 가장 눈에 띄는 프로젝트 중 하나입니다. 단순 데모형 TTS가 아니라 20억 파라미터 tokenizer-free 모델로 자연스러운 합성, 새 목소리 설계, 참조 음성 기반 클로닝, 그리고 실제 배포 가능한 셀프호스팅 경로까지 함께 노립니다.
2026년 6월 2일 GitHub Trending에 오르며 급격히 별이 늘었고, 공식 README가 30개 언어, 48kHz 출력, 제어형 클로닝, Apache-2.0 상용 친화 라이선스를 한 번에 보여 주면서 주목도가 커졌습니다.
오픈소스이면서 언어 지원 폭이 넓다는 점이 큰 관심을 받습니다. 반대로 참조 음성이 지저분할 때 클로닝 품질이 얼마나 버티는지, 빠른 스타 증가가 실제 운영 품질로 이어질지는 더 지켜보자는 의견도 많습니다.
오픈 음성 모델이라고 해서 운영 부담이 사라지지는 않습니다. 지연, GPU 요구량, 잡음 아티팩트, 긴 문장에서의 일관성을 점검해야 하며, 동의 없는 음성 복제나 신원 오용 같은 안전 문제도 다뤄야 합니다.
비교 대상에는 ElevenLabs, Cartesia, PlayAI, Kokoro 계열 로컬 스택, 기타 오픈소스 TTS가 있으며 품질과 비용, 제어권에서 선택지가 갈립니다.
Visit the official website to get started
Have an AI tool to share?
Get your product in front of people actively exploring AI tools.
Submit Your Tool
IndexTTS는 Bilibili의 오픈소스 산업급 제어 가능 고효율 제로샷 TTS 시스템입니다. 완성형 웹 음성 앱이 아니라 음성 연구자와 개발자를 위한 실험 프로젝트에 가깝습니다.

The best and most realistic voice tools currently available - 스마트 AI 도구로 생산성 향상.

Hailuo AI TTS는 MiniMax Audio와 연결된 다국어 텍스트 음성 변환, AI 음성, 음성 복제 도구입니다.

A deep learning toolkit for Text-to-Speech, battle-tested in research and production - 스마트 AI 도구로 생산성 향상.