MOSS-TTS-Local-Transformer-v1.5

A high-fidelity, multilingual text-to-speech model supporting native 48kHz stereo output.

huggingface.co

Built with

Unknown

Build evidence

Strong

This is an official model repository hosted on Hugging Face by the OpenMOSS-Team, providing code, installation guides, and usage examples.

Creator

OpenMOSS-Team @OpenMOSS-Team

Shipped

2h ago

MOSS-TTS-Local-Transformer-v1.5 is a transformer-based text-to-speech model supporting zero-shot voice cloning, multilingual synthesis across 31 languages, and fine-grained control over duration and prosody. It features improved stereo audio quality through the MOSS-Audio-Tokenizer-v2 and enhanced stability for consistent voice cloning and punctuation-aligned pauses.

#tts #voice-cloning #multilingual #stereo

Source post

Watch on X

Timeline

Teaser

Video

Playable

Product

Loading…

Similar

MOSS-TTSVoice & Audio

▶

MoneyPrinterTurbo ExtendedApps & Tools

MLX-AudioApps & Tools