Cartesia développe Sonic, un modèle d'intelligence artificielle générative text-to-speech (TTS) optimisé pour une latence ultra-faible inférieure à cent millisecondes. Reposant sur l'architecture State Space Models (SSMs) et Mamba, cette API vocale permet le clonage vocal et la synthèse audio multilingue en temps réel. L'outil s'intègre via WebSockets et REST pour propulser des agents conversationnels, des serveurs vocaux interactifs, des jeux vidéo et des centres d'appels nécessitant une fluidité humaine.