Kimi-Audio è il nuovo benchmark open-source di Moonshot AI per la comprensione, generazione e interazione audio. Un passo fondamentale verso AI sempre più naturale e multimodale.
Ulteriori informazioniKimi-Audio è il nuovo benchmark open-source di Moonshot AI per la comprensione, generazione e interazione audio. Un passo fondamentale verso AI sempre più naturale e multimodale.
Ulteriori informazioninari-labs/dia è il primo modello TTS capace di generare dialoghi naturali in un’unica inferenza, portando la sintesi vocale AI a un livello completamente nuovo.
Ulteriori informazioniLiveCC è il primo framework per addestrare LLM su trascrizioni video reali e rumorose, portando l’AI più vicina alla comunicazione autentica. Una rivoluzione per l’intelligenza conversazionale.
Ulteriori informazioni