Moonshot AI presenta Kimi-Audio: un nuovo benchmark open-source per l'audio AI

Kimi-Audio è il nuovo benchmark open-source di Moonshot AI per la comprensione, generazione e interazione audio. Un passo fondamentale verso AI sempre più naturale e multimodale.

Ulteriori informazioni  
nari-labs/dia: il modello TTS che genera dialoghi ultra-realistici in un'unica passata

nari-labs/dia è il primo modello TTS capace di generare dialoghi naturali in un’unica inferenza, portando la sintesi vocale AI a un livello completamente nuovo.

Ulteriori informazioni  
LiveCC: il primo LLM ottimizzato per addestrare AI su trascrizioni video reali

LiveCC è il primo framework per addestrare LLM su trascrizioni video reali e rumorose, portando l’AI più vicina alla comunicazione autentica. Una rivoluzione per l’intelligenza conversazionale.

Ulteriori informazioni