Audio AI: Generazione e Modifica Audio con l’Intelligenza Artificiale

Audio-SDS: l’AI di NVIDIA che genera effetti sonori realistici da testo, video e immagini

Audio-SDS di NVIDIA è il nuovo sistema per generare effetti sonori realistici da testo, immagini e video. Due stadi, massima coerenza e applicazioni creative senza limiti.

Ulteriori informazioni

NotebookLM AI: come creare podcast audio gratis in italiano in pochi click

NotebookLM AI permette di generare podcast e contenuti audio in italiano in modo gratuito e naturale. Basta un testo per ottenere una voce narrante pronta per YouTube, corsi o storytelling.

Ulteriori informazioni

AudioX: il modello AI che genera qualsiasi suono da qualsiasi input

AudioX è un modello AI avanzato che genera suoni realistici da qualsiasi input: testo, immagini, video o altri audio. Scopri come funziona il nuovo standard per la generazione audio cross-modale.

Ulteriori informazioni

Moonshot AI presenta Kimi-Audio: un nuovo benchmark open-source per l'audio AI

Kimi-Audio è il nuovo benchmark open-source di Moonshot AI per la comprensione, generazione e interazione audio. Un passo fondamentale verso AI sempre più naturale e multimodale.

Ulteriori informazioni

nari-labs/dia: il modello TTS che genera dialoghi ultra-realistici in un'unica passata

nari-labs/dia è il primo modello TTS capace di generare dialoghi naturali in un’unica inferenza, portando la sintesi vocale AI a un livello completamente nuovo.

Ulteriori informazioni

LiveCC: il primo LLM ottimizzato per addestrare AI su trascrizioni video reali

LiveCC è il primo framework per addestrare LLM su trascrizioni video reali e rumorose, portando l’AI più vicina alla comunicazione autentica. Una rivoluzione per l’intelligenza conversazionale.

Ulteriori informazioni

Audio AI #news

Audio-SDS: l’AI di NVIDIA che genera effetti sonori realistici da testo, video e immagini

NotebookLM AI: come creare podcast audio gratis in italiano in pochi click

AudioX: il modello AI che genera qualsiasi suono da qualsiasi input

Moonshot AI presenta Kimi-Audio: un nuovo benchmark open-source per l'audio AI

nari-labs/dia: il modello TTS che genera dialoghi ultra-realistici in un'unica passata

LiveCC: il primo LLM ottimizzato per addestrare AI su trascrizioni video reali