12 May
12May

Dalla frase alla costruzione: l’idea di Carnegie Mellon

Arriva da Carnegie Mellon University uno dei progetti AI più creativi e inaspettati del 2025: si chiama LegoGPT e trasforma frasi testuali in vere e proprie costruzioni LEGO tridimensionali. Il funzionamento è semplice da descrivere ma incredibile da vedere: scrivi una frase, ad esempio “una giraffa che mangia da un albero”, e il sistema genera un modello LEGO realistico, pronto da esplorare o replicare con i mattoncini veri.È il primo sistema AI che unisce linguaggio naturale, progettazione 3D e logica di costruzione fisica, con una pipeline che va dal testo a un insieme coerente di blocchi montabili. Il tutto completamente open source.

Come funziona LegoGPT: testo, voxel e mattoncini

Il processo si articola in tre fasi:

  1. Parsing testuale: il sistema analizza la frase inserita e ne estrae le entità semantiche (es. animali, oggetti, pose, colori)
  2. Generazione voxel: il modello trasforma i concetti in una rappresentazione 3D voxelizzata
  3. Traduzione in blocchi LEGO: un algoritmo converte il voxel model in un insieme di mattoncini LEGO standard, rispettando dimensioni, peso e fattibilità costruttiva

Il risultato è una struttura costruibile, stampabile o navigabile nel visualizzatore 3D integrato nella demo.

LEGO 3D sullo schermo creato da LegoGPT con una frase, ambiente educativo e colorato


Applicazioni educative, creative e ludiche

LegoGPT non è pensato solo per divertire: il suo potenziale è enorme in vari ambiti:

🎓 Educazione

  • Bambini e studenti possono imparare geometria, rappresentazione 3D e linguaggio descrittivo
  • È possibile usare frasi in inglese o altre lingue per allenare la comprensione semantica + visiva

🎨 Creatività e design

  • Designer e artisti possono prototipare concept o piccole sculture partendo da prompt scritti
  • Ideale per creare mockup rapidi di personaggi o ambienti

🧠 Neuroscienze cognitive

  • Il progetto permette di studiare il modo in cui l’AI collega linguaggio e spazio fisico, utile in robotica e cognitive science

Perché è diverso da DALL·E o Sora

A differenza dei classici modelli generativi come DALL·E, Midjourney o anche Sora, LegoGPT non crea immagini o video, ma una struttura modulare e concreta. Il suo output non è un rendering, ma una lista di blocchi 3D con posizionamento e struttura realizzabile.È una forma di AI simbolica + visiva + ingegneristica, più vicina a un assistente di design che a un generatore visivo classico.

Open source, GitHub e futuro

Il progetto è completamente open e disponibile su GitHub, con codice, istruzioni e dataset. Presto arriveranno anche:

  • Plugin per simulare fisica e incastri
  • Versioni multilingua
  • Un generatore vocale (input via microfono)

Secondo gli autori, il prossimo passo sarà connettere LegoGPT a stampanti 3D o set LEGO automatici, per passare dalla frase all’oggetto fisico in tempo reale.Un futuro in cui le parole costruiscono letteralmente il mondo.

Demo ufficiale: https://avalovelace1.github.io/LegoGPT/

Commenti
* L'indirizzo e-mail non verrà pubblicato sul sito Web.