TuttoCalcolo
Il mio accountTutti i calcolatori
← F1 Lab

RL-Driver Sandbox

Costruisci un circuito a blocchi e guarda l'intelligenza artificiale imparare a guidarlo. Tre modalità, parametri regolabili in tempo reale e diagnostica della rete neurale.

Modalità IA

Una popolazione di reti neurali evolve per selezione naturale: le auto migliori si riproducono e mutano.

Simulazione

Parametri Neuroevoluzione

Profilo auto

Disegna:
100%
⚠ Circuito incompleto

Stato

Incompleto

In pista

Generazione

1

Miglior giro

—:—

Scheda diagnostica

Generazione

1

Miglior giro

—:—

Checkpoint

0

Velocità

0 km/h

Rete neurale (migliore)

peso positivo peso negativo

Grafico prestazioni

Circuiti preimpostati

Come funziona in 4 passi

  1. Scegli un circuito preimpostato o disegnane uno con gli strumenti.
  2. Seleziona la modalità IA e regola i parametri.
  3. Premi Avvia e osserva l'apprendimento generazione dopo generazione.
  4. Salva i tuoi circuiti ed esporta il cervello migliore.

Le tre modalità

  • Neuroevoluzione — una popolazione di reti neurali evolve per selezione, incrocio e mutazione.
  • Q-Learning — un singolo agente impara una tabella stato→azione tramite ricompense.
  • Manuale — guidi tu con la tastiera, utile come riferimento umano.

Sensori e ricompensa

L'auto percepisce la pista con sensori radiali (distanza dai bordi), velocità e angolo verso il prossimo checkpoint. La ricompensapremia i checkpoint superati e penalizza gli urti: massimizzandola, l'IA impara la traiettoria ideale.

Come fa un'intelligenza artificiale a imparare a guidare?

Nessuno insegna all'auto la traiettoria giusta: l'IA parte muovendosi a caso e migliora per tentativi ed errori. È lo stesso principio del reinforcement learning, il ramo del machine learning in cui un agente apprende interagendo con un ambiente e ricevendo ricompense. In questo laboratorio l'ambiente è il circuito che disegni, l'agente è l'auto, e la ricompensa cresce quanto più velocemente e a lungo l'auto resta in pista.

Neuroevoluzione: l'evoluzione delle reti neurali

Nella modalità a neuroevoluzione ogni auto è guidata da una piccola rete neuraleche trasforma i valori dei sensori in due comandi: sterzo e accelerazione. All'inizio i pesi della rete sono casuali, quindi le auto sbandano e si schiantano subito. Ma le poche che percorrono più strada vengono selezionate: i loro pesi si combinano (incrocio) e subiscono piccole variazioni (mutazione), generando la popolazione successiva. Generazione dopo generazione la guida migliora, finché la rete migliore completa il giro in modo fluido. È l'algoritmo genetico applicato alle reti neurali.

Q-Learning: imparare dalle ricompense

Il Q-Learning affronta lo stesso problema con un approccio diverso: un solo agente stima, per ogni stato(combinazione di sensori e direzione del prossimo checkpoint), quanto è conveniente ogni possibile azione. Le ricompense positive sui checkpoint e le penalità sugli urti aggiornano questa stima, finché l'agente preferisce stabilmente le scelte che lo portano a chiudere il giro. È un buon modo per vedere a occhio nudo il compromesso tra esplorazione (provare azioni nuove) e sfruttamento (ripetere ciò che già funziona).

Tutto gira nel tuo browser, senza registrazione e senza inviare dati a un server: puoi cambiare i parametri in tempo reale, salvare i circuiti e perfino esportare il «cervello» della rete migliore.

Domande frequenti

Che cos'è la neuroevoluzione?+

È un metodo che combina reti neurali e algoritmi genetici. Ogni auto è guidata da una piccola rete neurale; le auto che percorrono più strada vengono selezionate, incrociate e mutate per generare la popolazione successiva, che parte già più brava. Dopo alcune decine di generazioni la migliore rete completa il giro senza uscire di pista.

In cosa è diverso il Q-Learning?+

Il Q-Learning usa un solo agente che costruisce una tabella stato→azione. Per ogni situazione (sensori e direzione verso il prossimo checkpoint) impara quanto è conveniente ciascuna azione, ricevendo ricompense positive sui checkpoint e penalità sugli urti. È più lento a stabilizzarsi ma più semplice da interpretare rispetto alla rete neurale.

Come disegno un circuito valido?+

Usa gli strumenti in alto per posizionare rettilinei e curve fino a chiudere un anello, poi aggiungi un blocco traguardo 🏁 (cliccaci sopra per ruotarne il verso). Quando il tracciato è un anello chiuso, l'IA può partire. Puoi anche salvare i tuoi circuiti e ricaricarli in seguito.

Cosa "vede" l'intelligenza artificiale?+

L'auto è dotata di sensori radiali (raggi) che misurano la distanza dai bordi della pista in diverse direzioni, più la velocità attuale e l'angolo verso il prossimo checkpoint. Questi valori sono gli ingressi della rete neurale, che restituisce sterzo e accelerazione.

Quanto tempo serve perché l'IA impari a guidare?+

Dipende dalla complessità del circuito e dai parametri. Su un tracciato semplice bastano spesso 10–30 generazioni in neuroevoluzione (pochi minuti); circuiti con curve strette o tornanti richiedono più popolazione e più mutazione per essere completati.

I dati restano sul mio dispositivo?+

Sì: l'intero addestramento gira nel browser, in locale. Non serve registrarsi e nessun dato viene inviato a un server: puoi esportare il "cervello" della rete migliore come file e reimportarlo quando vuoi.