Simulatore RL-Driver: allena un'IA a guidare in pista

Come fa un'intelligenza artificiale a imparare a guidare?

Nessuno insegna all'auto la traiettoria giusta: l'IA parte muovendosi a caso e migliora per tentativi ed errori. È lo stesso principio del reinforcement learning, il ramo del machine learning in cui un agente apprende interagendo con un ambiente e ricevendo ricompense. In questo laboratorio l'ambiente è il circuito che disegni, l'agente è l'auto, e la ricompensa cresce quanto più velocemente e a lungo l'auto resta in pista.

Neuroevoluzione: l'evoluzione delle reti neurali

Nella modalità a neuroevoluzione ogni auto è guidata da una piccola rete neuraleche trasforma i valori dei sensori in due comandi: sterzo e accelerazione. All'inizio i pesi della rete sono casuali, quindi le auto sbandano e si schiantano subito. Ma le poche che percorrono più strada vengono selezionate: i loro pesi si combinano (incrocio) e subiscono piccole variazioni (mutazione), generando la popolazione successiva. Generazione dopo generazione la guida migliora, finché la rete migliore completa il giro in modo fluido. È l'algoritmo genetico applicato alle reti neurali.

Q-Learning: imparare dalle ricompense

Il Q-Learning affronta lo stesso problema con un approccio diverso: un solo agente stima, per ogni stato(combinazione di sensori e direzione del prossimo checkpoint), quanto è conveniente ogni possibile azione. Le ricompense positive sui checkpoint e le penalità sugli urti aggiornano questa stima, finché l'agente preferisce stabilmente le scelte che lo portano a chiudere il giro. È un buon modo per vedere a occhio nudo il compromesso tra esplorazione (provare azioni nuove) e sfruttamento (ripetere ciò che già funziona).

Tutto gira nel tuo browser, senza registrazione e senza inviare dati a un server: puoi cambiare i parametri in tempo reale, salvare i circuiti e perfino esportare il «cervello» della rete migliore.

Domande frequenti

Che cos'è la neuroevoluzione?+

È un metodo che combina reti neurali e algoritmi genetici. Ogni auto è guidata da una piccola rete neurale; le auto che percorrono più strada vengono selezionate, incrociate e mutate per generare la popolazione successiva, che parte già più brava. Dopo alcune decine di generazioni la migliore rete completa il giro senza uscire di pista.

In cosa è diverso il Q-Learning?+

Il Q-Learning usa un solo agente che costruisce una tabella stato→azione. Per ogni situazione (sensori e direzione verso il prossimo checkpoint) impara quanto è conveniente ciascuna azione, ricevendo ricompense positive sui checkpoint e penalità sugli urti. È più lento a stabilizzarsi ma più semplice da interpretare rispetto alla rete neurale.

Come disegno un circuito valido?+

Usa gli strumenti in alto per posizionare rettilinei e curve fino a chiudere un anello, poi aggiungi un blocco traguardo 🏁 (cliccaci sopra per ruotarne il verso). Quando il tracciato è un anello chiuso, l'IA può partire. Puoi anche salvare i tuoi circuiti e ricaricarli in seguito.

Cosa "vede" l'intelligenza artificiale?+

L'auto è dotata di sensori radiali (raggi) che misurano la distanza dai bordi della pista in diverse direzioni, più la velocità attuale e l'angolo verso il prossimo checkpoint. Questi valori sono gli ingressi della rete neurale, che restituisce sterzo e accelerazione.

Quanto tempo serve perché l'IA impari a guidare?+

Dipende dalla complessità del circuito e dai parametri. Su un tracciato semplice bastano spesso 10–30 generazioni in neuroevoluzione (pochi minuti); circuiti con curve strette o tornanti richiedono più popolazione e più mutazione per essere completati.

I dati restano sul mio dispositivo?+

Sì: l'intero addestramento gira nel browser, in locale. Non serve registrarsi e nessun dato viene inviato a un server: puoi esportare il "cervello" della rete migliore come file e reimportarlo quando vuoi.

Algebra

RL-Driver Sandbox

Modalità IA

Simulazione

Parametri Neuroevoluzione

Profilo auto

Scheda diagnostica

Rete neurale (migliore)

Grafico prestazioni

Circuiti preimpostati

Come funziona in 4 passi

Le tre modalità

Sensori e ricompensa

Come fa un'intelligenza artificiale a imparare a guidare?

Neuroevoluzione: l'evoluzione delle reti neurali

Q-Learning: imparare dalle ricompense

Domande frequenti

QuickCalc

Algebra & Geometria

Analisi 1

Analisi 2

Fisco & Finanza

Probabilità & Statistica

Utility Quotidiane