L'intelligenza artificiale impara a correre

Un software di intelligenza artificiale di DeepMind impara a muoversi da solo in un ambiente sconosciuto, utilizzando una tecnica di machine learning basata sull'apprendimento di rinforzo.

Come funziona?

La macchina non ha una programmazione iniziale. Impara a muoversi partendo da zero e senza l'aiuto dell'uomo.

L'unico feed-back è il rinforzo, ossia la ricompensa o la penalizzazione rispetto a un obiettivo prefissato che, in questo caso, consiste nel completare il percorso di parkour virtuale nel più breve tempo possibile.

  1. Rinforzo positivo. Quando l'agente compie un'azione corretta ( es. salta un muro, aggira un ostacolo, ecc. ) la macchina ottiene un premio.
  2. Rinforzo negativo. Quando l'agente compie un'azione sbagliata ( es. cade, perde tempo, ecc. ) la macchina riceve una penalizzazione.


Con l'esperienza l'agente migliora progressivamente. Impara a correre, saltare, aggirare gli ostacoli, senza l'insegnamento di un essere umano.

Per questa ragione, a volte sembra muoversi goffamente, perché sperimenta anche movimenti che l'uomo esclude a priori.

A cosa serve?

Ovviamente la tecnica di apprendimento automatico ha molte altre applicazioni. Non è utile solo per insegnare a un robot come si corre.

Ad esempio, può essere usata nella ricerca scientifica, nel problem solving aziendale, ecc..

20 febbraio 2017

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin