L'intelligenza artificiale impara a correre
Un software di intelligenza artificiale di DeepMind impara a muoversi da solo in un ambiente sconosciuto, utilizzando una tecnica di machine learning basata sull'apprendimento di rinforzo.
Come funziona?
La macchina non ha una programmazione iniziale. Impara a muoversi partendo da zero e senza l'aiuto dell'uomo.
L'unico feed-back è il rinforzo, ossia la ricompensa o la penalizzazione rispetto a un obiettivo prefissato che, in questo caso, consiste nel completare il percorso di parkour virtuale nel più breve tempo possibile.
- Rinforzo positivo. Quando l'agente compie un'azione corretta ( es. salta un muro, aggira un ostacolo, ecc. ) la macchina ottiene un premio.
- Rinforzo negativo. Quando l'agente compie un'azione sbagliata ( es. cade, perde tempo, ecc. ) la macchina riceve una penalizzazione.
Con l'esperienza l'agente migliora progressivamente. Impara a correre, saltare, aggirare gli ostacoli, senza l'insegnamento di un essere umano.
Per questa ragione, a volte sembra muoversi goffamente, perché sperimenta anche movimenti che l'uomo esclude a priori.
A cosa serve?
Ovviamente la tecnica di apprendimento automatico ha molte altre applicazioni. Non è utile solo per insegnare a un robot come si corre.
Ad esempio, può essere usata nella ricerca scientifica, nel problem solving aziendale, ecc..
20 febbraio 2017