Igranje Pac-Mana jača sposobnosti AI agenata
Ponekad je bolje trenirati robota u okruženju koje se razlikuje od onog u kojem će raditi, otkrili su američki istraživači

Robot obučen za obavljanje kućanskih poslova tvornici možda neće znati učinkovito oribati sudoper ili iznijeti smeće kad se postavi u kuhinju obiteljskog doma jer se novo okruženje razlikuje od njegovog prostora za obuku. No, sad su istraživači MIT-a i njihove kolege s Yalea i Harvarda pokazali da obuka u potpuno drugačijem okruženju ponekad daje AI agenta s boljim učinkom. Razlog ovom neočekivanom fenomenu leži u takozvanom efektu treninga u zatvorenom (indoor training effect).
“Ako naučimo igrati tenis u zatvorenom prostoru gdje nema šuma, možda ćemo lakše svladati različite udarce. A kad se jednom preselimo na vjetroviti teniski teren, veća je vjerojatnost da ćemo igrati bolje nego da smo počeli učiti u vjetrovitom okruženju”, objašnjavaju istraživači smisao rada koji će uskoro predstaviti na konferenciji Američkog društva za umjetnu inteligenciju AAAI-25.
Simulirana okruženja
Istraživači su ovaj fenomen proučili trenirajući AI agente da igraju Pac-Man koji su modificirali dodajući igri malo nepredvidivosti. Pokazalo se naime da se učinak treninga u zatvorenom stalno javlja u igrama poput Pac-Mana i njihovim varijacijama.
“Umjesto da pokušavamo uskladiti okruženja za obuku i testiranje, mogli bismo izgraditi simulirana okruženja u kojima AI agent uči još bolje”, nadaju se istraživači koji sad žele istražiti učinak treninga u zatvorenom u složenijim okruženjima ili s drugim tehnikama poput računalnog vida i obrade prirodnog jezika. Namjeravaju izraditi i novo okruženje za obuku u kojem bi učinak treninga u zatvorenom AI agentima pomogao da bolje funkcioniraju u neizvjesnim okruženjima.