Igranje Pac-Mana jača sposobnosti AI agenata

Ponekad je bolje trenirati robota u okruženju koje se razlikuje od onog u kojem će raditi, otkrili su američki istraživači

Mladen Smrekar srijeda, 19. veljače 2025. u 16:22
Istraživači su trenirali AI agente na igrama za Atari 📷 Jose-Luis Olivares, MIT
Istraživači su trenirali AI agente na igrama za Atari Jose-Luis Olivares, MIT

Robot obučen za obavljanje kućanskih poslova tvornici možda neće znati učinkovito oribati sudoper ili iznijeti smeće kad se postavi u kuhinju obiteljskog doma jer se novo okruženje razlikuje od njegovog prostora za obuku. No, sad su istraživači MIT-a i njihove kolege s Yalea i Harvarda pokazali da obuka u potpuno drugačijem okruženju ponekad daje AI agenta s boljim učinkom. Razlog ovom neočekivanom fenomenu leži u takozvanom efektu treninga u zatvorenom (indoor training effect).

Istraživači su fenomen proučili modificirajući igru Pac-Man kojoj su dodali malo nepredvidivosti 📷 MIT Media Lab, Harvard University, Yale University
Istraživači su fenomen proučili modificirajući igru Pac-Man kojoj su dodali malo nepredvidivosti MIT Media Lab, Harvard University, Yale University

“Ako naučimo igrati tenis u zatvorenom prostoru gdje nema šuma, možda ćemo lakše svladati različite udarce. A kad se jednom preselimo na vjetroviti teniski teren, veća je vjerojatnost da ćemo igrati bolje nego da smo počeli učiti u vjetrovitom okruženju”, objašnjavaju istraživači smisao rada koji će uskoro predstaviti na konferenciji Američkog društva za umjetnu inteligenciju AAAI-25.

Simulirana okruženja

Istraživači su ovaj fenomen proučili trenirajući AI agente da igraju Pac-Man koji su modificirali dodajući igri malo nepredvidivosti. Pokazalo se naime da se učinak treninga u zatvorenom stalno javlja u igrama poput Pac-Mana i njihovim varijacijama.

“Umjesto da pokušavamo uskladiti okruženja za obuku i testiranje, mogli bismo izgraditi simulirana okruženja u kojima AI agent uči još bolje”, nadaju se istraživači koji sad žele istražiti učinak treninga u zatvorenom u složenijim okruženjima ili s drugim tehnikama poput računalnog vida i obrade prirodnog jezika. Namjeravaju izraditi i novo okruženje za obuku u kojem bi učinak treninga u zatvorenom AI agentima pomogao da bolje funkcioniraju u neizvjesnim okruženjima.