Midjourney tvrdi da će njihov model V7 biti konzistentniji u generiranju slika ruku

Problem karakterističan za GenAI ilustratore, neprirodan prikaz ljudskih ruku i konzistentnost pri ilustracijama, navodno će biti adresiran u novom difuzijskom modelu Midjourneya

Sandro Vrbanus subota, 5. travnja 2025. u 22:23

Midjourney je najavio novi difuzijski model za generiranje ilustracija, V7, za koji najavljuju značajna poboljšanja u nizu područja. Tako bi ova inačica modela, jednom kad bude dostupna u finalnoj verziji, trebala ponuditi "pametnije" interpretiranje promptova te samim time i konzistentnije ilustracije, više u skladu s očekivanjima korisnika. Općenito se najavljuje poboljšanje kvalitete generiranih ilustracija, tekstura, a posebno su naglasili da će dijelovi ljudskog tijela, poput ruku, biti preciznije prikazani.

Niz poboljšanja

Objekti svih vrsta bit će koherentniji, a sve to dovest će do razine kvalitete generiranih slika na kojoj će ih prosječnom čovjeku biti gotovo nemoguće razlikovati od fotografija. Model V7 zahtijevat će od korisnika i petominutni proces personalizacije, kako bi "naučio" što tko od njega točno očekuje. Nakon toga interpretirat će zadatke više u skladu s očekivanjima svakog pojedinog korisnika, kako bi rezultati generiranja bili "lijepi" svakome prema njegovim osobnim kriterijima.

Novitet u radu s modelom V7 bit će i "Draft Mode" – pri čemu će sustav generirati slike niže kvalitete, kako bi dao korisniku na uvid smjer u kojem posao ide. Takve skice bit će moguće doraditi novim promptovima, varirati i prilagođavati, da bi tek nakon toga finalna ilustracija bila stvorena u punoj rezoluciji.

V7 će biti dostupan u dva načina rada, koje nazivaju Turbo i Relax. Prvi će raditi brže, ali će i generiranje kroz njega biti dvostruko skuplje nego što je sada u slučaju modela V6. Relax će, pak, koštati upola manje od V6, ali će se na rezultate morati nešto dulje čekati. Lansiranje će biti postupno, a nove funkcije korisnicima će postajati dostupne svakog tjedna, tijekom narednih otprilike dva mjeseca. Kao i dosad, Midjourney primarno funkcionira putem Discorda, gdje je početna cijena osnovne pretplate 10 dolara mjesečno.

Hoće li možda ovaj model razriješiti problem generiranja slike "dvije lijeve ruke"? Vidjet ćemo uskoro…