Tko će pobijediti u globalnom nadmetanju GenAI modela?
Važno je da je DeepSeek dokazao kako se napredni AI modeli mogu trenirati s manje resursa, što bi moglo demokratizirati AI tehnologiju i smanjiti ovisnost o skupim zapadnim hardverskim rješenjima

Kada je krajem siječnja svijetu predstavljen DeepSeek, sada već svima dobro poznati kineski AI startup, to je snažno odjeknulo u čitavoj tehnološkoj zajednici koja se bavi umjetnom inteligencijom. Objava je prouzročila značajan potres na burzama (Nvidia je izgubila 600 milijardi dolara tržišne vrijednosti u jednom danu), ali i zabrinula dosad naizgled nenadmašnog zapadnog vladara velikih jezičnih modela OpenAI, dovodeći u pitanje same temelje zapadnog pogleda na razvoj AI modela. Nvidia se brzo oporavila, ali Kinezi su nastavili sa serijom objava raznih novih AI modela (to je proces koji i dalje traje), pa smo malo pričekali da se stvari raspletu, i sada smo napravili snimku stanja, odnosno temu broja posvetili aktualnom stanju u svijetu generičke umjetne inteligencije.
Analizu i pretresanje ponude na Zapadu i Istoku obavio je neumorni Matija Gračanin (usput, budi rečeno, volio bih da ga naši čitatelji upoznaju i uživo, pa sam ga nagovarao da održi predavanje na .debugu, našoj najvećoj konferenciji, no uporno to odbija, kaže da nije sklon javnim nastupima).
Sažeto – u uvodnom dijelu teme broja objašnjava se kako DeepSeek-R1 koristi arhitekturu "mješavine stručnjaka" (Mixture of Experts – MoE), gdje se aktivira samo dio modela potreban za određeni zadatak, čime se optimizira potrošnja resursa, što je i glavna prednost DeepSeeka. Ima 671 milijardu parametara, no u obradi pojedinog upita koristi samo 37 milijardi, za razliku od zapadnih modela, koji aktiviraju cijelu mrežu. Sposoban je za zaključivanje i induciranje "lanca misli" (Chain-of-Thought), a treniran je kombinacijom nadziranog finog podešavanja (SFT) i učenja s pojačanjem (RL), koristeći inovativni GRPO algoritam, koji smanjuje troškove treniranja. Možda vam ovo djeluje nerazumljivo, ali u Matijinom tekstu svaki je od tih koraka opširno i detaljno objašnjen (a dio procesa sam izostavio), pa čak i ako se profesionalno ne bavite umjetnom inteligencijom, shvatit ćete kako taj model funkcionira.
Za širi kontekst te priče važno je da je DeepSeek dokazao kako se napredni AI modeli mogu trenirati s manje resursa, što bi moglo demokratizirati AI tehnologiju i smanjiti ovisnost o skupim zapadnim hardverskim rješenjima (na kojima svoju supremaciju baziraju američki sustavi).
Kina je dodatno ojačala svoju AI strategiju, najavivši ulaganje od 137 milijardi dolara u narednih pet godina, što predstavlja izazov američkoj inicijativi Stargate, u kojoj bi glavnu riječ trebao voditi OpenAI, uz velika ulaganja investitora. DeepSeek-R1 tako je postao simbol rastućeg tehnološkog suparništva između Kine i SAD-a, dok njegova metodologija razvoja i treniranja najavljuje moguću transformaciju AI industrije. Prate ga razni novi AI modeli, ne samo u Kini (ima i Europa što reći), o čemu sve možete doznati iz naše teme broja.
Burno je i u svijetu hardvera, pa ovaj mjesec imamo čak pet tekstova proglašenih hard-hitom, što nam je povijesni rekord. Radi se o trenutačno najboljem procesoru za PC računala, AMD Ryzenu 9 9950X3D; potom četiri grafičke kartice nove generacije AMD Radeon, koje predstavljaju ozbiljnu konkurenciju Nvidijinom GeForce RTX-u 5070, a to su: Asus TUF Gaming Radeon RX 9070 XT OC Edition 16GB, Asus Prime Radeon RX 9070 OC Edition, Gigabyte Radeon RX 9070 Gaming OC 16G i Gigabyte Radeon RX 9070 XT Gaming OC 16G.
Priredili smo vam i recenziju atraktivnog laptopa Lenovo Yoga Slim 9i (14ILL10), koji ima poklopac od tirkiznog stakla, fantastičan OLED ekran i masu od samo 1,25 kg. Tko želi i na laptopu imati dva ekrana, neka pročita što nudi Asus u svojem modelu za 2025. godinu Zenbook Duo (UX8406C).
Broj zaključujemo našom uobičajenom proljetnom temom, koju ćete na našim web-stranicama pronaći i u obliku posebnog priloga, a to je pregled studija informatičkih i računalnih znanosti, s naglaskom na stjecanju znanja za razvoj računalnih igara. Ta tema obavezno je štivo za sve one koji trenutačno razmatraju kojim putem krenuti u stjecanju znanja za budući profesionalni angažman na poslovima kojima se žele baviti u životu.
Uvid u kompletan sadržaj novog broja možete pogledati ovdje, od danas je dostupan na kioscima, kao i u digitalnom izdanju.