Skriveni troškovi velikih podataka: ugljični otisak računalne znanosti
Jednostavni online kalkulator istraživačima omogućuje da izračunaju ugljični otisak svog računalnog rada

Računalstvo visokih performansi promijenilo je način na koji funkcionira istraživanje i našu sposobnost da dođemo do dosad nezamislivih otkrića. Buduću klimu sad već možemo modelirati s neviđenom točnošću; iz njegovog genetskog koda možemo predvidjeti kako izgleda neki protein; znamo čak i to kako izgleda crna rupa udaljena 55 milijuna svjetlosnih godina. No, iako bi se malo ljudi usprotivilo takvom napretku, on ima svoju cijenu, a računi nam svakodnevno stižu na naplatu.
Ugljični otisak znanosti
Početkom ove godine istraživači Sveučilišta Cambridge i kolege s australskog Instituta Baker u Melbourneu objavio je istraživanje koje pokazuje da bi studija udruživanja na razini genoma (GWAS) koja prikuplja podatke pola milijuna sudionika registriranih u bazi podataka biobanke stvorila ugljični otisak od 17,3 kg ekvivalenta ugljičnog dioksida (CO2e) za svaku genetsku osobinu koja se proučava.
No, to nije sve jer istraživači obično promatraju tisuće osobina pa bi isti GWAS rad za tisuću svojstava u konačnici proizveo bi 17,3 tone CO2e. Istina, napominju istraživači s Cambridgea, nadogradnja korištenog softvera na najnoviju verziju smanjila bi otisak za tri četvrtine.
Online kalkulator
Potaknuti podacima o štetnom utjecaju velikih šumskih požara u Australiji na klimu te studijom koja obuku umjetne inteligencije izjednačava s ugljičnim otiskom pet automobila tijekom njihova životnog vijeka, britanski i australski istraživači odlučili su izraditi Green Algorithms, jednostavni online kalkulator koji istraživačima omogućuje da izračunaju ugljični otisak svog računalnog rada.
Ovo nije prvi put da istraživači propitkuju društvenu cijenu svog rada, od utjecaja letenja na znanstvene konferencije do pitanja plastičnog i kemijskog otpada te energetskih prohtjeva iz laboratorija u kojima se odvija eksperimentalni rad. Značajan utjecaj imaju i računala: opremu bi trebalo ažurirati i zamijeniti najmanje svakih nekoliko godina, a i sama pohrana podataka zahtijeva energiju.
Vrtoglave brojke
Tu su i ogromne količine rada na računalima: samo 2020. godine istraživači su proveli devet milijardi sati za računalima, odnosno 24 milijuna sati dnevno, pokazuju podaci XSEDE (Extreme Science and Engineering Discovery Environment), virtualnog sustava koji znanstvenicima omogućuje dijeljenje računalnih resursa, podataka i stručnosti.
Napredna verzija kalkulatora
Green Algorithms je u početku bio korišten samo nekoliko desetaka puta mjesečno, da bi ga s vremenom prihvatili istraživači diljem svijeta pa ga sad tjedno rabi više od 300 korisnika.
Problem je što ovaj alat mnogi doživljavaju "glomaznim" i nerado ga koriste jer zahtijeva ručni unos podataka. Zbog toga se sad dovršava i Green Algorithms 4HPC, dostupan u beta obliku na GitHubu, koji koristi zapise podataka iz HPC centara za automatski izračun ugljičnog otiska projekta.