Istraživači MIT-a procijenili koliko informacija sadrže podaci
Novi način procjene dobrih aproksimacija otvara nove primjene u medicini, znanstvenim otkrićima, kognitivnoj znanosti i umjetnoj inteligenciji

Nisu svi podaci stvoreni jednaki. Ali koliko informacija će vjerojatno sadržavati bilo koji dio podataka? Ovo je pitanje ključno za medicinska testiranja, osmišljavanje znanstvenih eksperimenata pa i za svakodnevno ljudsko učenje i razmišljanje. Istraživači MIT-a razvili su novi način rješavanja ovog problema, otvarajući nove primjene u medicini, znanstvenim otkrićima, kognitivnoj znanosti i umjetnoj inteligenciji.
Ideja entropije
Teoretski odgovor ponudio je još pokojni profesor MIT-a Claude Shannon u članku "Matematička teorija komunikacije" iz 1948. godine, u kojem je iznio ideju entropije koja nam omogućuje kvantificiranje količine informacija svojstvene bilo kojem slučajnom objektu, uključujući slučajne varijable koje modeliraju promatrane podatke.
Nažalost, korištenje Shannonove formule može brzo postati računski nerješivo. Ako je proces generiranja podataka jednostavan, kao kod bacanja novčića, takav je i izračun entropije. No, uz samo 10 nepoznanica, a to je obično slučaj kod medicinskih nalaza, već postoji 1000 mogućih objašnjenja za podatke. S nekoliko stotina, postoji više mogućih objašnjenja od atoma u poznatom svemiru, što izračunavanje entropije čini upravo neupravljivim problemom.
Nova metoda
No, sad su istraživači s MIT-a predvođeni Vikashom Mansinghkom, glavnim znanstvenikom Odjela za mozak i kognitivne znanosti, razvili novu metodu procjene dobrih aproksimacija korištenjem probabilističkog zaključivanja, a svoj su rad predstavili na nedavnoj virtualnoj konferenciji o umjetnoj inteligenciji i statistici AISTATS 2022.
Umjesto da nabrajaju sva objašnjenja, upotrijebili su algoritme vjerojatnosti zaključivanja kako bi prvo zaključili koja su objašnjenja vjerojatna, a zatim su ta vjerojatna objašnjenja iskoristili za izradu visokokvalitetnih procjena entropije.
Ova metoda otvara nove mogućnosti u medicinskoj dijagnostici, naprimjer bolesti jetre ili dijabetesa. Algoritmi vjerojatnosti zaključivanja mogu se, kažu istraživači, koristiti za procjenu rigoroznih granica informacijskih mjera za koje inženjeri umjetne inteligencije često misle da ih je teško izračunati. A to otvara mnoge nove primjene.