Bioinformatika

U biološkim naukama se trenutno generišu velike količine podataka, posebno na molekularnom nivou. Tokom poslednje decenije, stopa generisanja ovih podataka premašila je Murov zakon o dupliranju količine na svakih 18 meseci, sa nedavno procenjenim udvostručenjem na svakih 7 meseci. Raznovrsni podaci molekularno biološkog porekla se često nazivaju “omika” (engl. omics) da bi se kolektivno okarakterisali različiti izvori – genomika, transkriptomika, proteomika, metabolomika, itd. Raznovrsnost i kvantitet ovih podataka su izazvali fundamentalni pomak u istraživanjima molekularne biologije. Bioinformatika je nastala iz ambicije da se razviju moćniji alati za analizu i izvođenje zaključaka iz “omičkih” podataka.

 

Bioinformatički tim Instituta BioSense razvija alate i metode za različite oblasti u okviru molekularne biologije, kao što su funkcionalna genomika, metagenomika, mapiranje lokusa kvantitativnih osobina (engl. quantitative trait loci mapping) i izučavanje genomskih asocijacija (engl. genome-wide association studies) za fenotipske osobine od značaja, mapiranje abiotičke i biotičke otpornosti na stres, itd. Da bismo odgovorili na računarske i analitičke izazove oslanjamo se na metode mašinskog učenja, algoritme teorije grafova i teorije informacija, kompresiju podataka i integraciju podataka/domenskog znanja. Većina podataka kojima se bavimo spadaju u domen poljoprivrede, najčešće vezane za genomiku useva, interakciju genoma i fenoma, interakcije genotipa sa uslovima sredine ali i podatke o mikrobiomu vezane za ljudsko zdravlje i zdravlje useva.

 

Bioinformatički algoritmi takođe imaju važnu ulogu i u razvoju tehnologije čuvanja podataka u formi DNK. Velike količine generisanih podataka zahtevaju efikasna rešenja za njihovo skladištenje. Dokazano je da skladištenje podataka zasnovano na DNK ima veliki potencijal, naročito zbog svoje dugovečnosti i gustine zapisa informacija, te postaje atraktivna alternativa konvencionalnim sistemima za skladištenje podataka. U ovoj oblasti fokusirani smo na analizu fundamentalnih performansi ovakvih sistema, osmišljavanje novih arhitektura za skladištenje i razvoj odgovarajućih algoritama. Neki od problema na kojima trenutno radimo su dizajniranje sekvenci, mehanizmi za ispravljanje grešaka i algoritmi za kodiranje i dekodiranje.