Pronalaženje varijanti gena iz podataka dobivenih sekvenciranjem (CROSBI ID 428081)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Kosier, Sanja
Šikić, Mile
Križanović, Krešimir
hrvatski
Pronalaženje varijanti gena iz podataka dobivenih sekvenciranjem
Aleli predstavljaju dva alternativna gena koja određuju istu osobinu. Pronalazak alela iz višestrukih očitanja gena nije trivijalan. Događa se da su određeni aleli u uzorcima podzastupljeni te je teško programskim rješenjima detektirati njihovo pojavljivanje. Cilj ovog rada bio je implementirati metode za pronalazak varijanti gena iz uzoraka dobivenih sekvenciranjem. Problem je riješen korištenjem programskih jezika C++ i Python, alata SPOA i Bioparser te algoritmima za poravnanje sekvenci. Razvijene metode čitaju uzorke iz FASTQ datoteka, koriste višestruko poravnanje sekvenci te vrše grupiranje sličnih očitanja u klastere. Nakon toga, odabiru se najveći klasteri na temelju broja očitanja u njima i računa se konsenzusna sekvenca koja naposljetku predstavlja pronađeni alel. U radu su se koristila očitanja MHC gena divokoza.
C++, Python, SPOA, višestruko poravnanje sekvenci, FASTQ, konsenzus, aleli
nije evidentirano
engleski
Discovering gene variants from sequencing data
nije evidentirano
C++, Python, SPOA, multiple sequence alignment, FASTQ, consensus, alleles
nije evidentirano
Podaci o izdanju
26
02.07.2019.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb