Pregled bibliografske jedinice broj: 1013583
Pronalaženje varijanti gena iz podataka dobivenih sekvenciranjem
Pronalaženje varijanti gena iz podataka dobivenih sekvenciranjem, 2019., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 1013583 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Pronalaženje varijanti gena iz podataka dobivenih sekvenciranjem
(Discovering gene variants from sequencing data)
Autori
Kosier, Sanja
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
02.07
Godina
2019
Stranica
26
Mentor
Šikić, Mile
Neposredni voditelj
Križanović, Krešimir
Ključne riječi
C++, Python, SPOA, višestruko poravnanje sekvenci, FASTQ, konsenzus, aleli
(C++, Python, SPOA, multiple sequence alignment, FASTQ, consensus, alleles)
Sažetak
Aleli predstavljaju dva alternativna gena koja određuju istu osobinu. Pronalazak alela iz višestrukih očitanja gena nije trivijalan. Događa se da su određeni aleli u uzorcima podzastupljeni te je teško programskim rješenjima detektirati njihovo pojavljivanje. Cilj ovog rada bio je implementirati metode za pronalazak varijanti gena iz uzoraka dobivenih sekvenciranjem. Problem je riješen korištenjem programskih jezika C++ i Python, alata SPOA i Bioparser te algoritmima za poravnanje sekvenci. Razvijene metode čitaju uzorke iz FASTQ datoteka, koriste višestruko poravnanje sekvenci te vrše grupiranje sličnih očitanja u klastere. Nakon toga, odabiru se najveći klasteri na temelju broja očitanja u njima i računa se konsenzusna sekvenca koja naposljetku predstavlja pronađeni alel. U radu su se koristila očitanja MHC gena divokoza.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb