Struktura podataka za efikasno spremanje očitanja dobivenih sekvenciranjem genoma (CROSBI ID 442808)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Klabučar, Ivan
Šikić, Mile
Vaser, Robert
hrvatski
Struktura podataka za efikasno spremanje očitanja dobivenih sekvenciranjem genoma
Zbog golemih duljina genoma, njihova bilo kakva bioinformatička obrada vrlo je memorijski zahtjevna. Općenito, efikasna pohrana ocjena kvaliteta (engl. Phred quality scores) u radnu memoriju predstavlja veći izazov od pohrane samih sljedova pa se prirodno nameće pitanje njihove kompresije. U ovom radu predstavljamo algoritam kompresije ocjena kvaliteta genetskih sljedova koji smanjuje memoriju potrebnu za njihovu pohranu gotovo pa četiri puta. To postiže sažimanjem svake ocjene kvalitete s dva bita umjesto osam te računanjem povoljnog preslikavanja dvobitnih kôdova natrag u ocjene kvalitete. Također u radu ispitujemo količinu informacije koju kompresija gubi nad stvarnim i simuliranim podatcima te utjecaj njene primjene na točnost alata Racon
bioinformatika, ocjena kvalitete, kompresija, sažimanje, FASTQ format
nije evidentirano
engleski
Data Structure for Efficient Storage of Genome Sequencing Data
nije evidentirano
bioinformatics, Phred quality scores, compression, FASTQ forma
nije evidentirano
Podaci o izdanju
39
02.07.2021.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb