Pregled bibliografske jedinice broj: 1142470
Struktura podataka za efikasno spremanje očitanja dobivenih sekvenciranjem genoma
Struktura podataka za efikasno spremanje očitanja dobivenih sekvenciranjem genoma, 2021., diplomski rad, preddiplomski, Fakultet elektrotehnike i računarstva, Zagreb
CROSBI ID: 1142470 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Struktura podataka za efikasno spremanje očitanja
dobivenih sekvenciranjem genoma
(Data Structure for Efficient Storage of Genome
Sequencing Data)
Autori
Klabučar, Ivan
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, diplomski rad, preddiplomski
Fakultet
Fakultet elektrotehnike i računarstva
Mjesto
Zagreb
Datum
02.07
Godina
2021
Stranica
39
Mentor
Šikić, Mile
Neposredni voditelj
Vaser, Robert
Ključne riječi
bioinformatika, ocjena kvalitete, kompresija, sažimanje, FASTQ format
(bioinformatics, Phred quality scores, compression, FASTQ forma)
Sažetak
Zbog golemih duljina genoma, njihova bilo kakva bioinformatička obrada vrlo je memorijski zahtjevna. Općenito, efikasna pohrana ocjena kvaliteta (engl. Phred quality scores) u radnu memoriju predstavlja veći izazov od pohrane samih sljedova pa se prirodno nameće pitanje njihove kompresije. U ovom radu predstavljamo algoritam kompresije ocjena kvaliteta genetskih sljedova koji smanjuje memoriju potrebnu za njihovu pohranu gotovo pa četiri puta. To postiže sažimanjem svake ocjene kvalitete s dva bita umjesto osam te računanjem povoljnog preslikavanja dvobitnih kôdova natrag u ocjene kvalitete. Također u radu ispitujemo količinu informacije koju kompresija gubi nad stvarnim i simuliranim podatcima te utjecaj njene primjene na točnost alata Racon
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo
POVEZANOST RADA
Projekti:
HRZZ-IP-2018-01-5886 - De novo sastavljanje genoma i metagenoma (SIGMA) (Šikić, Mile, HRZZ ) ( CroRIS)
Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb