Napredna pretraga

Pregled bibliografske jedinice broj: 547002

Poboljšani algoritam za izbor i provjeru kvalitete najboljih multivarijacijskih modela odnosa strukture i svojstava molekula


Papeš Šokčević, Lidija
Poboljšani algoritam za izbor i provjeru kvalitete najboljih multivarijacijskih modela odnosa strukture i svojstava molekula 2011., magistarski rad, Fakultet elektrotehnike i računarstva, Zagreb


Naslov
Poboljšani algoritam za izbor i provjeru kvalitete najboljih multivarijacijskih modela odnosa strukture i svojstava molekula
(Improved algorithm for selection and validation of best multivariate structure-property molecular models)

Autori
Papeš Šokčević, Lidija

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad

Fakultet
Fakultet elektrotehnike i računarstva

Mjesto
Zagreb

Datum
26.10

Godina
2011

Stranica
72

Mentor
Šikić, Mile ; Lučić, Bono

Ključne riječi
QSAR modeliranje; multivarijacijska linearna regresija; izbor deskriptora; razvoj modela; statistički parametri; prilagodba modela; križna provjera; vanjska provjera; topljivost molekula u vodi
(QSAR modeling; multivariate linear regresion; selection of descriptors; model development; statistical parameters; model fitting; cross-validation; external validation; water solubility of molecules)

Sažetak
Algoritam za izbor najboljih mogućih multivarijatnih modela (prema koeficijentu korelacije) razvijen je za potrebe primjena u istraživanju lijekova. Realiziran je u programskom jeziku Visual Basic i povezan je s bazom podataka. U radu je istražen odnos između statističkih parametara izračunatih na podacima u postupku prilagodbe na skupu za učenje, križne provjere ispuštanjem određenog postotka podataka skupa za učenje i u postupku predviđanja na vanjskom skupu podataka. Postupak križne provjere u kojem se u svakom koraku izbacuju veći podskupovi podataka pokazuje bolje slaganje s rezultatima dobivenim u predviđanju na vanjskom skupu nego najčešće korišteni postupak križne provjere u kojem se u svakom koraku izbacuje po jedna molekula. Nadalje, slaganje između statističkih parametara izračunatih u postupku prilagodbe na skupu za učenje i odgovarajućih parametara izračunatih u postupcima križnih provjera i na vanjskome skupu, znatno je bolje nego slaganja objavljivana u literaturi. To potvrđuje dobre strane primijenjenog postupka početne eliminacije deskriptora, smanjenja korelacije između deskriptora, postupka modeliranja i primijenjenoga algoritma za izbor modela. Za razliku od uobičajenih postupaka križne provjere koji se rabe u literaturi istražile su se učestalosti pojavljivanja pojedinih deskriptora u najboljim modelima. Na temelju tih analiza načinio se redoslijed važnosti pojedinih deskriptora u najboljim modelima, što je važna informacija pri interpretaciji i uporabi najboljih modela. Dobiveni rezultati i razvijena aplikacija MR_QSAR vrijedan su znanstveni i stručni doprinos području razvoja i primjene računalnih algoritama za modeliranja svojstava i aktivnosti molekula koja se provode u znanstvenim krugovima, u istraživanjima novih lijekova u farmaceutskoj industriji, te u zaštiti okoliša u postupcima procjene toksičnosti molekula.

Izvorni jezik
Hrvatski

Znanstvena područja
Kemija, Računarstvo, Farmacija



POVEZANOST RADA


Projekt / tema
036-0362214-1987 - Modeliranje kompleksnih sustava (Branko Jeren, )
079-0000000-3211 - Odnos strukture i aktivnosti flavonoida (Dragan Amić, )
098-1191344-2860 - Proučavanje biomakromolekula računalnim metodama i razvoj novih algoritama (Sanja Tomić, )
098-1770495-2919 - Razvoj metoda za modeliranje svojstava bioaktivnih molekula i proteina (Bono Lučić, )

Ustanove
Fakultet elektrotehnike i računarstva, Zagreb,
Fakultet agrobiotehničkih znanosti Osijek,
Institut "Ruđer Bošković", Zagreb

Autor s matičnim brojem:
Lidija Papeš Šokčević, (332431)