Pregled bibliografske jedinice broj: 101998
Primjena XML-a na primjeru tekstovne baze hrvatskih znanstvenih časopisa
Primjena XML-a na primjeru tekstovne baze hrvatskih znanstvenih časopisa // Konferencija CROinfo 2001 Upravljanje informacijama u gospodarstvu i znanosti : zbornik radova = Conference CROinfo 2001 Information management in industry and science : proceedings / [Konferencija] CROinfo 2001 / Stipanov, Josip ; Nadramija, Damir ; Jokić, Maja (ur.).
Zagreb: Nacionalna i sveučilišna knjižnica ; Pliva, 2001. str. 113-121 (predavanje, nije recenziran, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 101998 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Primjena XML-a na primjeru tekstovne baze hrvatskih znanstvenih časopisa
(The Application of XML on textual database of Croatian scientific journals)
Autori
Jokić, Maja ; Tadić, Marko
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
Izvornik
Konferencija CROinfo 2001 Upravljanje informacijama u gospodarstvu i znanosti : zbornik radova = Conference CROinfo 2001 Information management in industry and science : proceedings / [Konferencija] CROinfo 2001
/ Stipanov, Josip ; Nadramija, Damir ; Jokić, Maja - Zagreb : Nacionalna i sveučilišna knjižnica ; Pliva, 2001, 113-121
Skup
Konferencija CROinfo 2001 Upravljanje informacijama u gospodarstvu i znanosti
Mjesto i datum
Dubrovnik, Hrvatska, 22.11.2001. - 24.11.2001
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Nije recenziran
Ključne riječi
tekstovna baza; elektronski časopis; pretraživanje; korpus; jezične tehnologije; baza podataka cjelovitoga teksta; XML
(textual database; electronic journal; document retrieval; data extraction; data mining; corpus; human language technologies; full-text database; XML)
Sažetak
Časopis je još uvijek najznačajniji oblik objavljivanja znanstvenih rezultata bio on objavljen u tiskanom ili, danas sve više, i u elektronskom obliku. U tu je svrhu zacrtan pilot projekt izgradnje tekstovne baze hrvatskih znanstvenih časopisa. Odlika je te baze da je on relativno jednostavno ostvariva prikupljanjem tekstova koji već postoje u digitalnom zapisu. Nakon konverzije i svođenja tih zapisa u jedinstven XML zapis, pretraživanje tako kodiranih članaka uz uporabu XSL-a omogućuje znatnu fleksibilnost kao i pretraživanje prema svakoj riječi koja se pojavila u bilo kojem dijelu teksta članka. Na kraju rada iznose se perspektive u primjeni jezičnotehnoloških alata za pretraživanje tekstovnih baza podataka.
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti