First Steps Toward Developing a System for Terminology Extraction

Bago, Petra; Boras, Damir; Ljubešić, Nikola

izvor podataka: crosbi !

First Steps Toward Developing a System for Terminology Extraction (CROSBI ID 557663)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Bago, Petra ; Boras, Damir ; Ljubešić, Nikola First Steps Toward Developing a System for Terminology Extraction // INFuture2009: Digital Resources and Knowledge Sharing / Stančić, Hrvoje ; Seljan, Sanja ; Bawden, David et al. (ur.). Zagreb: Odsjek za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu, 2009. str. 197-206

Podaci o odgovornosti

Autori

Bago, Petra ; Boras, Damir ; Ljubešić, Nikola

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

First Steps Toward Developing a System for Terminology Extraction

Sažetak

The aim of this paper is to describe first steps in developing a system for terminology extraction. First a data sample is built from synopses of doctoral theses at the Faculty of Humanities and Social Sciences, University of Zagreb, accepted in the period from 2004 to 2009 written mostly in Croatian language. Data sample consists of 420 documents and 338, 706 tokens. A small sample was manually tagged for terminology to be used in an initial experiment. The approach for terminology extraction is knowledge-driven and consists of differential analysis of reference and domain-specific corpora. Specific method used is log-likelihood ratio test. Experiment deals with different reference corpora and linguistic pre-processing. First results are promising. Further research guidelines are discussed.

Ključne riječi

terminology extraction; data sample; log-likelihood ratio test

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

197-206.

Godina izdavanja

2009.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

INFuture2009: Digital Resources and Knowledge Sharing

Urednici

Stančić, Hrvoje ; Seljan, Sanja ; Bawden, David ; Lasić-Lazić, Jadranka ; Slavić, Aida

Izdavač

Zagreb: Odsjek za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu

ISBN

978-953-175-355-5

Podaci o skupu

Skup

2nd International Conference “The Future of Information Sciences: INFuture2009 – Digital Resources and Knowledge Sharing”

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

04.11.2009-06.11.2009

Mjesto održavanja skupa

Zagreb, Hrvatska

Povezanost rada

Povezane osobe

Nikola Ljubešić (autor/i)

Damir Boras (autor/i)

Petra Bago (autor/i)

Povezane ustanove

Filozofski fakultet u Zagrebu (130) (autorova ustanova)

Povezani projekti

Hrvatska rječnička baština i hrvatski europski identitet (rezultat rada na projektu)

Područje

Informacijske i komunikacijske znanosti