Pregled bibliografske jedinice broj: 433788
Statistical Language Models for Croatian Weather-domain Corpus
Statistical Language Models for Croatian Weather-domain Corpus // InFuture 2009 / Stančić, Hrvoje ; Seljan, Sanja ; Bawden, David ; Lasić-Lazić, Jadranka ; Slavić, Aida (ur.).
Zagreb: Vjesnik, 2009. str. 333-340 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)
CROSBI ID: 433788 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Statistical Language Models for Croatian Weather-domain Corpus
Autori
Načinović, Lucia ; Martinčić-Ipšić, Sanda ; Ipšić, Ivo
Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni
ISBN
978-953-175-355-5
Skup
InFuture 2009
Mjesto i datum
Zagreb, Hrvatska, 04.11.2009. - 06.11.2009
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
statistical language modelling; n-gram; smoothing methods; Croatian weather-domain corpus
Sažetak
Statistical language modelling estimates the regularities in natural languages. Language models are used in speech recognition, machine translation and other applications for speech and language technologies. In this paper we will present a procedure for language models building for the Croatian weather-domain corpus. Different types of n-gram statistic language models and smoothing methods for language modelling are presented. Those models are compared in terms of their estimated perplexity.
Izvorni jezik
Engleski
Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti
POVEZANOST RADA
Projekti:
009-0361935-0852 - Govorne tehnologije
318-0361935-0852 - Govorne tehnologije (Ipšić, Ivo, MZOS ) ( CroRIS)
Ustanove:
Fakultet informatike i digitalnih tehnologija, Rijeka