Napredna pretraga

Pregled bibliografske jedinice broj: 433788

Statistical Language Models for Croatian Weather-domain Corpus


Načinović, Lucia; Martinčić-Ipšić, Sanda; Ipšić, Ivo
Statistical Language Models for Croatian Weather-domain Corpus // InFuture 2009 / Stančić, Hrvoje ; Seljan, Sanja ; Bawden, David ; Lasić-Lazić, Jadranka ; Slavić, Aida (ur.).
Zagreb: Vjesnik, 2009. str. 333-340 (predavanje, međunarodna recenzija, cjeloviti rad (in extenso), znanstveni)


Naslov
Statistical Language Models for Croatian Weather-domain Corpus

Autori
Načinović, Lucia ; Martinčić-Ipšić, Sanda ; Ipšić, Ivo

Vrsta, podvrsta i kategorija rada
Radovi u zbornicima skupova, cjeloviti rad (in extenso), znanstveni

ISBN
978-953-175-355-5

Skup
InFuture 2009

Mjesto i datum
Zagreb, Hrvatska, 4-6.11.2009

Vrsta sudjelovanja
Predavanje

Vrsta recenzije
Međunarodna recenzija

Ključne riječi
Statistical language modelling; n-gram; smoothing methods; Croatian weather-domain corpus

Sažetak
Statistical language modelling estimates the regularities in natural languages. Language models are used in speech recognition, machine translation and other applications for speech and language technologies. In this paper we will present a procedure for language models building for the Croatian weather-domain corpus. Different types of n-gram statistic language models and smoothing methods for language modelling are presented. Those models are compared in terms of their estimated perplexity.

Izvorni jezik
Engleski

Znanstvena područja
Računarstvo, Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekt / tema
009-0361935-0852 - Govorne tehnologije (Ivo Ipšić, )
318-0361935-0852 - Govorne tehnologije (Ivo Ipšić, )

Ustanove
Sveučilište u Rijeci - Odjel za informatiku