Pregled bibliografske jedinice broj: 204111
Korpus hrvatskoga govora
Korpus hrvatskoga govora // Govor : časopis za fonetiku, I (2004), 2; 135-150 (podatak o recenziji nije dostupan, pregledni rad, stručni)
CROSBI ID: 204111 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Korpus hrvatskoga govora
(Croatian speech corpora)
Autori
Martinčić-Ipšić, Sanda ; Matešić, Mihaela ; Ipšić, Ivo
Izvornik
Govor : časopis za fonetiku (0352-7565) I
(2004), 2;
135-150
Vrsta, podvrsta i kategorija rada
Radovi u časopisima, pregledni rad, stručni
Ključne riječi
govorni korpus; hrvatski govori; segmentacija govora; validacija
(speech corpus; Croatian speeches; speech segmentation; validation)
Sažetak
U radu je predstavljen korpus hrvatskoga govora, Odsjeka za informatiku Filozofskoga fakulteta u Rijeci. Korpus se sastoji od triju dijelova: radijskih i telefonskih vremenskih prognoza te televizijskih vijesti. Prikupljen je govor 250 različitih govornika u ukupnom trajanju od gotovo 20 sati. Prikupljen je čitani i spontani govor. Prikazani su struktura korpusa, njegova organizacija i osnovni statistički parametri. Opisani su postupci snimanja govora i transkripcije. U radu su predstavljeni korišteni alati CSLU SpeechView, Transcriber i HTK, rječnik, koji sadrži sve riječi govornoga korpusa i njihov fonetski zapis, te postupak validacije govornoga korpusa. U zaključnom dijelu predstavljeni su rezultati automatske segmentacije na fonetskoj razini.
Izvorni jezik
Hrvatski
Znanstvena područja
Računarstvo, Filologija
POVEZANOST RADA
Ustanove:
Filozofski fakultet, Rijeka