Napredna pretraga

Pregled bibliografske jedinice broj: 204111

Korpus hrvatskoga govora


Martinčić-Ipšić, Sanda; Matešić, Mihaela; Ipšić, Ivo
Korpus hrvatskoga govora // Govor : časopis za fonetiku, I (2004), 2; 135-150 (podatak o recenziji nije dostupan, pregledni rad, stručni)


Naslov
Korpus hrvatskoga govora
(Croatian speech corpora)

Autori
Martinčić-Ipšić, Sanda ; Matešić, Mihaela ; Ipšić, Ivo

Izvornik
Govor : časopis za fonetiku (0352-7565) I (2004), 2; 135-150

Vrsta, podvrsta i kategorija rada
Radovi u časopisima, pregledni rad, stručni

Ključne riječi
Govorni korpus; hrvatski govori; segmentacija govora; validacija
(Speech corpus; Croatian speeches; speech segmentation; validation)

Sažetak
U radu je predstavljen korpus hrvatskoga govora, Odsjeka za informatiku Filozofskoga fakulteta u Rijeci. Korpus se sastoji od triju dijelova: radijskih i telefonskih vremenskih prognoza te televizijskih vijesti. Prikupljen je govor 250 različitih govornika u ukupnom trajanju od gotovo 20 sati. Prikupljen je čitani i spontani govor. Prikazani su struktura korpusa, njegova organizacija i osnovni statistički parametri. Opisani su postupci snimanja govora i transkripcije. U radu su predstavljeni korišteni alati CSLU SpeechView, Transcriber i HTK, rječnik, koji sadrži sve riječi govornoga korpusa i njihov fonetski zapis, te postupak validacije govornoga korpusa. U zaključnom dijelu predstavljeni su rezultati automatske segmentacije na fonetskoj razini.

Izvorni jezik
Hrvatski

Znanstvena područja
Računarstvo, Filologija



POVEZANOST RADA


Projekt / tema
0009012
0009014

Ustanove
Filozofski fakultet, Rijeka