Korpus hrvatskoga govora (CROSBI ID 115624)
Prilog u časopisu | pregledni rad (stručni)
Podaci o odgovornosti
Martinčić-Ipšić, Sanda ; Matešić, Mihaela ; Ipšić, Ivo
hrvatski
Korpus hrvatskoga govora
U radu je predstavljen korpus hrvatskoga govora, Odsjeka za informatiku Filozofskoga fakulteta u Rijeci. Korpus se sastoji od triju dijelova: radijskih i telefonskih vremenskih prognoza te televizijskih vijesti. Prikupljen je govor 250 različitih govornika u ukupnom trajanju od gotovo 20 sati. Prikupljen je čitani i spontani govor. Prikazani su struktura korpusa, njegova organizacija i osnovni statistički parametri. Opisani su postupci snimanja govora i transkripcije. U radu su predstavljeni korišteni alati CSLU SpeechView, Transcriber i HTK, rječnik, koji sadrži sve riječi govornoga korpusa i njihov fonetski zapis, te postupak validacije govornoga korpusa. U zaključnom dijelu predstavljeni su rezultati automatske segmentacije na fonetskoj razini.
govorni korpus; hrvatski govori; segmentacija govora; validacija
nije evidentirano
engleski
Croatian speech corpora
nije evidentirano
speech corpus; Croatian speeches; speech segmentation; validation
nije evidentirano