Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 526486

Problem stranih imena kod strojne tvorbe govora na hrvatskome


Dembitz, Šandor; Pavlek, Jakov; Stupar, Dejan
Problem stranih imena kod strojne tvorbe govora na hrvatskome // Proizvodnja i percepcija govora / Mildner, Vesana ; Liker, Marko (ur.).
Zagreb: FF Press, 2010. str. 406-417


CROSBI ID: 526486 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Problem stranih imena kod strojne tvorbe govora na hrvatskome
(Foreign Name Problem in Croatian Speech Synthesis)

Autori
Dembitz, Šandor ; Pavlek, Jakov ; Stupar, Dejan

Vrsta, podvrsta i kategorija rada
Poglavlja u knjigama, znanstveni

Knjiga
Proizvodnja i percepcija govora

Urednik/ci
Mildner, Vesana ; Liker, Marko

Izdavač
FF Press

Grad
Zagreb

Godina
2010

Raspon stranica
406-417

ISBN
978-953-175-351-7

Ključne riječi
sinteza govora, hrvatski jezik, transkripcija stranih imena
(speech synthesis, Croatian language, transcription of foreign names)

Sažetak
U svakom sustavu za automatsku sintezu govora neke dijelove teksta treba pretprocesirati, tj. normalizirati, da bi postali izgovorljivi. To se općeniti odnosi na brojeve, kratice, simbole različitih jedinica i strana imena. Hrvatski sustav pisanja je u osnovi fonološki, što olakšava preslikavanje grafema u foneme pri strojnoj tvorbi govora, no strana imena u hrvatskome u pravili zadržavaju svoju izvornu grafiju. Stoga njih u sustavu za sintezu govora treba transkribirati prema hrvatskim transkripcijskim pravilima. U radu se, polazeći od usporedne analize dva hrvatska megakorpusa, prvo istražuje udio stranih imena u prosječnom hrvatskom tekstu i dinamika njihova ulaska u hrvatski. Nadalje se opisuje postupak za automatsku identifikaciju jezika, koji je testiran nad uzorkom od preko 30.000 stranih imena i njihovih kosih oblika. Polazeći od rezultata ove klasifikacije, programski se pokušavaju transkribirati imena razvrstana kao njemačka ili talijanska. Točnost transkripcije od preko 90%, zajedno s točnošću razvrstavanja imena od oko 90%, ohrabrujuća je za daljnje napore na razvoju sustava.

Izvorni jezik
Hrvatski

Znanstvena područja
Elektrotehnika, Računarstvo



POVEZANOST RADA


Projekti:
036-0362027-1638 - Umrežena ekonomija (Skočir, Zoran, MZO ) ( CroRIS)

Ustanove:
Fakultet elektrotehnike i računarstva, Zagreb

Profili:

Avatar Url Šandor Dembitz (autor)

Avatar Url Jakov Pavlek (autor)


Citiraj ovu publikaciju:

Dembitz, Šandor; Pavlek, Jakov; Stupar, Dejan
Problem stranih imena kod strojne tvorbe govora na hrvatskome // Proizvodnja i percepcija govora / Mildner, Vesana ; Liker, Marko (ur.).
Zagreb: FF Press, 2010. str. 406-417
Dembitz, Š., Pavlek, J. & Stupar, D. (2010) Problem stranih imena kod strojne tvorbe govora na hrvatskome. U: Mildner, V. & Liker, M. (ur.) Proizvodnja i percepcija govora. Zagreb, FF Press, str. 406-417.
@inbook{inbook, author = {Dembitz, \v{S}andor and Pavlek, Jakov and Stupar, Dejan}, year = {2010}, pages = {406-417}, keywords = {sinteza govora, hrvatski jezik, transkripcija stranih imena}, isbn = {978-953-175-351-7}, title = {Problem stranih imena kod strojne tvorbe govora na hrvatskome}, keyword = {sinteza govora, hrvatski jezik, transkripcija stranih imena}, publisher = {FF Press}, publisherplace = {Zagreb} }
@inbook{inbook, author = {Dembitz, \v{S}andor and Pavlek, Jakov and Stupar, Dejan}, year = {2010}, pages = {406-417}, keywords = {speech synthesis, Croatian language, transcription of foreign names}, isbn = {978-953-175-351-7}, title = {Foreign Name Problem in Croatian Speech Synthesis}, keyword = {speech synthesis, Croatian language, transcription of foreign names}, publisher = {FF Press}, publisherplace = {Zagreb} }




Contrast
Increase Font
Decrease Font
Dyslexic Font