Pregled bibliografske jedinice broj: 1148854
Pronalaženje engleskih riječi u hrvatskome: analiza računalno-jezikoslovnih alata
Pronalaženje engleskih riječi u hrvatskome: analiza računalno-jezikoslovnih alata // Jezično i izvanjezično u međudjelovanju / Linguistic and Extralinguistic in Interaction
Split, Hrvatska, 2020. str. 25-25 (predavanje, međunarodna recenzija, sažetak, znanstveni)
CROSBI ID: 1148854 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Pronalaženje engleskih riječi u hrvatskome: analiza
računalno-jezikoslovnih alata
(Finding English words in Croatian: an analysis of
corpus linguistics tools)
Autori
Borucinsky, Mirjana ; Bogunović, Irena
Vrsta, podvrsta i kategorija rada
Sažeci sa skupova, sažetak, znanstveni
Izvornik
Jezično i izvanjezično u međudjelovanju / Linguistic and Extralinguistic in Interaction
/ - , 2020, 25-25
Skup
HDPL XXXIV. međunarodni znanstveni skup
Mjesto i datum
Split, Hrvatska, 24.09.2020. - 26.09.2020
Vrsta sudjelovanja
Predavanje
Vrsta recenzije
Međunarodna recenzija
Ključne riječi
engleske riječi, hrvatski jezik, računalno jezikoslovlje
(English words, Croatian language, corpus linguistics)
Sažetak
Engleski je jezik lingua franca modernoga doba i kao takav postao je dominantan jezik davaoc. Danas se smatra da hrvatski jezik najviše posuđuje upravo iz engleskoga. Utjecaj engleskoga jezika na hrvatski vidljiv je u gotovo svim funkcionalnim stilovima te na svim jezičnim razinama, posebice leksičkoj. Riječi posuđene iz engleskoga jezika nazivaju se anglizmima, a jeziku primaocu prilagodile su se dijelom ili potpuno. U novije vrijeme sve su češće riječi koje se javljaju u izvornom obliku, kojem se po potrebi dodaju hrvatski afiksi (pseudoanglizmi). Takve su riječi, primjerice, chat, freelancer i e-mail, a kako bismo ih razlučili od anglizama u ovome istraživanju koristit će se naziv "engleske riječi". S takvim se riječima susrećemo svakodnevno - u razgovoru, medijima, na društvenim mrežama. S obzirom na to da ne postoje podaci o učestalosti engleskih riječi u hrvatskome jeziku, te su stoga otežana daljnja istraživanja kojima bi se stekao bolji uvid u njihovu uporabu, oblike, obradu i slično, potrebno je izraditi bazu engleskih riječi u hrvatskome i njihove učestalosti. S obzirom na to da trenutno niti jedan dostupan računalno-jezikoslovni alat ne nudi mogućnost automatskog pronalaženja engleskih riječi u hrvatskome jeziku, cilj ovoga istraživanja jest analizirati postojeće računalno- jezikoslovne alate i resurse u nastojanju da se pronađe optimalan način za ekstrakciju engleskih riječi. Pritom će se posebno razmotriti problemi poput činjenice da se mnogi alati ne ažuriraju redovito, da ne omogućuju generiranje isključivo engleskih riječi, već samo stranih riječi, kao i problem višeznačnosti (npr. riječ distanca u genitivnom obliku prepoznaje se kao strana riječ). Ovo istraživanje pružit će bolji uvid u mogućnosti dostupnih računalno-jezikoslovnih alata u ekstrakciji riječi, postojećih problema te mogućih rješenja koja bi omogućila izradu baze engleskih riječi u hrvatskome s frekvencijama.
Izvorni jezik
Hrvatski
Znanstvena područja
Filologija
POVEZANOST RADA
Ustanove:
Pomorski fakultet, Rijeka