Pretražite po imenu i prezimenu autora, mentora, urednika, prevoditelja

Napredna pretraga

Pregled bibliografske jedinice broj: 208271

Zakon o veličini vokabulara teksta Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku


Tuđman, Miroslav
Zakon o veličini vokabulara teksta Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku // Društvena istraživanja : časopis za opća društvena pitanja, 14 (2005), 1-2; 227-250 (međunarodna recenzija, članak, znanstveni)


CROSBI ID: 208271 Za ispravke kontaktirajte CROSBI podršku putem web obrasca

Naslov
Zakon o veličini vokabulara teksta Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku
(Law of vocabulary size prediction)

Autori
Tuđman, Miroslav

Izvornik
Društvena istraživanja : časopis za opća društvena pitanja (1330-0288) 14 (2005), 1-2; 227-250

Vrsta, podvrsta i kategorija rada
Radovi u časopisima, članak, znanstveni

Ključne riječi
Heapsov zakon; veličina vokabulara teksta; hrvatski jezik
(Heaps law; text vocabulary size; Croatian language)

Sažetak
Postojeća formula /Vr(n) = Knβ / Heapsova zakona o veličini vokabulara teksta nije univerzalna te je zakon potrebno redefinirati, kako bi se mogao koristiti za analizu korpusa na različitim jezicima. Analiza korpusa tekstova na hrvatskom jeziku potvrđuje hipotezu da je broj funkcionalnih pojavnica (F) u tekstu konstantan te iznosi 21% veličine teksta n (funkcionalnih pojavnica u engleskim je tekstovima 26%). Autor dokazuje da se postotak funkcionalnih pojavnica u tekstu može koristiti kao vrijednost za parametar K, te da je parametar K konstantna vrijednost za svaki jezični korpus. Empirijska istraživanja potvrđuju autorovu tezu da se broj funkcionalnih pojavnica u tekstu može izračunati po formuli F = nK/100, a da za veličinu najfrekventnije pojavnice (MF) vrijedi formula M F = n (K/100) 2. Vrijednost drugog parametra Heapsovog zakona također se može precizno odrediti: β = log K/100. Zato autor predlaže novi oblik zakona o veličini vokabulara teksta: Vr(n) = (Kn)β . Broj riječi koje se javljaju samo jedanput (HL) u tekstu može se izračunati po formuli: HL = ((Kn)/2)β . Istraživanja potvrđuju da je vrlo visoka korelacija između izračunatih i stvarnih vrijednosti veličine vokabulara, odnosno između stvarnih i izračunatih vrijednosti jednokratnih riječi u tekstu. Ovako interpretiran i definiran zakon o veličini vokabulara teksta omogućava izračun veličine vokabulara teksta na svakom jeziku, kada se zna postotak funkcionalnih riječi koji je konstantan za taj jezik. No, ova interpretacija zakona omogućava osim izračuna veličine vokabulara teksta, i određivanje broja funkcionalnih pojavnica u tekstu, veličine najfrekventnije riječi u tekstu, te broja jednokratnih pojavnica koje tvore vokabular teksta.

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekti:
0130443

Ustanove:
Filozofski fakultet, Zagreb

Profili:

Avatar Url Miroslav Tuđman (autor)

Poveznice na cjeloviti tekst rada:

Hrčak

Citiraj ovu publikaciju:

Tuđman, Miroslav
Zakon o veličini vokabulara teksta Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku // Društvena istraživanja : časopis za opća društvena pitanja, 14 (2005), 1-2; 227-250 (međunarodna recenzija, članak, znanstveni)
Tuđman, M. (2005) Zakon o veličini vokabulara teksta Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku. Društvena istraživanja : časopis za opća društvena pitanja, 14 (1-2), 227-250.
@article{article, author = {Tu\djman, Miroslav}, year = {2005}, pages = {227-250}, keywords = {Heapsov zakon, veli\v{c}ina vokabulara teksta, hrvatski jezik}, journal = {Dru\v{s}tvena istra\v{z}ivanja : \v{c}asopis za op\'{c}a dru\v{s}tvena pitanja}, volume = {14}, number = {1-2}, issn = {1330-0288}, title = {Zakon o veli\v{c}ini vokabulara teksta Heapsov zakon i odre\djivanje veli\v{c}ine vokabulara tekstova na hrvatskom jeziku}, keyword = {Heapsov zakon, veli\v{c}ina vokabulara teksta, hrvatski jezik} }
@article{article, author = {Tu\djman, Miroslav}, year = {2005}, pages = {227-250}, keywords = {Heaps law, text vocabulary size, Croatian language}, journal = {Dru\v{s}tvena istra\v{z}ivanja : \v{c}asopis za op\'{c}a dru\v{s}tvena pitanja}, volume = {14}, number = {1-2}, issn = {1330-0288}, title = {Law of vocabulary size prediction}, keyword = {Heaps law, text vocabulary size, Croatian language} }

Časopis indeksira:


  • Current Contents Connect (CCC)
  • Web of Science Core Collection (WoSCC)
    • Social Science Citation Index (SSCI)
    • SCI-EXP, SSCI i/ili A&HCI
  • Scopus





Contrast
Increase Font
Decrease Font
Dyslexic Font