Pregled bibliografske jedinice broj: 69281
Problemi sintaktičke analize prirodnih jezika
Problemi sintaktičke analize prirodnih jezika, 1997., magistarski rad, Filozofski fakultet, Zagreb
CROSBI ID: 69281 Za ispravke kontaktirajte CROSBI podršku putem web obrasca
Naslov
Problemi sintaktičke analize prirodnih jezika
(Problems of Natural Language Syntax Analysis)
Autori
Seljan, Sanja
Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad
Fakultet
Filozofski fakultet
Mjesto
Zagreb
Datum
14.07
Godina
1997
Stranica
135
Mentor
Dovedan, Zdravko
Neposredni voditelj
Dovedan, Zdravko
Ključne riječi
formalni opis; prirodni i umjetni jezici; gramatika; problemi višeznačnosti i konteksta; sintaktička analiza; sistemi za obradu prirodnih jezika; prikaz znanja
(formal description; natural and artificial languages; grammar; ambiguity and context problems; syntactic analysis; natural language processing systems; knowledge representation)
Sažetak
Iako je sve do nedavno većina sistema za obradu jezika pisana je za engleski jezik, danas ih je sve više namijenjenih i za druge jezike, što se osobito odnosi na programe namijenjene morfološkoj analizi jezika, strojnom prevođenju,učenju jezika ili generiranju tekstova.
Iako su razvijene brojne tehnike za prikaz znanja (logika, mreže, proizvodna pravila, okviri, scenariji, mape, proceduralne metode itd.) zanje je nemoguće sistematizirati i grupirati. U prirodnome se jeziku koristi i pozadainsko van-jezično znanje, zbog čega ga je nemoguće eksplicitno prikazati i prilagoditi za računalnu obradu. Dok su za čvojeka neke informacije više ili manje važne, za računalo sve informacije imaju jednaku važnost.
Prvi korak u analizi jezika čine morfološka i leksička obrada. Riječi se rastavljaju na manje jedinice i prikazuju u leksikonu, koji usko surađuje s parserom kako bi se izgradilo stablo za sintaktičku analizu.
Osim brojnih tehnika za prikaz znanja, razvijene su i brojne gramatike i parseri. Svaka od navedenih gramatika temelji se na nekoj osnovi (transformacije, padežni odnosi, semantički motovirani razredi i dr.). Prve su se gramatike temeljile na sintaksi koja je realističnija, dok su se kasnije sve više približavali i semantičkoj obradi. Unatoč tome, niti jedna od postojećih gramatika nije dosegla stupanj savršenstva. Dobra gramatika ne mora biti pogodna za svaki podskup u jeziku.
Sintaktička se razina usko isprepliće sa semantičkom, odnosno pragmatičkom. Značenje riječi i rečenice ovisi o konteksu, a ne predstavljamo samo ukupnost značenja iz leksikona.
Naposlijetku, što znači "dobar" sistem za obradu jezika? Sistem se treba specijalizirati za određeno područje, čime se ograničava vokabular, uklanja višeznačnost, ograničava na određena vremena, smanjuje broj sintaktičkih konstrukcija itd. Čini se da na kraju vrijedi Goetheova misao "Ako želiš savladati beskonačno, uzmi konačno i savladaj ga sa svih strana".
Izvorni jezik
Hrvatski
Znanstvena područja
Informacijske i komunikacijske znanosti