Napredna pretraga

Pregled bibliografske jedinice broj: 69281

Problemi sintaktičke analize prirodnih jezika


Seljan, Sanja
Problemi sintaktičke analize prirodnih jezika 1997., magistarski rad, Filozofski fakultet, Zagreb


Naslov
Problemi sintaktičke analize prirodnih jezika
(Problems of Natural Language Syntax Analysis)

Autori
Seljan, Sanja

Vrsta, podvrsta i kategorija rada
Ocjenski radovi, magistarski rad

Fakultet
Filozofski fakultet

Mjesto
Zagreb

Datum
14.07.

Godina
1997

Stranica
135

Mentor
Dovedan, Zdravko

Neposredni voditelj
Dovedan, Zdravko

Ključne riječi
Formalni opis; prirodni i umjetni jezici; gramatika; problemi višeznačnosti i konteksta; sintaktička analiza; sistemi za obradu prirodnih jezika; prikaz znanja
(Formal description; natural and artificial languages; grammar; ambiguity and context problems; syntactic analysis; natural language processing systems; knowledge representation)

Sažetak
Iako je sve do nedavno većina sistema za obradu jezika pisana je za engleski jezik, danas ih je sve više namijenjenih i za druge jezike, što se osobito odnosi na programe namijenjene morfološkoj analizi jezika, strojnom prevođenju,učenju jezika ili generiranju tekstova. Iako su razvijene brojne tehnike za prikaz znanja (logika, mreže, proizvodna pravila, okviri, scenariji, mape, proceduralne metode itd.) zanje je nemoguće sistematizirati i grupirati. U prirodnome se jeziku koristi i pozadainsko van-jezično znanje, zbog čega ga je nemoguće eksplicitno prikazati i prilagoditi za računalnu obradu. Dok su za čvojeka neke informacije više ili manje važne, za računalo sve informacije imaju jednaku važnost. Prvi korak u analizi jezika čine morfološka i leksička obrada. Riječi se rastavljaju na manje jedinice i prikazuju u leksikonu, koji usko surađuje s parserom kako bi se izgradilo stablo za sintaktičku analizu. Osim brojnih tehnika za prikaz znanja, razvijene su i brojne gramatike i parseri. Svaka od navedenih gramatika temelji se na nekoj osnovi (transformacije, padežni odnosi, semantički motovirani razredi i dr.). Prve su se gramatike temeljile na sintaksi koja je realističnija, dok su se kasnije sve više približavali i semantičkoj obradi. Unatoč tome, niti jedna od postojećih gramatika nije dosegla stupanj savršenstva. Dobra gramatika ne mora biti pogodna za svaki podskup u jeziku. Sintaktička se razina usko isprepliće sa semantičkom, odnosno pragmatičkom. Značenje riječi i rečenice ovisi o konteksu, a ne predstavljamo samo ukupnost značenja iz leksikona. Naposlijetku, što znači "dobar" sistem za obradu jezika? Sistem se treba specijalizirati za određeno područje, čime se ograničava vokabular, uklanja višeznačnost, ograničava na određena vremena, smanjuje broj sintaktičkih konstrukcija itd. Čini se da na kraju vrijedi Goetheova misao "Ako želiš savladati beskonačno, uzmi konačno i savladaj ga sa svih strana".

Izvorni jezik
Hrvatski

Znanstvena područja
Informacijske i komunikacijske znanosti



POVEZANOST RADA


Projekt / tema
130740

Ustanove
Filozofski fakultet, Zagreb

Autor s matičnim brojem:
Sanja Seljan, (219255)