A Survey of Word Embedding Algorithms for Textual Data Information Extraction

Vušak, Eugen; Kužina, Vjeko; Jović, Alan

izvor podataka: crosbi !

A Survey of Word Embedding Algorithms for Textual Data Information Extraction (CROSBI ID 707891)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Vušak, Eugen ; Kužina, Vjeko ; Jović, Alan A Survey of Word Embedding Algorithms for Textual Data Information Extraction // MIPRO / Skala, Karolj (ur.). 2021. str. 207-212

Podaci o odgovornosti

Autori

Vušak, Eugen ; Kužina, Vjeko ; Jović, Alan

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

A Survey of Word Embedding Algorithms for Textual Data Information Extraction

Sažetak

Unlike other popular data types, such as images, textual data cannot be easily converted into a numerical form that machine learning algorithms can process. Therefore, text must be embedded into a vector space using embedding algorithms. These algorithms attempt to encapsulate as much information as possible from the text into a resulting vector space. Natural language is complex and contains numerous layers of information. Information can be obtained from a sequence of characters or subword units that make up the word. It can also be derived from the context in which a word occurs. For this reason, a variety of word embedding algorithms have been developed over time, which use different pieces of information in different ways. In this paper, the currently available word embedding algorithms are described and it is shown what kind of information these algorithms use. After analyzing these algorithms, we discuss how it can be advantageous to use combinations of different types of information in different research and application areas.

Ključne riječi

word embedding ; textual data ; natural language processing ; word space ; text mining

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

207-212.

Godina izdavanja

2021.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

MIPRO 2021 Proceedings

Urednici

Skala, Karolj

Izdavač

Rijeka: Hrvatska udruga za informacijsku i komunikacijsku tehnologiju, elektroniku i mikroelektroniku - MIPRO

ISSN

1847-3938

e-ISSN

1847-3946

Podaci o skupu

Skup

MIPRO 2021

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

27.09.2021-01.10.2021

Mjesto održavanja skupa

Opatija, Hrvatska

Povezanost rada

Povezane osobe

Vjeko Kužina (autor/i)

Alan Jović (autor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Područje

Računarstvo