Using Ontologies for Measuring Semantic Similarity in Data Warehouse Schema Matching Process

Banek, Marko; Vrdoljak, Boris; Tjoa, A Min

izvor podataka: crosbi !

Using Ontologies for Measuring Semantic Similarity in Data Warehouse Schema Matching Process (CROSBI ID 529451)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Banek, Marko ; Vrdoljak, Boris ; Tjoa, A Min Using Ontologies for Measuring Semantic Similarity in Data Warehouse Schema Matching Process // Proceedings of the 9th International Conference on Telecommunications (ConTEL 2007) / Car, Željka ; Kušek, Mario (ur.). Zagreb: Fakultet elektrotehnike i računarstva Sveučilišta u Zagrebu, 2007. str. 227-234-x

Podaci o odgovornosti

Autori

Banek, Marko ; Vrdoljak, Boris ; Tjoa, A Min

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

Using Ontologies for Measuring Semantic Similarity in Data Warehouse Schema Matching Process

Sažetak

The key step of data warehouse integration is the construction of mappings that link mutually compatible components of data warehouse schemas: dimensions, aggregation levels, attributes and facts. In order to perform the integration process in a semi-automated manner, we must define similarity functions that compare the names and substructures of those structure elements. During the last decade, many approaches to measuring semantic similarity between lexical terms have been introduced, most of them based either on the taxonomy of WordNet, a large lexical and thesaurus database of English language, or on the previously measured language statistic corpus. This paper presents a novel semantic similarity technique, based on edge counting, which combines WordNet and domain ontologies written in OWL and is implemented as a Java software. Ontologies are designed by domain experts and thus provide a better and more trustworthy source for calculating similarity, and the fact that the terms are related closer than in WordNet results in a higher similarity.

Ključne riječi

semantic similarity; data warehouse; data warehouse integration; schema matching; ontology; OWL; WordNet

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

227-234-x.

Godina izdavanja

2007.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

Proceedings of the 9th International Conference on Telecommunications (ConTEL 2007)

Urednici

Car, Željka ; Kušek, Mario

Izdavač

Zagreb: Fakultet elektrotehnike i računarstva Sveučilišta u Zagrebu

ISBN

978-953-184-110-8

Podaci o skupu

Skup

9th International Conference on Telecommunications : ConTEL 2007

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

13.06.2007-15.06.2007

Mjesto održavanja skupa

Zagreb, Hrvatska

Povezanost rada

Povezane osobe

Marko Banek (autor/i)

Boris Vrdoljak (autor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Povezani projekti

Semantička integracija heterogenih izvorišta podataka (rezultat rada na projektu)

Umrežena ekonomija (rezultat rada na projektu)

Područje

Računarstvo