Strona: XV Międzynarodowa Konferencja - DepCoS 2020 / Politechnika Rzeszowska

XV Międzynarodowa Konferencja - DepCoS 2020

2020-07-04
, red.  Bartosz Kowal
http://depcos.pwr.edu.pl

W dniach 29.06 - 3.07 odbyła się międzynarodowa konferencja DepCos 2020.

We wtorek 30.06.2020 r. dr inż. Paweł Dymora wygłosił referat podczas 15-tej Międzynarodowej Konferencji - DepCoS 2020,  http://depcos.pwr.edu.pl/program/DepCoS-2020-program.pdf.  Tematem referatu był artykuł autorstwa: dra inż. Pawła Dymory i dr inż. Mirosława Mazurka zatytułowany: Assessment of selected techniques and methods detecting duplicates in a data warehouses.
Artykuł jest opublikowany i dostępny na stronach SpringerLink - https://link.springer.com/chapter/10.1007%2F978-3-030-48256-5_22.

P. Dymora, M. Mazurek, Performance Assessment of Selected Techniques and Methods Detecting Duplicates in Data Warehouses, Theory and Applications of Dependable Computer Systems. DepCoS-RELCOMEX 2020. Advances in Intelligent Systems and Computing, vol. 1173. Springer, Cham, 2020, 

Abstract:

A significant and current research problem, as well as a practical one, is the problem of deduplication in databases. The solution of this problem is applicable, e.g., in the context of the following situations in which are stored apparently different records, which actually refer to the same entity (objects, individuals, etc.) in the real world. In such cases, the purpose is to identify and reconcile such records or to eliminate duplication. The paper describes algorithms for finding duplicates and implements them in the developed data warehouse. Efficiency and effectiveness tests were also carried out for sample data contained in individual tables of the warehouse. The work aims to analyze the existing methodologies for detecting similarities and duplicates in data warehouses, to implement algorithms physically, and to test their effectiveness and efficiency. A large scale of data created by IoT devices leads to the consumption of communication bandwidth and disk space because the data is highly redundant. Therefore, correct deduplication of information is necessary to eliminate redundant data.

Powrót do listy aktualności

banner-v3.jpg

 

Nasze serwisy używają informacji zapisanych w plikach cookies. Korzystając z serwisu wyrażasz zgodę na używanie plików cookies zgodnie z aktualnymi ustawieniami przeglądarki, które możesz zmienić w dowolnej chwili. Więcej informacji odnośnie plików cookies.

Akceptuję