Strona: XV Międzynarodowa Konferencja - DepCoS 2020 / Politechnika Rzeszowska

XV Międzynarodowa Konferencja - DepCoS 2020

2020-07-04
, red.  Bartosz Kowal
http://depcos.pwr.edu.pl

W dniach 29.06 - 3.07 odbyła się międzynarodowa konferencja DepCos 2020.

We wtorek 30.06.2020 r. dr inż. Paweł Dymora wygłosił referat podczas 15-tej Międzynarodowej Konferencji - DepCoS 2020,  http://depcos.pwr.edu.pl/program/DepCoS-2020-program.pdf.  Tematem referatu był artykuł autorstwa: dra inż. Pawła Dymory i dr inż. Mirosława Mazurka zatytułowany: Assessment of selected techniques and methods detecting duplicates in a data warehouses.
Artykuł jest opublikowany i dostępny na stronach SpringerLink - https://link.springer.com/chapter/10.1007%2F978-3-030-48256-5_22.

P. Dymora, M. Mazurek, Performance Assessment of Selected Techniques and Methods Detecting Duplicates in Data Warehouses, Theory and Applications of Dependable Computer Systems. DepCoS-RELCOMEX 2020. Advances in Intelligent Systems and Computing, vol. 1173. Springer, Cham, 2020, 

Abstrakt:

Istotnym i aktualnym problemem badawczym, a także praktycznym, jest problem deduplikacji w bazach danych. Rozwiązanie tego problemu ma zastosowanie np. w kontekście następujących sytuacji, w których przechowywane są pozornie różne rekordy, które w rzeczywistości odnoszą się do tego samego bytu (obiektów, osób itp.) w świecie rzeczywistym. W takich przypadkach celem jest identyfikacja i uzgodnienie takich rekordów lub wyeliminowanie duplikacji. W artykule opisano algorytmy wyszukiwania duplikatów i zaimplementowano je w opracowanym magazynie danych. Przeprowadzono również testy wydajności i skuteczności dla przykładowych danych zawartych w poszczególnych tabelach magazynu. Praca ma na celu analizę istniejących metodologii wykrywania podobieństw i duplikatów w magazynach danych, fizyczną implementację algorytmów oraz przetestowanie ich skuteczności i wydajności. Duża skala danych tworzonych przez urządzenia IoT prowadzi do zużycia pasma komunikacyjnego i przestrzeni dyskowej, ponieważ dane są wysoce redundantne. Dlatego też konieczna jest prawidłowa deduplikacja informacji w celu wyeliminowania danych redundantnych.

Powrót do listy aktualności

Baner dolny z logami

 

Nasze serwisy używają informacji zapisanych w plikach cookies. Korzystając z serwisu wyrażasz zgodę na używanie plików cookies zgodnie z aktualnymi ustawieniami przeglądarki, które możesz zmienić w dowolnej chwili. Więcej informacji odnośnie plików cookies.

Akceptuję