@misc{Migdał-Najman_Kamila_Profilowanie,_2018, author={Migdał-Najman, Kamila and Najman, Krzysztof}, identifier={DOI: 10.15611/pn.2018.508.15}, year={2018}, rights={Pewne prawa zastrzeżone na rzecz Autorów i Wydawcy}, publisher={Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu}, description={Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu = Research Papers of Wrocław University of Economics, 2018, Nr 508, s. 146-156}, language={pol}, abstract={Zbiory Big Data oferują dostęp do niemal nieograniczonej liczby danych, dając nadzieję na szybszy, tańszy, bardziej precyzyjny i wszechstronny opis świata. Jednocześnie w takich zbiorach poza danymi o odpowiedniej jakości (clear data) znaczny udział mają dane nieprawdziwe, nieaktualne, zaszumione, często zwielokrotnione, niepełne lub błędne (dirty data), a także dane o nieznanej jakości czy użyteczności (dark data). Znaczący udział dirty i dark data ma szereg negatywnych konsekwencji w analizie zbioru Big Data. Celem prezentowanych badań jest przegląd i systemowe ujęcie procedur minimalizowania negatywnych efektów dirty data w analizie Big Data. W konstrukcji systemu oczyszczania zbioru danych uwzględniono najważniejsze procedury profilowania (profiling data), oczyszczania (cleansing data) i zapobiegania (defect prevention) powstawaniu dirty data w procesie budowy i analizy zbioru Big Data}, title={Profilowanie, oczyszczanie i zapobieganie powstawaniu dirty data}, type={artykuł}, keywords={big data, dirty data, profilowanie danych, oczyszczanie danych, zapobieganie powstawaniu zanieczyszczeń w danych, Big Data, profiling data, data cleansing, defect prevention}, }