@misc{Migdał-Najman_Kamila_Profilowanie,_2018,
 author={Migdał-Najman, Kamila and Najman, Krzysztof},
 identifier={DOI: 10.15611/pn.2018.508.15},
 year={2018},
 rights={Pewne prawa zastrzeżone na rzecz Autorów i Wydawcy},
 publisher={Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu},
 description={Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu = Research Papers of Wrocław University of Economics, 2018, Nr 508, s. 146-156},
 language={pol},
 abstract={Zbiory Big Data oferują dostęp do niemal nieograniczonej liczby danych, dając nadzieję na szybszy, tańszy, bardziej precyzyjny i wszechstronny opis świata. Jednocześnie w takich zbiorach poza danymi o odpowiedniej jakości (clear data) znaczny udział mają dane nieprawdziwe, nieaktualne, zaszumione, często zwielokrotnione, niepełne lub błędne (dirty data), a także dane o nieznanej jakości czy użyteczności (dark data). Znaczący udział dirty i dark data ma szereg negatywnych konsekwencji w analizie zbioru Big Data. Celem prezentowanych badań jest przegląd i systemowe ujęcie procedur minimalizowania negatywnych efektów dirty data w analizie Big Data. W konstrukcji systemu oczyszczania zbioru danych uwzględniono najważniejsze procedury profilowania (profiling data), oczyszczania (cleansing data) i zapobiegania (defect prevention) powstawaniu dirty data w procesie budowy i analizy zbioru Big Data},
 title={Profilowanie, oczyszczanie i zapobieganie powstawaniu dirty data},
 type={artykuł},
 keywords={big data, dirty data, profilowanie danych, oczyszczanie danych, zapobieganie powstawaniu zanieczyszczeń w danych, Big Data, profiling data, data cleansing, defect prevention},
}