@misc{Małowiecki_Andrzej_Metody_2023, author={Małowiecki, Andrzej}, contributor={Dudycz, Helena. Redaktor}, identifier={DOI: 10.15611/2023.81.7.08}, year={2023}, rights={Pewne prawa zastrzeżone na rzecz Autorów i Wydawcy}, publisher={Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu}, description={Wrocław: Wydawnictwo Uniwersytetu Ekonomicznego we Wrocławiu, 2023, s. 106-119}, language={pol}, abstract={Nierówność danych (ang. data imbalance) jest jednym z najpowszechniejszych problemów przy zadaniu klasyfikacji. W uczeniu maszynowym próbka danych ma stanowić wiarygodne odzwierciedlenie całości populacji. Jednak równie istotny jest fakt, żeby była zbudowana w sposób, który zapewni modelowi najlepsze warunki w procesie uczenia. Znalezienie równowagi między tymi dwoma aspektami stanowi jedno z wyzwań współczesnego data science. Celem tego artykułu jest sprawdzenie skuteczności różnych metod rozwiązania problemu nierównowagi danych. W tym celu stworzono kilka modeli klasyfikacji binarnej korzystających ze zbioru danych dotyczących oszustw związanych z kartami kredytowymi. Wykorzystano w nich różne sposoby rozwiązania problemu nierównowagi danych w celu porównania skuteczności klasyfikacji każdego z nich. Została do tego użyta autorska miara skuteczności wykorzystująca wskaźnik F1 modelu oraz czas wykonania kodu.}, title={Metody resamplingu danych w rozwiązaniu problemu nierównowagi danych przy wykrywaniu oszustw związanych z kartami kredytowymi}, type={rozdział}, keywords={resampling, nierównowaga danych, oszustwa związane z kartami kredytowymi, data imbalance, credit card fraud}, }