Przetwarzanie obfitych ilości danych daje wiedzę, która leży u podstaw widocznych decyzji podejmowanych przez organizację. Pozwala to na uzyskiwanie nieprzeciętnych efektów: techniki wydobywania wiedzy z danych stają się coraz bardziej wyrafinowane. Podstawowym warunkiem sukcesu jest uzyskanie adekwatnej jakości danych. Zastosowanie niespójnych i niepełnych danych prowadzi do podejmowania błędnych decyzji. Wynikiem mogą być straty finansowe, stwarzanie solidnych zagrożeń czy uszczerbek na wizerunku. A zatem oczyszczanie jest wyjątkowo ważną częścią analizy informacji.
Ta książka jest ergonomicznym zbiorem gotowych do użycia receptur, podanych tak, żeby maksymalnie ułatwić proces przygotowania danych do analizy. Omówiono tu takie kwestie dotyczące danych jak importowanie, ocena ich jakości, uzupełnianie braków, porządkowanie i agregacja, a także przekształcanie. Poza zwięzłym omówieniem tych zadań zaprezentowano najskuteczniejsze techniki ich wykonywania za pomocą różnorodnych narzędzi: Pandas, NumPy, Matplotlib czy SciPy. W ramach każdej receptury wyjaśniono skutki podjętych działań. Cennym uzupełnieniem jest pakiet funkcji i klas zdefiniowanych poprzez użytkownika, które służą do automatyzacji oczyszczania danych. Pozwalają na one także dostrojenie cyklu do konkretnych potrzeb.
W książce odszukasz receptury, dzięki którym: