potrzeby w zakresie analizy sporych zbiorów danych i wydobywania z nich praktycznych informacji stale rosną. Spośród przystępnych narzędzi asygnowanych do tych zastosowań istotnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python.
Apache Spark świetnie się nadaje do analizy pokaźnych zbiorów danych, a PySpark efektywnie upraszcza integrację Sparka ze specjalistycznymi narzędziami PyData. Żeby jednak można było w pełni skorzystać z tych możliwości, niezbędne jest zrozumienie interakcji pomiędzy algorytmami, zbiorami informacji i wzorcami użytkowanymi w analizie informacji.
Oto funkcjonalny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach informacji. Omówiono w nim zasady rozwiązywania problemów analitycznych przy pomocy interfejsu PySpark, z użyciem korzystnych praktyk programowania w systemie Spark.
Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania informacji, takich jak klasyfikacja, grupowanie, przefiltrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach.
Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest również szereg rzeczywistych przykładów pokaźnych zbiorów informacji i ich zaawansowanej analizy. Dzięki książce poznasz: model programowania w ekosystemie Spark podstawowe metody użytkowane w nauce o danych pełne implementacje analiz dużych publicznych zbiorów danych potężne przypadki wykorzystania narzędzi uczenia maszynowego kod, któryprzypasujesz do swych potrzeb PySpark: systemowa odpowiedź na problemy inżyniera informacji!
Tytuł innowacyjna analiza danych w PySpark Autor praca zbiorowa Wydawnictwo Helion EAN 9788383220697 ISBN 9788383220697 Kategoria Literatura, Informatyka ilość stron 192 Rok wydania 2023 Oprawa broszurowa