Wprowadzenie do data science w języku Python - Pandas

Efektywne wykorzystanie narzędzi do analizy danych i automatyzacji procesów analitycznych!

4.75 (230 reviews)
Udemy
platform
Polski
language
Programming Languages
category
1,718
students
12.5 hours
content
Jan 2024
last update
$19.99
regular price

What you will learn

instalacja i konfiguracja środowiska

wprowadzenie do Pandas

manipulacja danymi

czyszczenie danych

analiza i wizualizacja danych

łączenie danych

importowanie i exportowanie danych (csv, excel, txt, html, sas7bdat)

operacje na strukturach danych (grupowanie, agregacja, tabele przestawne)

porównanie do języka SQL

3 x Case Study (Amazon Reviews, Google Apps Data, NASDAQ)

Description

Kurs "Wprowadzenie do data science w języku Python - Pandas" to kompletne źródło wiedzy dla osób, które chcą rozpocząć swoją podróż w świecie analizy danych i nauki o danych (data science). W trakcie kursu uczestnicy nauczą się korzystać z jednej z najważniejszych bibliotek Pythona dla analizy danych - Pandas.

Kurs jest podzielony na kilka modułów, które stopniowo wprowadzają uczestników w świat analizy danych. Pierwszy moduł skupia się na podstawach Pythona i Pandas, takich jak instalacja i konfiguracja środowiska. Kolejne moduły omawiają podstawowe operacje na danych przy użyciu Pandas. Następnie uczestnicy poznają bardziej zaawansowane funkcje Pandas, takie jak przekształcanie i czyszczenie danych, obsługa danych tekstowych, a także łączenie i grupowanie danych.

W kolejnych modułach kursu uczestnicy nauczą się tworzyć różne typy wykresów i wizualizacji danych, dzięki którym będą mogli prezentować wyniki swojej pracy w sposób atrakcyjny i zrozumiały dla innych.

Pod koniec kursu, uczestnicy będą mieli możliwość zastosowania zdobytych umiejętności w praktyce, pracując nad prawdziwymi zestawami danych w trzech różnych przypadkach użycia (case studies).

Kurs "Wprowadzenie do data science w języku Python - Pandas" jest doskonałym punktem wyjścia dla wszystkich, którzy chcą zrozumieć, jak przetwarzać i analizować duże ilości danych, a następnie wykorzystywać te dane do podejmowania decyzji biznesowych. Bez względu na to, czy planujesz karierę jako analityk danych, inżynier danych, czy data scientist, ten kurs da Ci solidne podstawy, na których będziesz mógł zbudować swoją przyszłą karierę.


Pandas: Twój mocny sprzymierzeniec w analizie danych!

Biblioteka Pandas to potężne narzędzie do manipulacji i analizy danych w języku Python. Pandas zapewnia łatwy w użyciu i elastyczny interfejs, który umożliwia efektywną pracę z różnymi rodzajami danych, takimi jak tabele, arkusze kalkulacyjne, pliki CSV, bazy danych itp.


Kilka kluczowych cech biblioteki Pandas:

  1. Struktury danych: Pandas wprowadza dwie główne struktury danych: Series i DataFrame. Series to jednowymiarowa struktura danych podobna do tablicy lub kolumny w arkuszu kalkulacyjnym. DataFrame to dwuwymiarowa struktura danych, która przypomina tabelę bazy danych, składającą się z wierszy i kolumn.

  2. Wczytywanie danych: Pandas oferuje funkcje do łatwego wczytywania danych z różnych formatów, takich jak pliki CSV, Excel, bazy danych SQL, JSON i wiele innych. Można również wczytać dane bezpośrednio z Internetu.

  3. Indeksowanie i filtrowanie: Pandas umożliwia indeksowanie i filtrowanie danych na podstawie różnych kryteriów. Można wykonywać operacje takie jak wybieranie kolumn i wierszy na podstawie ich nazw, wartości lub warunków logicznych.

  4. Operacje na danych: Pandas dostarcza szereg funkcji do przetwarzania i transformacji danych. Można wykonywać operacje matematyczne, statystyczne, łączenia, grupowania, sortowania, usuwania duplikatów itp. na danych.

  5. Obsługa brakujących danych: Pandas zapewnia mechanizmy do obsługi brakujących danych. Można z łatwością sprawdzać, usuwać lub zastępować brakujące wartości w danych.

  6. Analiza danych: Pandas oferuje wiele funkcji do analizy danych. Można obliczać statystyki opisowe, wykonywać agregacje danych, grupować dane, stosować funkcje do całych kolumn itp. Biblioteka umożliwia również wykonywanie zaawansowanych operacji na danych, takich jak łączenie, łączenie, transformacja i wiele innych.

  7. Wizualizacja danych: Pandas integruje się z innymi bibliotekami, takimi jak Matplotlib i Seaborn, co umożliwia wizualizację danych w formie wykresów, histogramów, diagramów punktowych i innych.


Biblioteka Pandas jest niezwykle popularna w społeczności analizy danych w języku Python i jest szeroko stosowana w dziedzinach takich jak data sicence, finanse, ekonomia, badania społeczne, bioinformatyka i wiele innych.

Content

Wstęp

Wskazówki - jak korzystać z kursu?
Czym jest data science?
Wybór odpowiedniego środowiska programistycznego
Zarządzanie Środowiskami
Korzystanie z Dokumentacji
Github - Repozytorium Kursu

Instalacja środowiska programistycznego

Instalacja oprogramowania Anaconda (Spyder, Jupyter Notebook) Windows 10
Instalacja oprogramowania Anaconda (Spyder, Jupyter Notebook) Linux Ubuntu
Conda Cheat Sheet
Pandas Cheat Sheet

Struktury Danych - Series

Tworzenie obiektów typu Series cz.1
Tworzenie obiektów typu Series cz.2
Podstawowe operacje na obiekcie Series cz.1
Podstawowe operacje na obiekcie Series cz.2
Agregacja danych
Metoda apply()
Importowanie/Eksportowanie danych
Case Study I - Amazon
Case Study II - WIG20

Struktury Danych - DataFrame

Tworzenie obiektów typu DataFrame
Selekcja Kolumn
Wycinanie Danych
Obliczanie nowych kolumn
Maska Logiczna
Szeregi Czasowe
Operacje Arytmetyczne
Próbkowanie Danych
Usuwanie Duplikatów
Case Study - DataFrame ze schowka

Wycinanie Danych

Metoda loc
Metoda loc - Wycinanie Dat
Metoda iloc
Metoda Kropki
Metoda where
Metoda query
Bouns - index

Brakujące Wartości

Filtrowanie wartości brakujących
Wypełnianie wartości brakujących
Usuwanie wartości brakujących

Import Danych

Importowanie pliku .csv
Importowanie pliku .tsv
Importowanie pliku Excel .xlsx
Importowanie pliku .html - lokalnie i ze strony internetowej
Importowanie pliku SAS .sas7bdat

Łączenie Danych - Merge, Join, Concatenate

Metoda concat()
Metod append()
Metoda merge()
Metoda merge() - łącznie po kluczach
Metoda join()

Praca z danymi tekstowymi

Przetwarzanie danych tekstowych
Analiza Hashtagów
Bonus - Regex

Wizualizacje Danych

Wykres liniowy
Wykres słupkowy
Histogram

Obliczenia

Zmiany Procentowe
Macierz Korelacji
Rankingowanie
Średnia Ruchoma - Rolling Window

Szeregi Czasowe

Strefy Czasowe
DataReader
Bike Sharing

Tabele Przestawne

Wprowadzenie
Metro Data
Tips Data

Porównanie do języka SQL

SELECT
AND, OR
IS NULL, IS NOT NULL
GROUP BY
ORDER BY, TOP, BOTTOM

Case Study - Amazon Reviews

Wstępne Przetworzenie Danych
Analiza Customer Reviews

Case Study - Google Apps

Analiza Google Apps Data

Case Study - Spółki NASDAQ

Analiza Notowań - Spółki NASDAQ

BONUS: Kupony na inne kursy

Grupa na Facebook'u
Recenzja
Bonus

Screenshots

Wprowadzenie do data science w języku Python - Pandas - Screenshot_01Wprowadzenie do data science w języku Python - Pandas - Screenshot_02Wprowadzenie do data science w języku Python - Pandas - Screenshot_03Wprowadzenie do data science w języku Python - Pandas - Screenshot_04

Reviews

Piotr
April 19, 2023
Gdy chcę oglądać kurs z Udemy na dużym telewizorze poprzez Apple TV, na które wysyłam film z iPhone 12 zamiast filmu widzę jeden obraz, który wcale się nie zmienia chociaż słyszę głos wykładowcy. Zdarza to sie bardzo często, może w 80% prób oglądania kursow w ten sposób
Maksym
April 10, 2023
Super, ale jedynie czego brakowało, gdy były wpisane jakieś wartości od ręki, a tego nie było podano nigdzie jako plik tekstowy, więc musiałem przed 9minutową lekcją przepisywać 15-20 minut wartości
Tiss27
December 11, 2022
Świetny kurs, prowadzi krok po kroku w możliwości Pandas. Dużo przykładów ze świata forex co dla mnie tez na duży plus. Zresztą jest to kolejny chyba 5 kurs zakupiony od Pana Pawła co mówi samo przez się. Bardzo podoba mi się poukładana ścieżka edukacji, nie muszę się zastanawiać nad kolejnymi etapami nauki. Oceniam 5/5
Agnieszka
August 30, 2022
Świetny kurs! Zadania wykonywałam równolegle, przez co wiedza się utrwaliła. Dla mnie to jest świetne wprowadzenie do data science!
Paweł
February 7, 2022
Bardzo polecam, jak dla mnie-laika, świetne prowadzanie, wiele przykładów, powroty do ciekawych kwestii i problemów.
Wiktoria
January 2, 2022
kurs bardzo fajny, konkretny i na temat, duzo przydatnych rzeczy, przedstawionych w bardzo prosty sposob. Dla mnie bylo troche za dzuo wykresow, wiecej bym sie pobawilam w relacji one-to-one, czy one-to many, poniewaz moja praca na excelu przewazniej sklada sie na vlookupach. Ale w innych dziedzinach ta wiedza bedzie bardzo przydatna
Kopalnik
December 16, 2021
Bardzo dobry kurs, który pozwala na dobry początek nauki w Data Science :-) Tylko zachęca do dalszej nauki i pogłębienia wiedzy !!!
Wierem
December 14, 2021
Świetny kurs dla osób zaczynających pracę z tą najpopularniejszą w DataScience biblioteką. W czytelny sposób przedstawione przykłady, nie znalazłem żadnego błędu i jestem bardzo zadowolony z zakupu.
Michał
October 24, 2021
Świetny kurs na wprowadzenie do biblioteki pandas i jednoczesne liźnięcie zagadnień związanych z data science. Osobiście nie zamierzam iść w tym kierunku, więc skorzystałem tylko z wprowadzenia do pandy i jestem bardzo zadowolony, ale uważam, że dla osoby szukającej wyzwań w obszarze DS ten kurs będzie świetny, żeby rozpocząć przygodę :)
Artur
October 20, 2021
Dobry kurs, ale przykłady z rynku finansowego dla osoby spoza tego rynku po kilkunastu odcinkach są męczące, dlatego nie dałem 100%. Jednak dla osoby interesującej się rynkiem finansowym, giełdą będzie to doskonały wybór.
Artur
July 26, 2021
Dużo konkretnej wiedzy, sporo opcji, rozwiązań. Widać, że autor ma ogromną wiedzę na temat statystyki i przetwarzania danych, ale momentami wydaje się trochę chaotyczne i czasami gubiłem wątek.
Wojciech
April 16, 2021
Bardzo dobry kurs, bez dwóch zdań. Pół oceny obcinam za to intro... Po pewnym czasie jest ono mocno męczące.
Dawid
April 11, 2021
Temat wyłożony bardzo profesjonalnie. Podoba mi się rosnący poziom trudności wraz z trwaniem kursu. Polecam!
Sylwia
April 6, 2021
Na kursie poruszanych jest wiele przykładów i szczegółów, które mogą się przydać w pracy Data Scientist. Polecam bardzo!
Artur
May 15, 2020
Świetny kurs! Dla mnie to było odświeżenie wiedzy z Pandas. Widać, że autor ma praktykę w stosowaniu, bo uczy przydatnych narzędzi, które się wykorzystuje w praktyce czyszczenia danych ich wstępnej analizy i przygotowania pod modele uczenia maszynowego. Tłumaczy w bardzo przystępny sposób, każdy temat. Dodatkową wisienką na torcie jest korzystanie z danych giełdowych. Skorzystam również z pozostałych kursów.

Charts

Price

Wprowadzenie do data science w języku Python - Pandas - Price chart

Rating

Wprowadzenie do data science w języku Python - Pandas - Ratings chart

Enrollment distribution

Wprowadzenie do data science w języku Python - Pandas - Distribution chart

Related Topics

2362918
udemy ID
5/11/2019
course created date
10/29/2019
course indexed date
Bot
course submited by