Informacje o szkoleniu

Główna korzyść– szybsza praca Twojego zespołu w przetwarzaniu danych
– umożliwienie przetwarzania dużej ilości danych tam, gdzie Excel nie wystarcza
Czas trwaniaa) połówki: 10 dni po 3 godz. 30 minut (z przerwami) lub
b) pełne dni: 5 dni po 7 godz. zegarowych (z przerwami)
Forma szkoleniawarsztatowa (70% ćwiczenia / 30% wykład)
Logistykaa) online lub
b) w siedzibie klienta lub innym wyznaczonym przez niego miejscu, w Polsce lub za granicą w obrębie Europy
Zapisyszkolenie zamknięte – indywidualne zamówienie i dopasowanie dla grupy
Wielkość grupydo 10 uczestników
Język szkoleniapolski, angielski lub oba naraz w ramach jednego zlecenia

Plan szkolenia

  1. Python Builtin Data Structures
    1. Lists
    2. Tuples
    3. Nested Structures
    4. Dictionaries
    5. List Comprehension
  2. Other Essential Python Concepts
    1. Python Functions
    2. Positional and Keyword Arguments
    3. Default Parameter Values
  3. Pandas Fundamentals
    1. Datasets
    2. Import and Export from CSV
    3. Import and Export from Databases and Fixed Width Format Files
    4. Essential Transformations (Transpose, Selecting Single or Multiple Rows and Columns, Accessing Index)
    5. Fundamental Data Statistics
    6. Quick Data Visualization
    7. Modifying DataFrame (Adding and Deleting Columns)
    8. Processing Missing Values
    9. Aggregations (Sum, Count, Mean, Std etc.)
    10. Filtering with Masks
    11. Filtering by Timestamps on Time Serieses
    12. Filtering on Index
    13. Advanced Filtering Conditions
    14. Split-Apply-Combine Pattern (aka Groupby)
  4. Accessing Data from REST APIs
    1. Wide vs Long Format
    2. HTTP Protocol
    3. REST Fundamentals
    4. Requests and Response Structure
    5. Postman for Experimentation
    6. requests Library
    7. Advanced Case Study on Real and Complex API (7 Endpoints)
    8. How to Deal with Pagination?
  5. Data Wrangling
    1. Renaming Columns
    2. Type Conversion
    3. Categorical Columns
    4. Sorting Data
    5. Sorting by Index
    6. Setting and Reseting Index
    7. Reindexing
    8. Vectorised Conditionals
    9. Appending Data
    10. Pivoting Data (Converting from Long to Wide Format)
    11. Unstacking Data (Advanced Pivoting)
    12. Melting Data (Converting from Wide to Long Format)
    13. Stacking Data (Advanced Melting)
  6. Advanced Data Processing
    1. Where Clause for Easier Filtering
    2. Joins
    3. Inner vs Left vs Right vs Outer Joins
    4. Joins on Index
    5. Z-Score for Easier Outlier Detection
    6. Ranking
    7. Percentage Change
    8. Binning
    9. Quantile Binning
    10. Clipping
    11. Thresholds
  7. Aggregations
    1. Applying an Operation on All Columns
    2. Rolling Window
    3. Rolling Window on Time Serieses
    4. Expanding Window
    5. Cumulative Sum
    6. Advanced Groupby
    7. Groupby by Timestamp on Time Serieses
    8. Groupby on Multiple Columns
    9. Aggregating Using Different Functions
    10. Pivot Tables
    11. Cross Tabs
    12. Cross Tabs with Margins
  8. Time Series Specific Operations
    1. Time-Based Selection
    2. Aggregation on Time Serieses
    3. Shifting and Lagging
    4. Differenced Data
    5. Resampling
    6. Working with OHLC (Open-High-Low-Close) Data
    7. Upsampling
    8. Merging Datasets with Different Timestamps
  9. Data Visualisation with matplotlib
    1. Matplotlib Library
    2. Line and Point Plots
    3. Visualising Data from Rolling Windows
    4. Plot Components
    5. Plotting Multiple Serieses
    6. Matplotlib Integration with Pandas
    7. Subplots
    8. Hexbins
    9. Correlation Matrix
    10. Histograms
    11. Kernel Density Estimation
    12. Cumulative Distribution Function
  10. Advanced Data Visualisation
    1. Boxplots
    2. Groupby on a Single Plot
    3. Bar Charts
    4. Bar Charts with Groups of Columns
    5. Stacked Bar Charts
    6. Normalised Stacked Bar Charts
    7. Scatter Matrixes
    8. Lag Plots
    9. Autocorrelation Plots
  11. BigData & Pandas
    1. dask Library
    2. dask as a Task Scheduler
    3. Local Computational Cluster
    4. dask.DataFrame
    5. Alternatives

Korzyści dla zamawiającego

Jako zamawiający szkolenie otrzymasz:

  1. Analizę potrzeb i wsparcie w doborze szkolenia w postaci rozmowy telefonicznej ze sponsorem szkolenia, HRem, team leadem lub/i uczestnikami szkolenia. Dodatkowo, analiza potrzeb uczestników na samym początku szkolenia pozwala na jeszcze lepsze wykorzystanie czasu.
  2. Możliwość i wsparcie w dostosowaniu szkolenia pod Twoje potrzeby.
  3. Gwarancję poprowadzenia szkolenia przez eksperta, który współpracował m.in. z Google.
  4. Ewaluację szkolenia przez uczestników w postaci elektronicznej ankiety pod koniec ostatniego dnia szkolenia. Wyniki są przesyłane zainteresowanym osobom (najczęściej sponsor + HR).
  5. Prostą komunikację – masz bezpośredni dostęp telefoniczny i mailowy do trenera.
  6. Prosty proces zakupowy – wystarczy jeden telefon lub mail, abyś otrzymał(a) ofertę i aby zarezerwować dla Ciebie termin. Terminy są na wyłączność, nie praktykujemy overbookingu. Wysłanie Purchase Order potwierdza zamówienie.

Klienci, po zobaczeniu efektów tego szkolenia, bardzo często decydują się na inne szkolenia, także dedykowane szkolenia, przygotowywane specjalnie dla nich.

Korzyści dla uczestników

Dodatkowo, w ramach szkolenia uczestnicy otrzymają:

  1. Wsparcie poszkoleniowe dla uczestników i sponsora szkolenia, mailowe i telefoniczne.
  2. Instrukcję przygotowania laptopów dla uczestników i, w razie potrzeby, wsparcie telefoniczne, mailowe i Skypowe (chociaż jeszcze nigdy nie było takiej potrzeby). Dzięki temu oszczędzamy czas na początku szkolenia i ruszamy od razu z nauką.
  3. Materiały szkoleniowe zawierające fragmenty kodu, komentarze, ćwiczenia i ich wzorcowe rozwiązania. Materiały są w formie pojedynczej strony internetowej, dzięki czemu uczestnikom jest bardzo łatwo wyszukać interesujący ich fragment. Materiały są dostępne także po szkoleniu. Uczestnicy mogą je także pobrać, aby mieć do nich dostęp offline. Forma materiałów pozwala na dostosowywanie materiałów na bieżąco do potrzeb uczestników, w przeciwieństwie do materiałów drukowanych, które nie pozwalają na np. dodanie komentarzy zasugerowanych przez uczestników.
  4. Środowisko gotowe do wykorzystania po szkoleniu. Nie używamy wirtualnych maszyn, instalujemy wszystko na laptopach uczestników.
  5. Nagranie szkolenia (w przypadku szkoleń online)

Opinie o trenerze

Krzysztof Gębal

Very inspiring training. I really appreciate the way Chris managed to walk us through the complex world of machine learning using Python. Good course materials updated real time. Highly recommend.

Krzysztof Gębal
Finance Director at DNB Bank Polska S.A.

Arkadiusz Baraniecki

Well prepared training and reasonably passed knowledge, thanks to which we develop better services.

Arkadiusz Baraniecki
Infrastructure Team Manager at allegro.pl

Nicolas Leveroni

Chris recently taught a four day class on Machine Learning with Python four our team. The class was very good with the right balance of theory and practice. I cannot think of a better way to give a four day class about such an extensive topic.

Nicolas Leveroni
Head of Krakow Product Control Analytics at HSBC

Więcej referencji znajdziesz tutaj.