drukuj
icon icon

Kurs Data Science: algorytmy, techniki i narzędzia

icon

Proces szkoleniowy

Analiza potrzeb szkoleniowych

Jeśli masz życzenie dotyczące programu szkolenia, przeprowadzimy dla Ciebie analizę potrzeb szkoleniowych, która będzie wskazówką dla nas, na jakie aspekty programu położyć większy nacisk – tak, by program szkolenia spełniał konkretne potrzeby.

Program szkolenia

1. Podstawy statystyki i matematyki

 

  • praktyczne koncepcje statystyczne do analizy danych (testowanie hipotez, rozkłady prawdopodobieństwa),
  • podstawy algebry liniowej dla uczenia maszynowego z wykorzystaniem biblioteki NumPy,
  • case study: analiza rynku przy użyciu metod statystycznych.

 

2. Podstawy programowania w Pythonie

 

  • podstawy Pythona z naciskiem na biblioteki do nauki o danych (NumPy, Pandas),
  • struktury danych i algorytmy do efektywnego przetwarzania danych,
  • projekt: tworzenie zautomatyzowanego potoku danych.

 

3. Eksploracja danych (EDA)

 

  • czyszczenie i wstępne przetwarzanie danych za pomocą Pandas i NumPy,
  • zaawansowana wizualizacja z wykorzystaniem bibliotek Matplotlib, Seaborn i Plotly,
  • realny projekt: analiza zachowań klientów w e-commerce,
  • narzędzia: Jupyter Notebooks, Pandas Profiling.

 

4. Zaawansowane techniki EDA

  • przekształcanie danych,
  • tworzenie i interpretacja wykresów korelacji,
  • grupowanie i agregacja danych.

5. Przygotowanie danych do modelowania

  • normalizacja i standaryzacja danych,
  • kodowanie zmiennych kategorycznych,
  • podział na zbiór treningowy i testowy.

6. Wprowadzenie do uczenia maszynowego

  • rodzaje uczenia maszynowego:
    • nadzorowane,
    • nienadzorowane,
    • wzmacniające,
  • algorytmy nadzorowane:
    • regresja liniowa,
    • regresja logistyczna,
  • implementacja prostych modeli w Pythonie.

7. Ocena i walidacja modeli

  • metryki oceny modeli:
    • MAE, 
    • MSE,
    • RMSE,
    • accuracy,
    • precision,
    • recall,
    • F1-score,
  • techniki walidacji:
    • walidacja krzyżowa,
    • grid search,
  • unikanie przeuczenia:
    • regularizacja,
    • dropout.

8. Zaawansowane algorytmy uczenia maszynowego

  • drzewa decyzyjne, lasy losowe,
  • Support Vector Machines (SVM),
  • sieci neuronowe i wprowadzenie do deep learningu.

9. Uczenie nienadzorowane

 

  • analiza skupień:
    • k-means,
    • DBSCAN,
  • redukcja wymiarów:
    • PCA, 
    • t-SNE,
  • analiza koszykowa:
    • algorytm Apriori.

 

10. Praktyczne zastosowania Data Science

  • analiza sentymentu,
  • wykrywanie anomalii,
  • systemy rekomendacyjne.

11. Narzędzia i technologie w Data Science

 

  • technologie Big Data: Hadoop, Spark i obliczenia rozproszone,
  • platformy chmurowe: AWS SageMaker, Google AI Platform, Azure ML,
  • MLOps: Docker, Kubernetes, ML Flow oraz wdrażanie modeli,
  • projekt końcowy: rozwój kompleksowego potoku ML.

 

Opieka poszkoleniowa

W ramach opieki poszkoleniowej masz do wyboru jedną z dwóch możliwych form kontaktu z trenerem, w przeciągu 1 roku po zakończonym szkoleniu:

  • konsultację telefoniczną,
  • na 2 godzinne konsultacje online z trenerem.

Metody szkolenia

  • wykład,
  • mini-prezentacja,
  • praca warsztatowa z komputerem,
  • ćwiczenia i case study,
  • praca indywidualna z trenerem.

Certyfikat

  • certyfikat w języku polskim, numer Wpisu do Rejestru Instytucji Szkoleniowych 2.12/00238/2015,
  • certyfikat w języku angielskim na życzenie.