drukuj
icon icon

Kurs RAG w praktyce - nowoczesne techniki wydobywania i generowania danych

icon

Proces szkoleniowy

Analiza potrzeb szkoleniowych

Jeśli masz życzenie dotyczące programu szkolenia, przeprowadzimy dla Ciebie analizę potrzeb szkoleniowych, która będzie wskazówką dla nas, na jakie aspekty programu położyć większy nacisk – tak, by program szkolenia spełniał konkretne potrzeby.

Program szkolenia

1. Czym jest Retrieval-Augmented Generation?

  • definicja i podstawowe założenia,
  • RAG jako połączenie wyszukiwania i generowania tekstu.

2. Kluczowe różnice między klasycznym generowaniem tekstu a podejściem RAG

  • modele generatywne bez dostępu do kontekstu,
  • wykorzystanie zewnętrznych źródeł wiedzy w RAG.

3. Zastosowania RAG w AI i NLP

  • wsparcie dla chatbotów i asystentów AI,
  • automatyczne podsumowywanie i wyszukiwanie informacji.

4. Przykłady zastosowań w realnym świecie

  • przykłady wdrożeń w firmach technologicznych,
  • wpływ RAG na poprawę jakości generowanych treści.

5. Przegląd działania modelu RAG

  • podstawowa architektura RAG,
  • kluczowe komponenty systemu.

6. Połączenie retrievera (np. FAISS, Chroma) z generatorami (np. GPT, LLama, Claude)

  • jak działa wyszukiwanie wektorowe?
  • jak generator wykorzystuje znalezione informacje?

7. Struktura przepływu danych w systemie RAG

  • proces wyszukiwania, przetwarzania i generowania odpowiedzi,
  • jak dane są przechowywane i przetwarzane?

8. Jakie bazy wiedzy można wykorzystywać?

  • wektorowe bazy danych,
  • dokumenty, pliki, API jako źródła wiedzy.

9. Wybór i konfiguracja retrievera (wektorowe bazy danych: FAISS, Pinecone, Weaviate)

  • jak działa wyszukiwanie wektorowe?
  • wybór odpowiedniej technologii do konkretnego przypadku.

10. Integracja z modelami generatywnymi (OpenAI, Mistral, LLama, Claude)

  • jakie modele najlepiej współpracują z RAG?
  • jak dostosować model do konkretnego zastosowania?

11. Wybór strategii indeksowania i wyszukiwania danych

  • jakie strategie indeksowania poprawiają wydajność?
  • jak unikać duplikatów i błędnych wyników?

12. Praktyczne implementacje w Pythonie (LangChain, LLamaIndex)

  • przykładowy kod do stworzenia systemu RAG,
  • testowanie i debugowanie implementacji.

13. Strategie poprawy dokładności wyników

  • jak dobierać odpowiednie dokumenty do wyszukiwania?
  • jak kontrolować trafność wyników?

14. Różne techniki filtrowania i rankingowania wyników

  • wykorzystanie scoringu dokumentów,
  • dynamiczne dostosowanie kryteriów wyszukiwania.

15. Pre-processing i embedding dokumentów

  • jakie przekształcenia danych poprawiają jakość wyników?
  • optymalizacja embeddingów pod kątem wyszukiwania.

16. Jak unikać halucynacji modeli generatywnych

  • strategie weryfikacji wyników,
  • monitorowanie jakości generowanych odpowiedzi.

17. Wydajność i optymalizacja wyszukiwania

  • jak unikać opóźnień w przetwarzaniu zapytań?
  • redukcja kosztów obliczeniowych.

18. Cache’owanie wyników i minimalizacja kosztów

  • strategie cache’owania wyników,
  • optymalne zarządzanie pamięcią podręczną.

19. Skalowanie systemu RAG w środowiskach produkcyjnych

  • jak przygotować RAG na duże ilości zapytań?
  • strategie rozproszonego przetwarzania zapytań.

Opieka poszkoleniowa

W ramach opieki poszkoleniowej masz do wyboru jedną z dwóch możliwych form kontaktu z trenerem, w przeciągu 1 roku po zakończonym szkoleniu:

  • konsultację telefoniczną,
  • na 2 godzinne konsultacje online z trenerem.

Metody szkolenia

  • wykład,
  • mini-prezentacja,
  • praca warsztatowa z komputerem,
  • ćwiczenia i case study,
  • praca indywidualna z trenerem.

Certyfikat

  • certyfikat w języku polskim, numer Wpisu do Rejestru Instytucji Szkoleniowych 2.12/00238/2015,
  • certyfikat w języku angielskim na życzenie.