Kurs RAG w praktyce - nowoczesne techniki wydobywania i generowania danych

Proces szkoleniowy

Analiza potrzeb szkoleniowych

Jeśli masz życzenie dotyczące programu szkolenia, przeprowadzimy dla Ciebie analizę potrzeb szkoleniowych, która będzie wskazówką dla nas, na jakie aspekty programu położyć większy nacisk – tak, by program szkolenia spełniał konkretne potrzeby.

Co zyskujesz?

Zrozumiesz architekturę RAG - Nauczysz się projektować przepływ danych w systemie RAG i odróżniać go od pracy standardowego LLM, dzięki czemu świadomie dobierzesz komponenty do własnych zastosowań.

Przygotujesz dane do wyszukiwania - Dowiesz się, jak wydobywać treść z dokumentów, dzielić ją na sensowne fragmenty i ustawiać parametry chunkingu tak, aby poprawić jakość późniejszego wyszukiwania.

Dobierzesz właściwe embeddingi - Poznasz różnice między modelami embeddingów i nauczysz się wybierać reprezentacje wektorowe pod typ danych, język oraz cel biznesowy, zamiast działać metodą prób i błędów.

Opanujesz Qdrant w praktyce - Skonfigurujesz środowisko, utworzysz kolekcje i przećwiczysz operacje na rekordach w Qdrant, dzięki czemu zbudujesz stabilne zaplecze dla aplikacji opartych na wyszukiwaniu wektorowym.

Zwiększysz trafność wyników - Nauczysz się łączyć semantic search, filtrowanie po metadanych i reranking, aby zwracać bardziej adekwatne dokumenty oraz ograniczać liczbę nietrafionych odpowiedzi systemu.

Zbudujesz lepsze prompty - Przećwiczysz tworzenie prompt templates i składanie zapytania z kontekstem, dzięki czemu model będzie generował odpowiedzi oparte na źródłach, a nie na domysłach lub halucynacjach.

Nauczysz się oceniać jakość RAG - Poznasz metryki i narzędzia, w tym deepeval, które pozwolą Ci testować poprawność odpowiedzi, mierzyć jakość działania i automatyzować kontrolę zmian w systemie RAG.

Wyjdziesz z gotowym rozwiązaniem - Zobaczysz kompletną aplikację do zasilania bazy wiedzy i generowania odpowiedzi, więc łatwiej przeniesiesz poznane techniki do projektu pilotażowego lub środowiska produkcyjnego.

Program szkolenia

1. Wprowadzenie do architektury RAG

koncepcja działania i przewagi nad standardowymi modelami językowymi,
przegląd komponentów systemu i przepływu informacji,
rola biblioteki LangChain w budowie aplikacji.

2. Przetwarzanie danych wejściowych

zastosowanie parserów do ekstrakcji treści z dokumentów,
strategie segmentacji tekstu na mniejsze fragmenty (chunking),
dobór optymalnych parametrów podziału treści.

3. Modelowanie semantyczne i embeddingi

istota embeddingów: przekształcanie znaczenia tekstu na wektory,
przegląd aktualnych modeli i generatorów reprezentacji wektorowych,
kryteria wyboru modelu pod kątem specyfiki danych.

4. Obsługa wektorowej bazy danych Qdrant

konfiguracja środowiska i zarządzanie kolekcjami danych,
operacje na rekordach: dodawanie, modyfikacja i usuwanie informacji,
mechanizmy integracji bazy Qdrant z systemem LangChain.

5. Zaawansowane mechanizmy wyszukiwania (Retrieval)

implementacja wyszukiwania semantycznego (Semantic Search),
wykorzystanie metadanych do precyzyjnego filtrowania wyników,
zastosowanie technik Rerankingu dla poprawy trafności dokumentów.

6. Generowanie odpowiedzi i inżynieria promptów

projektowanie szablonów instrukcji (Prompt Templates),
łączenie wyszukanego kontekstu z zapytaniem użytkownika,
synteza odpowiedzi w oparciu o dostarczone materiały źródłowe.

7. Analiza jakości i ewaluacja systemu

wykorzystanie biblioteki deepeval w procesie testowym,
definicja i pomiar kluczowych metryk jakościowych RAG,
automatyzacja weryfikacji poprawności generowanych treści.

8. Podsumowanie i wdrożenie praktyczne

prezentacja gotowej aplikacji do zasilania bazy i generowania wiedzy.

Jakie są wymagania wstępne do udziału w szkoleniu?

Podstawy Pythona - Powinieneś swobodnie czytać i pisać prosty kod w Pythonie, używać funkcji, importów oraz pracy na danych tekstowych, bo szkolenie dotyczy budowy działających elementów rozwiązania.

Praca z API i bibliotekami - Powinieneś mieć doświadczenie w instalacji bibliotek, pracy w środowisku programistycznym i korzystaniu z API, aby sprawnie uruchamiać przykłady oraz integrować komponenty.

Podstawy modeli językowych - Powinieneś rozumieć, czym są modele językowe, prompt i kontekst odpowiedzi, aby łatwo przejść do zagadnień związanych z RAG, embeddingami i generowaniem odpowiedzi.

Podstawy danych i wyszukiwania - Powinieneś znać podstawy pracy z danymi tekstowymi, dokumentami i prostym wyszukiwaniem informacji, ponieważ szkolenie obejmuje parsowanie, segmentację i retrieval.