Podstawowe zapytania SELECT w T-SQL 🚀 filtrowanie, sortowanie i agregacja

Wprowadzenie: czym jest SELECT w T-SQL i do czego służy

Instrukcja SELECT jest podstawowym narzędziem służącym do odczytywania danych z bazy w języku T-SQL. To właśnie za jej pomocą pobiera się informacje zapisane w tabelach i widokach, aby je przeglądać, analizować, porządkować i zestawiać w potrzebnej formie. W praktyce SELECT jest jedną z najczęściej używanych instrukcji w codziennej pracy z Microsoft SQL Server.

Najprościej mówiąc, SELECT pozwala określić, jakie dane mają zostać zwrócone przez bazę. Może to być pojedyncza kolumna, kilka wybranych pól albo pełny zestaw informacji z danego źródła danych. Dzięki temu użytkownik nie musi pobierać wszystkiego bez wyjątku, lecz może skupić się tylko na tych danych, które są potrzebne w danym momencie.

W T-SQL SELECT nie służy wyłącznie do prostego wyświetlania rekordów. Jest także punktem wyjścia do bardziej użytecznych operacji, takich jak ograniczanie wyników do określonych warunków, ustawianie kolejności zwracanych danych czy tworzenie podsumowań liczbowych. Z tego powodu można traktować go jako podstawę pracy analitycznej i raportowej na danych zapisanych w bazie.

Warto też rozumieć różnicę między samym przechowywaniem danych a ich odczytem. Tabele w bazie zawierają informacje w uporządkowanej strukturze, natomiast SELECT pozwala wydobyć z nich konkretny obraz danych dopasowany do bieżącej potrzeby. Oznacza to, że ta sama tabela może zostać odczytana na wiele różnych sposobów, zależnie od celu zapytania.

Do przeglądania danych – gdy trzeba sprawdzić zawartość tabeli lub wybrane informacje.
Do analizy – gdy istotne jest wyszukanie konkretnych rekordów i porównanie wartości.
Do raportowania – gdy dane mają zostać przedstawione w określonym układzie lub w formie podsumowania.
Do przygotowania danych dla aplikacji – gdy system lub raport pobiera z bazy tylko potrzebny fragment informacji.

SELECT jest więc instrukcją odpowiedzialną za pobieranie danych, a nie za ich modyfikowanie. To odróżnia go od poleceń służących do dodawania, zmiany lub usuwania rekordów. Dzięki temu można bezpiecznie odczytywać informacje i budować zapytania, których celem jest poznanie zawartości bazy, a nie ingerencja w jej dane.

Z perspektywy początkującej osoby najważniejsze jest zrozumienie, że SELECT stanowi podstawę komunikacji z bazą danych w zakresie odczytu informacji. Pozwala zadawać pytania bazie i otrzymywać odpowiedzi w uporządkowanej postaci, co czyni go kluczowym elementem pracy z T-SQL.

Podstawowa składnia SELECT i FROM: wybór kolumn, aliasy, proste przykłady na tabelach Customers i Sales

W T-SQL najprostsze zapytanie składa się z dwóch kluczowych elementów: SELECT i FROM. Pierwszy z nich określa, jakie dane mają zostać zwrócone, a drugi wskazuje, z jakiego źródła te dane pochodzą. W praktyce oznacza to, że najpierw wybierasz kolumny, które chcesz zobaczyć, a następnie podajesz tabelę, z której mają zostać odczytane. Podczas szkoleń Cognity ten temat wraca regularnie – dlatego zdecydowaliśmy się go omówić również tutaj.

Instrukcja SELECT może zwracać jedną kolumnę, kilka kolumn albo wszystkie kolumny dostępne w tabeli. Najczęściej najlepszym wyborem jest wskazanie konkretnych kolumn, ponieważ dzięki temu wynik jest czytelniejszy, a zapytanie lepiej pokazuje intencję autora.

Dla tabeli Customers można chcieć pobrać na przykład identyfikator klienta, nazwę klienta lub miasto. Z kolei z tabeli Sales typowo wybiera się identyfikator sprzedaży, datę sprzedaży, kwotę albo identyfikator klienta powiązanego z transakcją. Już na tym poziomie widać podstawową różnicę zastosowań obu tabel: Customers przechowuje informacje o klientach, a Sales dane o sprzedaży.

W praktyce często spotyka się dwa podejścia do wyboru danych:

wybór wszystkich kolumn — wygodny na etapie szybkiego podglądu zawartości tabeli,
wybór tylko potrzebnych kolumn — lepszy w codziennej pracy, raportach i zapytaniach używanych w aplikacjach.

Warto pamiętać, że pobieranie wszystkich kolumn nie zawsze jest dobrym rozwiązaniem. Jeśli tabela zawiera dużo pól, wynik może stać się mało czytelny, a samo zapytanie mniej praktyczne. Dlatego w większości przypadków lepiej jawnie wskazać potrzebne kolumny.

Istotnym elementem podstawowej składni są także aliasy. Alias to tymczasowa, uproszczona lub bardziej opisowa nazwa nadana kolumnie albo tabeli na potrzeby konkretnego zapytania. Dzięki aliasom wynik bywa łatwiejszy do zrozumienia, zwłaszcza gdy nazwy techniczne w bazie są mało przyjazne dla użytkownika.

Alias kolumny może służyć między innymi do:

uproszczenia nagłówka w wyniku,
nadania bardziej biznesowej nazwy,
zwiększenia czytelności zapytania.

Przykładowo, kolumna z tabeli Customers może zostać pokazana pod bardziej zrozumiałą etykietą, a tabela Sales może otrzymać krótszą nazwę używaną wewnątrz zapytania. To szczególnie przydatne wtedy, gdy operuje się na kilku źródłach danych lub gdy nazwy kolumn są długie.

W prostych zapytaniach działanie jest bardzo intuicyjne: wskazujesz kolumny po SELECT, a tabelę po FROM. Jeśli chcesz obejrzeć podstawowe dane klientów, źródłem będzie Customers. Jeśli interesują Cię informacje o transakcjach, użyjesz Sales. Taka konstrukcja stanowi fundament praktycznie każdej pracy z danymi w T-SQL.

Na poziomie podstaw warto też rozróżnić dwie sytuacje:

zapytanie do jednej tabeli — najprostszy wariant, dobry do pobierania pojedynczych zestawów danych,
zapytanie z aliasami — nadal proste, ale wygodniejsze w czytaniu i przygotowujące grunt pod bardziej rozbudowane instrukcje.

Jeżeli celem jest szybkie sprawdzenie zawartości tabeli Customers, można ograniczyć się do pobrania kilku podstawowych kolumn. Jeśli natomiast analizowana jest tabela Sales, zwykle wybiera się pola opisujące sprzedaż, takie jak data czy wartość transakcji. Już sam świadomy wybór kolumn pomaga skupić się na tym, co naprawdę potrzebne.

Podstawowa składnia SELECT ... FROM ... jest więc punktem wyjścia do pracy z danymi: pozwala pobierać konkretne informacje z określonej tabeli, porządkować wynik za pomocą aliasów i budować czytelne zapytania nawet wtedy, gdy ich cel jest bardzo prosty.

Filtrowanie wyników przez WHERE: operatory porównania, AND/OR/NOT, LIKE, IN, BETWEEN oraz pułapki z NULL

Klauzula WHERE służy do ograniczania liczby zwracanych wierszy. Dzięki niej można pobrać tylko te dane, które spełniają określone warunki, na przykład sprzedaż z wybranego przedziału kwot, klientów z konkretnego kraju albo rekordy z brakującą wartością w danej kolumnie.

W praktyce WHERE działa jak filtr: najpierw wskazujemy tabelę, a następnie określamy, które rekordy mają zostać uwzględnione w wyniku. To jedna z najczęściej używanych części zapytań SELECT w T-SQL.

Operatory porównania

Najprostsze filtrowanie opiera się na porównywaniu wartości w kolumnach. Najczęściej używane operatory to:

= — równe
<> — różne
> — większe niż
< — mniejsze niż
>= — większe lub równe
<= — mniejsze lub równe

SELECT CustomerID, Country
FROM Customers
WHERE Country = 'Poland';

SELECT SaleID, Amount
FROM Sales
WHERE Amount > 1000;

Tego typu warunki najlepiej sprawdzają się przy liczbach, datach i wartościach tekstowych, gdy szukamy dokładnego dopasowania albo prostego zakresu.

Łączenie warunków: AND, OR, NOT

Wiele zapytań wymaga sprawdzania więcej niż jednego warunku jednocześnie. Do tego służą operatory logiczne:

AND — oba warunki muszą być spełnione
OR — wystarczy spełnienie jednego z warunków
NOT — odwraca wynik warunku

SELECT CustomerID, Country, City
FROM Customers
WHERE Country = 'Poland' AND City = 'Warsaw';

SELECT SaleID, Amount
FROM Sales
WHERE Amount < 100 OR Amount > 5000;

SELECT CustomerID, Country
FROM Customers
WHERE NOT Country = 'Germany';

Przy bardziej złożonych warunkach warto używać nawiasów, aby jednoznacznie wskazać kolejność oceny wyrażeń.

SELECT CustomerID, Country, City
FROM Customers
WHERE Country = 'Poland' AND (City = 'Warsaw' OR City = 'Krakow');

Bez nawiasów wynik może być inny, niż oczekiwano, ponieważ T-SQL interpretuje wyrażenia logiczne według określonych zasad.

Wyszukiwanie wzorców przez LIKE

Operator LIKE służy do filtrowania tekstu na podstawie wzorca. Jest przydatny wtedy, gdy nie szukamy dokładnej wartości, lecz danych zaczynających się od określonego ciągu, kończących się nim albo zawierających go w środku.

Najczęściej używane symbole wieloznaczne to:

% — dowolny ciąg znaków
_ — pojedynczy dowolny znak

SELECT CustomerID, City
FROM Customers
WHERE City LIKE 'War%';

SELECT CustomerID, Country
FROM Customers
WHERE Country LIKE '%land';

SELECT CustomerID, City
FROM Customers
WHERE City LIKE '_o%';

LIKE jest szczególnie przydatny przy filtrowaniu danych tekstowych, ale trzeba pamiętać, że nie oznacza wyszukiwania „podobnego” językowo — chodzi wyłącznie o dopasowanie do wzorca znaków.

Sprawdzanie wielu wartości: IN

Jeśli chcemy porównać kolumnę z kilkoma możliwymi wartościami, wygodniej użyć IN zamiast wielu warunków połączonych przez OR.

SELECT CustomerID, Country
FROM Customers
WHERE Country IN ('Poland', 'Germany', 'France');

To rozwiązanie jest krótsze i zwykle bardziej czytelne niż zapis:

WHERE Country = 'Poland' OR Country = 'Germany' OR Country = 'France'

IN stosuje się najczęściej przy filtrowaniu po liście konkretnych wartości tekstowych, liczbowych lub identyfikatorach.

Zakresy wartości: BETWEEN

Operator BETWEEN upraszcza filtrowanie danych mieszczących się w określonym przedziale. Jest używany głównie dla liczb i dat.

SELECT SaleID, Amount
FROM Sales
WHERE Amount BETWEEN 100 AND 1000;

SELECT SaleID, SaleDate
FROM Sales
WHERE SaleDate BETWEEN '2024-01-01' AND '2024-12-31';

Warto pamiętać, że BETWEEN obejmuje obie granice zakresu. Oznacza to, że wartości równe dolnej i górnej granicy również zostaną uwzględnione.

Pułapki związane z NULL

Jednym z częstszych źródeł błędów w filtrowaniu jest wartość NULL. Oznacza ona brak danych lub wartość nieznaną. Nie jest to ani pusty tekst, ani zero.

Najważniejsza zasada: NULL nie porównuje się przy użyciu = ani <>.

Niepoprawne podejście:

SELECT CustomerID, City
FROM Customers
WHERE City = NULL;

Poprawne podejście:

SELECT CustomerID, City
FROM Customers
WHERE City IS NULL;

SELECT CustomerID, City
FROM Customers
WHERE City IS NOT NULL;

To bardzo ważne, ponieważ warunki z NULL działają inaczej niż zwykłe porównania. Jeśli w kolumnie mogą występować braki danych, trzeba uwzględnić to już na etapie pisania filtra.

Przypadek	Niepoprawnie	Poprawnie
Sprawdzenie braku wartości	City = NULL	City IS NULL
Sprawdzenie istnienia wartości	City <> NULL	City IS NOT NULL

Najczęstsze zastosowania klauzuli WHERE

wybór rekordów z konkretnego kraju, miasta lub kategorii,
ograniczenie danych do określonego przedziału liczb lub dat,
wyszukiwanie tekstu według wzorca,
pomijanie lub wyszukiwanie brakujących wartości,
budowanie bardziej precyzyjnych filtrów przez łączenie wielu warunków.

Dobrze napisany warunek WHERE sprawia, że wynik zapytania jest trafniejszy, czytelniejszy i lepiej odpowiada na konkretne potrzeby analizy danych.

💡 Pro tip: Zawsze używaj nawiasów przy łączeniu AND i OR, nawet jeśli warunek wydaje się prosty — unikniesz przez to błędnej interpretacji logiki zapytania. Pamiętaj też, że NULL nie porównuje się przez = ani <>, tylko przez IS NULL lub IS NOT NULL.

Sortowanie danych: ORDER BY, ASC/DESC i sortowanie po wielu kolumnach

Klauzula ORDER BY w T-SQL służy do ustawienia kolejności zwracanych wierszy. Samo zapytanie SELECT bez sortowania nie gwarantuje żadnego konkretnego układu danych, nawet jeśli przy kolejnych uruchomieniach wynik wygląda podobnie. Jeżeli kolejność ma znaczenie dla użytkownika, raportu lub eksportu danych, warto wskazać ją jawnie. W Cognity wierzymy, że dobre zrozumienie tego tematu to podstawa efektywnej pracy z narzędziami cyfrowymi.

Najczęściej sortowanie wykonuje się rosnąco albo malejąco. W T-SQL odpowiadają za to słowa kluczowe ASC oraz DESC:

ASC – sortowanie rosnące, na przykład od A do Z, od najmniejszej do największej wartości
DESC – sortowanie malejące, na przykład od Z do A, od największej do najmniejszej wartości

Jeśli kierunek nie zostanie podany, domyślnie stosowane jest ASC.

SELECT CustomerID, CompanyName, City
FROM Customers
ORDER BY CompanyName;

W tym przykładzie rekordy z tabeli Customers zostaną posortowane alfabetycznie według nazwy firmy zapisanej w kolumnie CompanyName.

SELECT SaleID, CustomerID, SaleDate, Amount
FROM Sales
ORDER BY SaleDate DESC;

Tutaj wyniki z tabeli Sales zostaną ułożone od najnowszej sprzedaży do najstarszej. Taki sposób sortowania jest często używany tam, gdzie najważniejsze są najświeższe dane.

Sortowanie po wielu kolumnach

W praktyce jedna kolumna często nie wystarcza. Można wtedy podać kilka kolumn w ORDER BY, rozdzielając je przecinkami. T-SQL najpierw sortuje po pierwszej kolumnie, a jeśli wartości są takie same, bierze pod uwagę następną.

SELECT CustomerID, CompanyName, City
FROM Customers
ORDER BY City ASC, CompanyName ASC;

Najpierw dane zostaną uporządkowane alfabetycznie według miasta, a wewnątrz każdego miasta dodatkowo według nazwy firmy.

SELECT SaleID, CustomerID, SaleDate, Amount
FROM Sales
ORDER BY SaleDate DESC, Amount DESC;

W tym przypadku najpierw liczy się data sprzedaży, a jeśli kilka rekordów ma tę samą datę, wtedy o kolejności decyduje kwota Amount.

Sortowanie po aliasie i pozycji kolumny

W niektórych przypadkach można sortować także po aliasie nadanym w części SELECT. To bywa wygodne, gdy wynik ma bardziej czytelną nazwę kolumny.

SELECT CompanyName AS CustomerName, City
FROM Customers
ORDER BY CustomerName;

Możliwe jest również sortowanie według numeru kolumny z listy SELECT, na przykład ORDER BY 1. Takie podejście działa, ale zwykle jest mniej czytelne i trudniejsze w utrzymaniu, zwłaszcza gdy lista kolumn się zmienia.

Kiedy ORDER BY jest szczególnie przydatne

gdy wynik ma być czytelny dla użytkownika
gdy trzeba wyświetlić najnowsze lub największe wartości na początku
gdy dane mają być uporządkowane przed eksportem
gdy kilka podobnych rekordów trzeba ułożyć według ustalonej logiki

Zastosowanie	Przykład sortowania
Lista klientów alfabetycznie	`ORDER BY CompanyName ASC`
Ostatnie sprzedaże na górze	`ORDER BY SaleDate DESC`
Klienci według miasta i nazwy	`ORDER BY City, CompanyName`
Sprzedaże według daty i kwoty	`ORDER BY SaleDate DESC, Amount DESC`

ORDER BY nie zmienia danych w tabeli – wpływa wyłącznie na kolejność prezentacji wyniku zapytania. To ważne rozróżnienie: sortowanie dotyczy zestawu zwracanego przez SELECT, a nie fizycznego ułożenia rekordów w bazie.

Agregacje w praktyce: COUNT, SUM, AVG, MIN, MAX oraz różnice między COUNT(*) i COUNT(kolumna)

Funkcje agregujące w T-SQL służą do wykonywania obliczeń na wielu wierszach i zwracania jednego wyniku. Dzięki nim można szybko policzyć liczbę rekordów, zsumować wartości, wyznaczyć średnią albo znaleźć wartość minimalną i maksymalną. To podstawowe narzędzia przy analizie danych w tabelach takich jak Sales czy Customers.

Najczęściej używane funkcje agregujące to:

COUNT – liczy wiersze lub niepuste wartości,
SUM – sumuje wartości liczbowe,
AVG – oblicza średnią,
MIN – zwraca najmniejszą wartość,
MAX – zwraca największą wartość.

Przykładowe użycie na tabeli Sales może wyglądać tak:

SELECT 
    COUNT(*) AS LiczbaWierszy,
    SUM(Amount) AS SumaSprzedazy,
    AVG(Amount) AS SredniaSprzedaz,
    MIN(Amount) AS NajmniejszaSprzedaz,
    MAX(Amount) AS NajwiekszaSprzedaz
FROM Sales;

W powyższym zapytaniu T-SQL analizuje wszystkie wiersze z tabeli Sales i zwraca jeden rekord z podsumowaniem.

Do czego używa się poszczególnych agregacji?

Funkcja	Zastosowanie	Uwagi
COUNT	Zliczanie rekordów lub wartości	Może działać różnie w zależności od użytej składni
SUM	Obliczanie łącznej wartości liczbowej	Działa dla kolumn numerycznych
AVG	Wyliczanie średniej	Pomija wartości NULL
MIN	Szukanie najmniejszej wartości	Może działać także na datach i tekstach
MAX	Szukanie największej wartości	Może działać także na datach i tekstach

COUNT(*) a COUNT(kolumna)

To jedno z najważniejszych rozróżnień przy pracy z agregacjami.

COUNT(*) zlicza wszystkie wiersze zwrócone przez zapytanie, niezależnie od tego, czy w poszczególnych kolumnach występują wartości NULL.
COUNT(kolumna) zlicza tylko te wiersze, w których wskazana kolumna ma wartość różną od NULL.

To oznacza, że wyniki tych dwóch zapisów mogą się różnić.

SELECT 
    COUNT(*) AS WszystkieWiersze,
    COUNT(CustomerID) AS WierszeZCustomerID
FROM Sales;

Jeżeli w tabeli Sales część rekordów ma w kolumnie CustomerID wartość NULL, to COUNT(*) policzy wszystkie rekordy, a COUNT(CustomerID) tylko te, gdzie identyfikator klienta został uzupełniony.

W praktyce:

COUNT(*) stosuje się wtedy, gdy celem jest policzenie liczby wierszy,
COUNT(kolumna) jest przydatne wtedy, gdy chcemy sprawdzić, ile rekordów zawiera rzeczywistą wartość w konkretnej kolumnie.

Ważna cecha agregacji: obsługa NULL

Większość funkcji agregujących, takich jak SUM, AVG, MIN, MAX oraz COUNT(kolumna), pomija wartości NULL. Ma to znaczenie podczas interpretacji wyników. Przykładowo średnia liczona przez AVG nie uwzględni brakujących wartości, tylko te faktycznie zapisane w kolumnie.

SELECT 
    AVG(Amount) AS SredniaKwota
FROM Sales;

Jeżeli część rekordów ma w kolumnie Amount wartość NULL, nie zostaną one doliczone ani do sumy, ani do liczby elementów użytych do obliczenia średniej.

Praktyczne przykłady

Agregacje są szczególnie użyteczne przy prostych pytaniach biznesowych i raportowych, na przykład:

ile rekordów znajduje się w tabeli Customers,
jaka jest łączna wartość sprzedaży w tabeli Sales,
jaka była najwyższa i najniższa kwota sprzedaży,
jaka jest średnia wartość transakcji.

SELECT COUNT(*) AS LiczbaKlientow
FROM Customers;

SELECT SUM(Amount) AS LacznaSprzedaz
FROM Sales;

SELECT MIN(SaleDate) AS PierwszaSprzedaz,
       MAX(SaleDate) AS OstatniaSprzedaz
FROM Sales;

Warto pamiętać, że funkcje MIN i MAX nie służą wyłącznie do liczb. Bardzo często wykorzystuje się je również dla dat, aby znaleźć najwcześniejszy i najpóźniejszy zapis.

6. Grupowanie wyników: GROUP BY i filtrowanie grup przez HAVING

Klauzula GROUP BY służy do łączenia wielu wierszy w grupy na podstawie wybranej kolumny lub kilku kolumn. Dzięki temu można obliczać wartości zbiorcze dla każdej grupy, na przykład liczbę rekordów, sumę sprzedaży czy średnią wartość.

W praktyce oznacza to, że zamiast oglądać pojedyncze wiersze z tabeli, można uzyskać podsumowanie danych, np. osobno dla każdego klienta, miasta lub daty.

Kiedy używać GROUP BY

gdy chcesz policzyć liczbę rekordów w podziale na kategorie,
gdy chcesz zsumować wartości dla każdej grupy,
gdy potrzebujesz średniej, minimum albo maksimum w obrębie określonych danych,
gdy raport ma pokazywać podsumowania zamiast pojedynczych wierszy.

Przykładowo, jeśli tabela Sales zawiera informacje o sprzedaży, można policzyć liczbę transakcji dla każdego klienta:

SELECT CustomerID, COUNT(*) AS NumberOfSales
FROM Sales
GROUP BY CustomerID;

Wynik takiego zapytania będzie zawierał jeden wiersz dla każdego CustomerID, a nie wszystkie pojedyncze transakcje.

Najważniejsza zasada GROUP BY

Jeżeli w zapytaniu używasz GROUP BY, to kolumny w sekcji SELECT powinny być:

albo ujęte w GROUP BY,
albo użyte wewnątrz funkcji agregujących, takich jak COUNT, SUM, AVG, MIN, MAX.

Przykład poprawnego zapytania:

SELECT CustomerID, SUM(Amount) AS TotalAmount
FROM Sales
GROUP BY CustomerID;

Tutaj CustomerID jest kolumną grupującą, a Amount jest agregowane przez SUM.

Grupowanie po wielu kolumnach

Grupowanie może odbywać się także według więcej niż jednej kolumny. Wtedy każda unikalna kombinacja wartości tworzy osobną grupę.

SELECT CustomerID, SaleDate, COUNT(*) AS SalesCount
FROM Sales
GROUP BY CustomerID, SaleDate;

Takie zapytanie pokaże liczbę transakcji dla każdego klienta w rozbiciu na daty.

HAVING – filtrowanie całych grup

Klauzula HAVING służy do filtrowania wyników po grupowaniu. Jest używana wtedy, gdy chcesz zostawić tylko te grupy, które spełniają określony warunek dotyczący agregacji.

Na przykład można wyświetlić tylko tych klientów, którzy mają więcej niż 5 transakcji:

SELECT CustomerID, COUNT(*) AS NumberOfSales
FROM Sales
GROUP BY CustomerID
HAVING COUNT(*) > 5;

W tym przypadku najpierw powstają grupy według CustomerID, a dopiero potem wybierane są tylko te, dla których liczba rekordów jest większa od 5.

Różnica między WHERE a HAVING

Klauzula	Do czego służy	Kiedy działa
WHERE	Filtruje pojedyncze wiersze	Przed grupowaniem
HAVING	Filtruje całe grupy	Po grupowaniu

To rozróżnienie jest bardzo ważne. Jeśli chcesz odrzucić część rekordów jeszcze przed obliczeniami, używasz WHERE. Jeśli chcesz odrzucić dopiero gotowe grupy, używasz HAVING.

Przykład łączący oba podejścia:

SELECT CustomerID, SUM(Amount) AS TotalAmount
FROM Sales
WHERE Amount > 0
GROUP BY CustomerID
HAVING SUM(Amount) > 1000;

WHERE usuwa wiersze z wartością Amount mniejszą lub równą 0,
GROUP BY tworzy grupy według klienta,
HAVING zostawia tylko tych klientów, których łączna sprzedaż przekracza 1000.

Typowe zastosowania

liczba zamówień dla każdego klienta,
suma sprzedaży według dnia, miesiąca lub klienta,
średnia wartość transakcji w podziale na kategorie,
wyszukiwanie grup, które przekraczają ustalony próg, np. minimalną liczbę rekordów lub minimalną sumę.

GROUP BY i HAVING są podstawą raportowania i tworzenia prostych zestawień w T-SQL. Pierwsza z tych klauzul odpowiada za budowanie grup, a druga za wybór tylko tych grup, które są istotne z punktu widzenia analizy danych.

Typowe pułapki i dobre praktyki

Przy pracy z zapytaniami SELECT w T-SQL bardzo łatwo uzyskać wynik, który wygląda poprawnie, ale w praktyce nie odpowiada rzeczywistym danym. Najczęściej wynika to nie z błędów składni, lecz z niepełnego zrozumienia tego, w jakiej kolejności silnik interpretuje poszczególne elementy zapytania, jak traktowane są wartości NULL oraz jak duże znaczenie ma przejrzystość samego polecenia.

Jedną z podstawowych zasad jest świadomość, że zapytanie nie jest wykonywane dokładnie w takiej kolejności, w jakiej zapisujemy jego fragmenty. Dla początkujących bywa to mylące, ponieważ najpierw widzą SELECT, a dopiero później warunki i sortowanie. W praktyce istotne jest rozumienie, że najpierw wybierane jest źródło danych, następnie stosowane są warunki filtrowania, potem grupowanie i dalsze etapy przetwarzania, a dopiero na końcu przygotowywana jest końcowa postać wyniku. Taka perspektywa pomaga lepiej przewidywać, dlaczego niektóre aliasy nie są dostępne w każdym miejscu zapytania albo dlaczego wynik agregacji nie może być użyty w zwykłym warunku filtrowania.

Drugą częstą pułapką jest NULL. W T-SQL NULL nie oznacza zera ani pustego tekstu. Oznacza brak wartości, a to ma bardzo konkretne konsekwencje podczas porównań. Wiele osób zakłada, że sprawdzenie równości lub nierówności wystarczy, aby wykryć brak danych, ale w praktyce takie podejście prowadzi do błędnych rezultatów. Warunki z udziałem NULL trzeba formułować świadomie, bo standardowe porównania nie działają tutaj intuicyjnie. To szczególnie ważne przy filtrowaniu, liczeniu rekordów i budowaniu bardziej złożonych warunków logicznych.

Warto też pamiętać, że złożone warunki logiczne mogą dawać inne wyniki, niż sugeruje ich pobieżne przeczytanie. Łączenie operatorów logicznych bez wyraźnego porządku zwiększa ryzyko pomyłki. Dobrą praktyką jest stosowanie nawiasów wszędzie tam, gdzie warunek ma być jednoznaczny dla człowieka, nawet jeśli silnik bazy danych poradzi sobie bez nich. Dzięki temu łatwiej uniknąć sytuacji, w której zapytanie formalnie działa, ale zwraca zbyt wiele albo zbyt mało wierszy.

Osobnym zagadnieniem jest czytelność. Nawet proste zapytanie może szybko stać się trudne do zrozumienia, jeśli jest zapisane w pośpiechu. W praktyce warto dbać o logiczny układ polecenia, spójne wcięcia, sensowne aliasy oraz przewidywalne nazewnictwo. Czytelne zapytanie łatwiej poprawić, rozbudować i przekazać innej osobie. Ma to znaczenie nie tylko w pracy zespołowej, ale też wtedy, gdy po kilku dniach lub tygodniach wraca się do własnego kodu.

Pisz zapytania etapami – najpierw pobierz podstawowy zestaw danych, a dopiero później dodawaj kolejne warunki.
Sprawdzaj wynik po każdej zmianie – łatwiej wtedy wykryć moment, w którym logika zaczyna działać niepoprawnie.
Zwracaj uwagę na NULL – brak wartości wymaga osobnego podejścia i nie powinien być traktowany jak zwykła wartość.
Używaj nawiasów w warunkach logicznych – poprawiają one jednoznaczność i zmniejszają ryzyko błędnej interpretacji.
Dbaj o formatowanie – przejrzysty układ zapytania ułatwia analizę i ogranicza liczbę pomyłek.
Testuj na małych, zrozumiałych zestawach danych – dzięki temu szybciej zauważysz nieoczekiwane przypadki brzegowe.

Dobrym nawykiem jest także porównywanie wyniku zapytania z własnym oczekiwaniem biznesowym. Jeśli rezultat wygląda podejrzanie, na przykład zawiera zbyt dużo pustych wartości, nieoczekiwaną liczbę rekordów albo kolejność inną niż zakładana, warto wrócić do warunków i założeń. Często problem nie leży w samej bazie danych, lecz w drobnym szczególe logiki zapytania.

Najlepsze zapytania SELECT to nie tylko te, które zwracają wynik bez błędu, ale przede wszystkim takie, które są poprawne, czytelne i łatwe do zweryfikowania. Świadomość kolejności przetwarzania, ostrożność przy pracy z NULL oraz systematyczne testowanie to fundament bezpiecznej pracy z danymi w T-SQL. W Cognity łączymy teorię z praktyką – dlatego ten temat rozwijamy także w formie ćwiczeń na szkoleniach.

💡 Pro tip: Buduj zapytanie SELECT krok po kroku i sprawdzaj wynik po każdej zmianie, bo łatwiej wtedy wychwycić moment, w którym logika zaczyna zwracać błędne dane. Dodatkowo dbaj o czytelne formatowanie i jawne nawiasy w warunkach, aby zapytanie było jednoznaczne także po czasie.

Majczęściej zadawane pytania i odpowiedzi odnośnie Podstawowe zapytania SELECT w T-SQL – filtrowanie, sortowanie i agregacja danych

Do czego służy instrukcja SELECT w T-SQL?

Instrukcja SELECT służy do odczytywania danych z tabel i widoków w T-SQL. Umożliwia pobranie konkretnych kolumn, przefiltrowanie wyników, ustawienie ich kolejności oraz przygotowanie prostych podsumowań. Dzięki temu można zadawać bazie danych precyzyjne pytania i otrzymywać wynik dopasowany do bieżącej potrzeby analitycznej, raportowej lub technicznej.

Czy lepiej używać SELECT * czy wybierać konkretne kolumny?

W większości przypadków lepiej wybierać konkretne kolumny niż używać SELECT *. Taki zapis jest czytelniejszy i lepiej pokazuje, jakie dane są naprawdę potrzebne. SELECT * bywa wygodny tylko przy szybkim podglądzie tabeli, ale w codziennej pracy częściej utrudnia analizę i tworzy mniej przejrzyste zapytania.

Jak poprawnie filtrować dane w T-SQL za pomocą WHERE?

Poprawne filtrowanie w T-SQL polega na użyciu klauzuli WHERE z warunkami dopasowanymi do typu danych i celu zapytania. Można stosować operatory porównania, AND, OR, NOT, LIKE, IN oraz BETWEEN. W praktyce warto budować filtr stopniowo i pilnować logiki warunków, zwłaszcza gdy łączy się kilka kryteriów jednocześnie.

Jaka jest różnica między IS NULL a = NULL w T-SQL?

W T-SQL brak wartości sprawdza się przez IS NULL, a nie przez = NULL. NULL oznacza wartość nieznaną lub brak danych, dlatego zwykłe porównania nie działają tu poprawnie. Najbezpieczniej stosować dwa podstawowe warianty:

IS NULL – gdy chcesz znaleźć brakujące wartości,
IS NOT NULL – gdy chcesz zostawić tylko wiersze z uzupełnioną wartością.

Po co używa się ORDER BY w zapytaniu SELECT?

ORDER BY służy do ustawienia kolejności zwracanych wierszy w wyniku zapytania. Bez tej klauzuli baza nie gwarantuje konkretnego układu danych. ORDER BY przydaje się szczególnie wtedy, gdy chcesz pokazać rekordy alfabetycznie, od najnowszych do najstarszych albo uporządkować wynik według kilku kolumn zgodnie z ustaloną logiką.

Czym różni się COUNT(*) od COUNT(kolumna) w T-SQL?

COUNT(*) zlicza wszystkie wiersze, a COUNT(kolumna) tylko te, w których wskazana kolumna nie ma wartości NULL. Ta różnica ma duże znaczenie przy analizie danych z brakami. Jeśli celem jest policzenie rekordów, zwykle używa się COUNT(*). Jeśli chcesz sprawdzić, ile wierszy zawiera rzeczywistą wartość w danym polu, użyj COUNT(kolumna).

Kiedy używać GROUP BY, a kiedy HAVING?

GROUP BY służy do tworzenia grup danych, a HAVING do filtrowania gotowych grup po agregacji. To odróżnia HAVING od WHERE, które działa wcześniej i filtruje pojedyncze wiersze. W praktyce ich role można uporządkować tak:

WHERE – ogranicza dane przed grupowaniem,
GROUP BY – buduje grupy,
HAVING – zostawia tylko grupy spełniające warunek.

Jakie są najczęstsze błędy przy pisaniu podstawowych zapytań SELECT w T-SQL?

Najczęstsze błędy dotyczą logiki warunków, pracy z NULL i nieczytelnej konstrukcji zapytania. Problemem bywa też brak nawiasów przy łączeniu AND z OR oraz mylenie filtrowania wierszy z filtrowaniem grup. Dobrym podejściem jest pisanie zapytania etapami, sprawdzanie wyniku po każdej zmianie i dbanie o jasne aliasy oraz przejrzyste formatowanie.

Porównanie frameworków agentowych 2026: gdzie wygrywa LangGraph, a gdzie proste „tool calling” 26 kwietnia 2026

Rekomendacje następnego kroku w aplikacji: agent vs klasyczny ML (bandyty, sekwencje, reguły) 24 kwietnia 2026

początkujący

od 3855 zł + VAT dla szkoleń otwartych

Zapytaj o cenę dla szkoleń zamkniętych

Kurs SQL Server - zastosowanie języka SQL Server do pracy z danymi...

Zobacz szczegóły szkolenia

początkujący

od 3895 zł + VAT dla szkoleń otwartych

Zapytaj o cenę dla szkoleń zamkniętych

Kurs T-SQL na Microsoft Azure - wydajne zarządzanie serwerami...

Zobacz szczegóły szkolenia

średnio zaawansowany

od 3621 zł + VAT dla szkoleń otwartych

Zapytaj o cenę dla szkoleń zamkniętych

Kurs SQL średniozaawansowany...

Zobacz szczegóły szkolenia

Inne teksty z tej kategorii

Jak tworzyć zapytania w SQL Server – przewodnik krok po kroku 26 lipca 2025 SELECT, WHERE, ORDER BY – pierwsze kroki w pisaniu zapytań SQL 22 lipca 2025 Data Sharing w Snowflake – jak bezpiecznie współdzielić dane z partnerami? 24 kwietnia 2025 T-SQL vs ANSI SQL: co naprawdę różni SQL Server od Teradata i Snowflake 19 stycznia 2026

Podstawowe zapytania SELECT w T-SQL – filtrowanie, sortowanie i agregacja danych

Wprowadzenie: czym jest SELECT w T-SQL i do czego służy

Podstawowa składnia SELECT i FROM: wybór kolumn, aliasy, proste przykłady na tabelach Customers i Sales

Filtrowanie wyników przez WHERE: operatory porównania, AND/OR/NOT, LIKE, IN, BETWEEN oraz pułapki z NULL

Operatory porównania

Łączenie warunków: AND, OR, NOT

Wyszukiwanie wzorców przez LIKE

Sprawdzanie wielu wartości: IN

Zakresy wartości: BETWEEN

Pułapki związane z NULL

Najczęstsze zastosowania klauzuli WHERE

Sortowanie danych: ORDER BY, ASC/DESC i sortowanie po wielu kolumnach

Sortowanie po wielu kolumnach

Sortowanie po aliasie i pozycji kolumny

Kiedy ORDER BY jest szczególnie przydatne

Agregacje w praktyce: COUNT, SUM, AVG, MIN, MAX oraz różnice między COUNT(*) i COUNT(kolumna)

Do czego używa się poszczególnych agregacji?

COUNT(*) a COUNT(kolumna)

Ważna cecha agregacji: obsługa NULL

Praktyczne przykłady

6. Grupowanie wyników: GROUP BY i filtrowanie grup przez HAVING

Kiedy używać GROUP BY

Najważniejsza zasada GROUP BY

Grupowanie po wielu kolumnach

HAVING – filtrowanie całych grup

Różnica między WHERE a HAVING

Typowe zastosowania

Typowe pułapki i dobre praktyki

Majczęściej zadawane pytania i odpowiedzi odnośnie Podstawowe zapytania SELECT w T-SQL – filtrowanie, sortowanie i agregacja danych

Inne teksty z tej kategorii

Podziel się tym tekstem

Trzymaj rękę na pulsie!

Formularz kontaktowyContact form