Case study: Jak powstały grafiki do e-booka z pomocą AI i promptów?

Zobacz, jak powstały unikalne grafiki do e-booka z pomocą AI i dokładnie opracowanych promptów – krok po kroku, z narzędziami i praktycznymi wskazówkami.
15 lipca 2025
blog
Poziom: Średnio zaawansowany

Artykuł przeznaczony dla twórców e-booków i treści cyfrowych, marketerów oraz osób projektujących materiały edukacyjne, które chcą wykorzystać generatywne AI do tworzenia i wdrażania spójnych grafik.

Z tego artykułu dowiesz się

  • Jak dobrać narzędzia AI do generowania grafik, aby osiągnąć spójną estetykę e-booka?
  • Jak tworzyć i iteracyjnie udoskonalać prompty, by uzyskać grafiki zgodne z zamierzoną wizją?
  • Jak testować, selekcjonować i integrować wygenerowane obrazy z treścią e-booka, rozwiązując typowe problemy po drodze?

Wprowadzenie do projektu e-booka i potrzeby graficznej oprawy

Projekt e-booka, który stanowi przedmiot niniejszego case study, narodził się z potrzeby stworzenia nowoczesnej, angażującej publikacji cyfrowej, skierowanej do odbiorców zainteresowanych technologią i kreatywnością. Treść e-booka miała mieć charakter edukacyjno-informacyjny, ale równie istotne było zadbanie o jego oprawę wizualną – nie tylko w celu podniesienia atrakcyjności materiału, lecz także dla lepszego zilustrowania opisywanych zagadnień.

W dobie rosnącej roli sztucznej inteligencji oraz dostępności narzędzi do generowania treści wizualnych, naturalnym krokiem było przetestowanie potencjału AI w kontekście tworzenia grafik do publikacji. Zamiast tradycyjnej współpracy z grafikiem, postanowiono wykorzystać modele generatywne, które na podstawie odpowiednio skonstruowanych promptów (czyli opisów tekstowych) mogą wygenerować obrazy zgodne z założeniami estetycznymi i merytorycznymi projektu.

Potrzeba graficznej oprawy nie ograniczała się wyłącznie do walorów estetycznych. Ilustracje miały pełnić różnorodne funkcje, w tym:

  • Ułatwienie przyswajania wiedzy – poprzez wizualizację trudnych pojęć i procesów.
  • Podkreślenie tożsamości e-booka – dzięki spójnej i oryginalnej stylistyce graficznej.
  • Przyciągnięcie uwagi czytelnika – zwłaszcza w kanałach promocyjnych i mediach społecznościowych.

Wybór podejścia opartego na AI był również eksperymentem mającym na celu zbadanie, jak dalece da się wykorzystać generatywne modele obrazów w procesie twórczym, bez rezygnacji z kontroli nad jakością i spójnością finalnego produktu.

Wybór narzędzi AI do generowania grafik

Na etapie planowania e-booka, jednym z kluczowych elementów okazał się wybór odpowiednich narzędzi AI do tworzenia grafik. Zależało nam na osiągnięciu spójnej estetyki wizualnej, która jednocześnie byłaby dopasowana do charakteru i tematyki treści. Wybór narzędzi miał również wpływ na tempo pracy, możliwość iteracji oraz elastyczność w manipulowaniu stylem i detalami obrazów.

Rozważaliśmy kilka rozwiązań, koncentrując się głównie na dwóch popularnych grupach narzędzi: modelach tekst-na-obraz (text-to-image) oraz edytorach wspieranych przez sztuczną inteligencję. Do pierwszej kategorii należą takie systemy jak Midjourney, DALL·E czy Stable Diffusion, które generują obrazy na podstawie tekstowych promptów. To właśnie ta grupa narzędzi stała się trzonem naszego procesu twórczego.

Midjourney przyciągnął nas swoim charakterystycznym stylem i wysoką jakością generowanych ilustracji. Z kolei Stable Diffusion oferował większą kontrolę lokalną i możliwość dostosowania parametrów modeli, co miało znaczenie przy bardziej zaawansowanych iteracjach. DALL·E, rozwijany przez OpenAI, wykazał się dużą precyzją w interpretacji promptów, co okazało się przydatne przy tworzeniu bardziej opisowych wizualizacji.

Poza narzędziami generującymi obrazy od zera, rozważaliśmy również aplikacje umożliwiające edycję już istniejących grafik poprzez AI – takie jak Photoshop z funkcją generatywną czy RunwayML. Choć nie stanowiły one głównego źródła grafik, odegrały ważną rolę w końcowym szlifowaniu wygenerowanych obrazów.

Efektywny wybór narzędzi AI zależał więc od ich możliwości w kontekście oczekiwanych rezultatów wizualnych, szybkości działania oraz poziomu kontroli nad procesem generowania. Ostatecznie zdecydowaliśmy się na kombinację Midjourney i Stable Diffusion, co pozwoliło zbalansować kreatywną ekspresję z techniczną precyzją.

Proces tworzenia promptów: strategia i iteracje

Tworzenie grafik do e-booka przy użyciu sztucznej inteligencji wymagało przemyślanej strategii projektowania promptów — czyli tekstowych poleceń, które kierują modelem AI do wygenerowania konkretnego obrazu. Ten etap był kluczowy, ponieważ to właśnie jakość i precyzja promptów decydowały o tym, jak blisko zamierzonej wizji znajdzie się wygenerowana grafika.

Nasze podejście opierało się na iteracyjnym udoskonalaniu promptów. Zamiast oczekiwać idealnych wyników od razu, zaczynaliśmy od ogólnych opisów, które następnie były stopniowo doprecyzowywane. W rezultacie każda grafika powstawała w wyniku kilku cykli testów, oceny efektów oraz modyfikacji promptu.

Strategia tworzenia promptów

Podstawą naszej strategii było wyodrębnienie trzech głównych aspektów każdego promptu:

  • Styl wizualny – określał charakter ilustracji (np. minimalistyczny, retro, flat design).
  • Elementy sceny – wskazywały, co dokładnie ma się pojawić na grafice (np. postać, przedmiot, tło).
  • Nastrój i kolorystyka – nadawały ilustracjom odpowiedni klimat (np. ciepła paleta, melancholijny nastrój, pastelowe barwy).

Tabela poniżej przedstawia uproszczone porównanie dwóch wersji promptów dla tej samej koncepcji graficznej:

Iteracja Prompt Opis efektu
Wersja 1 "Person reading a book, digital art" Efekt zbyt ogólny, brak detali i spójnej estetyki
Wersja 2 "Young woman reading an open book at sunrise, in a minimalistic flat design style, warm color palette" Grafika zgodna z koncepcją e-booka: spójna kolorystyka i pożądany styl

Przykładowy prompt

"Futuristic city skyline at night, glowing neon lights, in the style of cyberpunk anime, detailed, high contrast"

Taki prompt zawiera zarówno stylistykę (cyberpunk anime), jak i konkretne elementy sceny (miasto nocą, neonowe światła), co pozwala AI lepiej zrozumieć oczekiwany rezultat.

Iteracyjna praca z promptami przypominała proces kreatywny znany z tradycyjnego projektowania graficznego – z tą różnicą, że ostateczny efekt zależał nie od umiejętności rysowania, lecz od precyzji języka i testowania wielu wariantów. Jeśli chcesz nauczyć się, jak wykorzystywać AI do tworzenia angażujących treści i wizualizacji, sprawdź Kurs AI Sztuczna inteligencja w biznesie - wykorzystanie zaawansowanych narzędzi AI przy tworzeniu treści, grafik i wizualizacji.

💡 Pro tip: Buduj prompt w szablonie: [styl] + [elementy sceny] + [nastrój/kolor], a w iteracjach zmieniaj tylko jeden składnik naraz, by precyzyjnie ocenić wpływ modyfikacji. Utrzymuj stały seed/aspect ratio i wersjonuj prompty, by porównywać wyniki i wracać do najlepszych wariantów.

Testowanie i selekcja wygenerowanych obrazów

Po wygenerowaniu dużej liczby grafik przy pomocy narzędzi AI, kluczowym etapem stało się ich przetestowanie i selekcja. Na tym poziomie istotne było nie tylko ocenienie estetyki obrazów, ale również ich zgodności z treścią e-booka, spójności stylistycznej i technicznej jakości.

Kryteria wyboru grafik

Aby ułatwić selekcję, przyjęto zestaw podstawowych kryteriów:

  • Spójność wizualna: Czy obraz pasuje stylistycznie do pozostałych ilustracji?
  • Zgodność z przekazem: Czy grafika wspiera lub ilustruje kluczowe idee z danej sekcji e-booka?
  • Jakość techniczna: Czy obraz jest wystarczająco ostry i pozbawiony artefaktów?
  • Uniwersalność: Czy obraz nie zawiera elementów kontrowersyjnych lub niezrozumiałych kulturowo?

Metody oceny

W celu sprawnego testowania wykorzystano zarówno ocenę subiektywną (feedback zespołu projektowego), jak i automatyczne metody filtrowania – np. analizę metadanych oraz rozdzielczości obrazów. Przykładowy fragment kodu w Pythonie, który wspierał automatyczną selekcję obrazów na podstawie ich rozmiarów:

from PIL import Image
import os

folder_path = 'generated_images/'
min_width, min_height = 1024, 768

for file in os.listdir(folder_path):
    if file.endswith(".png") or file.endswith(".jpg"):
        img = Image.open(os.path.join(folder_path, file))
        if img.width < min_width or img.height < min_height:
            print(f"{file} - za mała rozdzielczość")

Porównanie typów grafik

W procesie selekcji różnicowano też pomiędzy grafikami koncepcyjnymi, ilustracjami edukacyjnymi a ozdobnikami. Poniższa tabela podsumowuje ich zastosowanie i oczekiwania względem nich:

Typ grafiki Zastosowanie Wymagania jakościowe
Koncepcyjna Wprowadzenie do tematu rozdziału Wysoka kreatywność, symbolika
Edukacyjna Wsparcie treści merytorycznej Precyzja, czytelność
Ozdobna Estetyczne uatrakcyjnienie treści Spójność stylistyczna, lekkość

Efektem selekcji było wyłonienie zestawu obrazów, które w harmonijny sposób dopełniały strukturę e-booka, nie dominując nad treścią, lecz ją wspierając — zarówno wizualnie, jak i znaczeniowo.

💡 Pro tip: Utwórz checklistę z wagami (spójność, zgodność z przekazem, jakość techniczna) i porównuj obrazy w docelowej skali jako miniatury A/B. Równolegle automatycznie odrzucaj pliki poniżej progów (rozdzielczość, artefakty) skryptem i taguj wybrane według typu grafiki.

Integracja grafik z treścią e-booka

Po wygenerowaniu odpowiednich grafik za pomocą narzędzi AI, nadszedł kluczowy etap – ich integracja z treścią e-booka. Proces ten wymagał nie tylko dopasowania wizualnego, ale także przemyślanego osadzenia obrazów w strukturze publikacji, aby wspierały przekaz i ułatwiały odbiór materiału.

Grafiki podzielono na dwie główne kategorie:

  • Ilustracje tematyczne – generowane do konkretnych rozdziałów lub sekcji, służyły jako wprowadzenie wizualne do omawianych zagadnień.
  • Elementy dekoracyjne – takie jak ozdobniki, tła, ikony, które wzbogacały layout, ale nie niosły bezpośredniej treści.

Przykładowy podział zastosowań:

Zastosowanie Typ grafiki Format
Strona tytułowa Ilustracja koncepcyjna PNG, wysokiej rozdzielczości
Nagłówki rozdziałów Grafika tematyczna SVG / PNG
Marginesy / stopki Elementy dekoracyjne SVG

Do integracji grafik użyto prostych reguł CSS i HTML, zwłaszcza w przypadku e-booka w formacie EPUB oraz wersji webowej. Przykładowy fragment kodu HTML ilustrujący wstawienie ilustracji do sekcji rozdziału:

<div class="chapter-intro">
  <img src="images/rozdzial1-ilustracja.png" alt="Ilustracja rozdziału 1" />
  <h2>Rozdział 1: Wprowadzenie do tematu</h2>
</div>

Istotnym elementem było także odpowiednie skalowanie i kompresja plików graficznych, aby nie obciążać pliku e-booka i zapewnić jego kompatybilność z różnymi czytnikami. Zastosowano narzędzia do optymalizacji, takie jak TinyPNG oraz konwersję do różnych formatów zależnie od docelowej platformy.

W kolejnych krokach skupiono się na technicznej i estetycznej spójności – zarówno pod kątem kolorystyki, jak i układu. Integracja grafik nie była więc tylko mechanicznym osadzaniem obrazów, ale świadomym projektowaniem doświadczenia czytelnika. Jeśli chcesz zgłębić temat pracy z AI i promptami, sprawdź Kurs AI Sztuczna inteligencja i GPT w praktyce. Prompt Engineering.

Wyzwania i rozwiązania napotkane podczas procesu

Tworzenie grafik do e-booka z pomocą narzędzi AI okazało się procesem kreatywnym, ale pełnym nieoczekiwanych trudności. Od technicznych ograniczeń modeli generatywnych, przez kwestie związane z estetyką i spójnością wizualną, aż po wyzwania organizacyjne — każdy etap wymagał dostosowania strategii i szukania alternatywnych rozwiązań.

1. Niekonsekwencja stylu graficznego

Jednym z głównych problemów był brak spójności stylistycznej między poszczególnymi grafikami generowanymi przez AI. Nawet przy użyciu podobnych promptów, modele potrafiły tworzyć obrazy o różnym nasyceniu kolorów, detalach czy perspektywie.

Rozwiązanie: Wprowadziliśmy szablonowy system promptów oraz stosowaliśmy predefiniowane style (np. "digital watercolor", "flat vector art"), co pomogło ujednolicić wygląd ilustracji.

2. Niewłaściwa interpretacja promptów

Modele AI często nieprawidłowo interpretowały złożone lub zbyt ogólne opisy. Efektem były obrazy odbiegające od oczekiwań, np. zawierające błędne proporcje postaci czy nieadekwatne tło.

Rozwiązanie: Zaczęliśmy stosować bardziej strukturalne promptowanie, np.:

"A minimalistic flat illustration of a woman reading a book under a tree, pastel color palette, centered composition"

Klarowny i uporządkowany opis znacząco zwiększył trafność wyników.

3. Ograniczenia techniczne modeli

Niektóre silniki AI miały trudności z generowaniem skomplikowanych układów kompozycyjnych lub precyzyjnych detali, np. tekstów w grafice.

Rozwiązanie: Korzystaliśmy z kilku różnych modeli naraz (np. Midjourney i DALL·E), wybierając ten, który najlepiej radził sobie z danym zadaniem. W przypadku tekstów w obrazach — dopisywaliśmy je później w edytorach graficznych.

4. Wysokie zużycie czasu przy iteracji

Każda grafika wymagała wielu prób — nawet kilkunastu wersji na jedno ujęcie. Proces ten był czasochłonny i trudny do zautomatyzowania.

Rozwiązanie: Wprowadzono system tagowania i porównywania wyników w arkuszu kalkulacyjnym, co pomogło szybko identyfikować najlepsze iteracje i ograniczyć liczbę zbędnych wygenerowań.

5. Dopasowanie grafik do treści e-booka

Nawet dobrze wygenerowane obrazy nie zawsze pasowały kontekstowo do konkretnego rozdziału lub fragmentu tekstu.

Rozwiązanie: Stosowaliśmy technikę reverse prompt engineering — analizowaliśmy wygenerowane obrazy i modyfikowaliśmy teksty e-booka tak, aby współgrały z grafikami lub odwrotnie, zależnie od priorytetu.

Podsumowanie wyzwań i rozwiązań

Wyzwanie Zastosowane rozwiązanie
Niespójny styl Szablonowe promptowanie i określone style
Błędna interpretacja promptów Strukturalne i precyzyjne opisy
Ograniczenia AI Dobór odpowiedniego modelu do zadania
Długi czas iteracji System tagowania i selekcji
Brak dopasowania do treści Reverse prompt engineering

Każde z tych wyzwań nauczyło nas większej uważności w pracy z generatywnymi narzędziami oraz zaprocentowało lepszym zrozumieniem ich ograniczeń i potencjału.

Efekty końcowe i wnioski z realizacji projektu

Stworzenie graficznej oprawy do e-booka z pomocą sztucznej inteligencji okazało się nie tylko efektywne czasowo, ale również inspirujące pod względem kreatywnym. Dzięki zastosowaniu odpowiednich narzędzi i przemyślanych promptów udało się osiągnąć estetyczny i spójny wizualnie rezultat, który wzmocnił przekaz książki i podniósł jej wartość użytkową.

Efektem końcowym było kilkadziesiąt grafik idealnie dopasowanych do poszczególnych rozdziałów e-booka — od ilustracji koncepcyjnych, przez diagramy, aż po metaforyczne wizualizacje pojęć. Ich styl graficzny został ujednolicony dzięki jednolitym parametrom generowania, a całość wpisywała się w estetykę marki autora.

Wnioski płynące z realizacji projektu można podsumować w kilku kluczowych punktach:

  • AI jako wsparcie kreatywności: Narzędzia oparte na sztucznej inteligencji nie zastępują projektanta, ale stanowią jego wydajne i elastyczne narzędzie wspomagające proces twórczy.
  • Znaczenie dobrze sformułowanego promptu: Jakość i trafność wygenerowanych obrazów były wprost proporcjonalne do precyzji poleceń. Nawet drobne zmiany w promptach miały znaczący wpływ na końcowy rezultat.
  • Oszczędność czasu i zasobów: Proces, który tradycyjnie zajmowałby tygodnie pracy grafików, został zredukowany do kilku dni intensywnej, ale zoptymalizowanej pracy koncepcyjnej i selekcyjnej.
  • Elastyczność i iteracyjność: Możliwość generowania wielu wariantów tej samej koncepcji pozwoliła na szybkie testowanie różnych estetyk oraz wybór najlepszej wersji bez konieczności tworzenia jej od zera.

Podsumowując, zastosowanie AI w procesie tworzenia grafik do e-booka nie tylko skróciło czas realizacji projektu, ale również otworzyło nowe perspektywy dla twórców treści cyfrowych, pokazując, że technologia może skutecznie wspierać zarówno funkcjonalność, jak i walory artystyczne publikacji.

Podsumowanie i praktyczne wskazówki na zakończenie

Projekt stworzenia grafik do e-booka z wykorzystaniem sztucznej inteligencji okazał się nie tylko efektywny, ale również inspirujący. Połączenie nowoczesnych narzędzi AI z kreatywnym podejściem do tworzenia promptów pozwoliło wygenerować unikalną oprawę wizualną, która wzbogaciła przekaz treści.

Na zakończenie warto podkreślić kilka kluczowych wniosków, które mogą okazać się przydatne dla osób planujących podobne działania:

  • Zdefiniuj cel grafik – zanim rozpoczniesz pracę, określ funkcję ilustracji: czy mają wspierać zrozumienie treści, przyciągać uwagę, czy budować nastrój.
  • Przetestuj różne style wizualne – zanim zdecydujesz się na jeden kierunek, warto sprawdzić kilka stylistyk, by zobaczyć, która najlepiej pasuje do charakteru e-booka.
  • Ustal spójność wizualną – nawet przy użyciu AI dobrze jest przygotować zestaw wytycznych (np. paleta kolorów, format, kompozycja), które pomogą utrzymać spójność między ilustracjami.
  • Planuj iteracje – rzadko udaje się uzyskać idealny efekt przy pierwszym podejściu. Podejdź do procesu eksperymentalnie i zostaw przestrzeń na poprawki.
  • Zabezpiecz czas na selekcję i edycję – wygenerowane obrazy mogą wymagać adaptacji lub odrzucenia. Warto przewidzieć czas na ich końcowy wybór i ewentualne poprawki manualne.

Współpraca z AI nie tylko przyspiesza proces tworzenia grafik, ale również otwiera nowe możliwości twórcze. Z odpowiednim podejściem i jasno określonymi celami można osiągnąć satysfakcjonujące rezultaty, które wzbogacą każdy projekt cyfrowy.

icon

Formularz kontaktowyContact form

Imię *Name
NazwiskoSurname
Adres e-mail *E-mail address
Telefon *Phone number
UwagiComments