Mesterséges intelligencia – képgenerátorok és képszerkesztők webdesignerek számára

Bejegyzésünkben a legnépszerűbb AI alapú képgenerátorokat mutatjuk be, felsorolva a webdesigner munkában hasznosítható funkcióikat, jellemzőiket.

Előző bejegyzésünkben alaposan körbejártuk a mesterséges intelligencia alapú képgenerálás mibenlétét, több fogalmat is tisztáztunk, rámutattunk a diffúziós modell lényegére és a promptolás mesterségére, és felsoroltuk azt, hogy milyen előnyei vannak a mesterséges intelligencia alapú képgenerálásnak a webdesigner/weboldalkészítő munkánk során.

Ha még nem olvastad el ezt a bejegyzésünket, mindenképpen tedd meg, hogy képbe kerülj! >>>

A képgenerátorok alapvető működésének megismerése után ebben a bejegyzésünkben a jelenleg legnépszerűbb/legismertebb mesterséges intelligencia alapú képgenerátorokat vesszük sorra, de hasznos képszerkesztő programokat is bemutatunk.

Hogyan hasznosíthatók az AI alapú képgenerátorok egy webdesigner számára?

#Weboldalakhoz és grafikai anyagokhoz egyaránt készíthetünk velük különféle vizuális tartalmakat.

#A „szavainkból” fotót generálnak. A képgenerátorok „text to image” elven működnek, vagyis szöveges parancsokat adunk meg számukra, és ezekből hoznak létre képeket. A képgenerátorok kóddá, pontosabban számsorozattá alakítják a kapott bemenetet, a promptot, azaz „lefordítják” a szöveget számukra értelmezhető kódokká, és a kódok alapján készítik el a képet.

#Az általunk megadott paraméterek (pl.: fő téma, médium, környezet, stílus, kompozíció, színek, képarány) alapján hozzák létre a fotókat.

#Gyorsan dolgoznak.

#Olyan fotót generálnak, ami (nagy valószínűséggel) nem jön máshol szembe. Hozzátesszük: Ugyanaz a prompt két nagyon különböző, de akár azonos kimenetet is adhat.

#Egyedi stílusú fotókat tudnak generálni. Az AI rengeteg képet, stílust látott, konkrét művészektől is, tehát a stílusok mindegyikét jól ismeri. Adott stílusnak 100% hűen megfelelő, igazán látványos fotók generálására képesek szinte bármilyen témában.

#Továbbá különbséget tudnak tenni egy kép tartalma és egy kép stílusa között, így egy adott kép tartalmának a megőrzése mellett arra a képre rá tudják „húzni” egy másik kép stílusát, annak a stílusnak a jellegzetes jegyeit. Ez az ún. NST, vagyis a Neural Style Transfer, azaz a neurális stílusátvitel, mely egy olyan módszer, amely két fotó – egy tartalomkép és egy stíluskép – jellemzőit vegyíti össze egy harmadik, generált kép létrehozásához. A tartalomkép az az alap, amely meghatározza a generált fotó kompozícióját és alapvető szerkezetét, míg a stíluskép a vizuális stílusát, mintázatait és textúráit adja hozzá. A generált kép a két forrás egyesítéséből jön létre, úgy, hogy a tartalomkép felismerhető marad, de a stíluskép vizuális elemeivel van átdolgozva. Gyakorlatilag egy új alkotás jön létre.

#Ugyanahhoz a témához, de akár különböző tartalmi elemekkel azonos stílusú képsorozatot képesek készíteni (például webshop esetében termékfotók; weboldalon ikonok/illusztrációk).

#De a különféle stílusok között is tudnak ugrálni, tehát egy adott témát el tudnak például rajzos stílusban és fotórealisztikus stílusban is készíteni.

#Arra is képesek, hogy egy adott műalkotás hogyan nézne ki, ha napjainkban készülne (pl. Mona Lisa modern verzióban).

#Több méretben és adott képaránynak megfelelően generálják le a képeket.

#A képgenerátorok egy része generatív kitöltésre is alkalmas, azaz a fotót minden irányba kiegészíti általa gondolt „folytatással”, tehát a képen szereplő elemekhez, részekhez illő tartalmakkal tölti ki a hozzáadott tereket, vagy ha a legenerált fotón kijelölünk egy adott objektumot, akkor azt másra, az általunk megadott objektumra cseréli (természetesen pontosan körbeírhatjuk, hogy milyen legyen az új objektum – pl. a „messzeségben” látható vár helyett világítótorony legyen a képen, ez a világítótorony így és így nézzen ki, ez a világítótorony legyen a kép fókusza, stb).

#A legenerált kép tovább skálázható, tehát például nagyobb méretben is legeneráltathatjuk, vagy akár a minőségének javítását is kérhetjük a generátortól.

#Ha az adott képgenerátor egyszerre több funkcióval is bír (egyelőre ritka), akkor fotók szerkesztéséhez, retusálásához is jól kihasználható.

#(Egyelőre) korlátozottan, de a képgenerátorok egy részébe meglévő fotó feltölthető, és a képgenerátorral átalakítható. A legtöbb esetben azonban új kompozíciót hoz létre a meglévő helyett. Inkább csak nagyon általános iránymutatásokkal működik a képszerkesztés, viszont így nem biztos, hogy a kívánt végeredményt kapjuk.

#Ingyen vagy nagyon kedvező előfizetési díjon készíthetünk egyedi fotókat.


Érdemes többféle AI alapú képgenerátort kipróbálni, mert mindegyik egy kicsit mást ad, más „stílusban” dolgozik, de biztosan megtaláljuk közöttük a kedvencünket/kedvenceinket. Ugyanarra a promptra más-más eredményt adnak, az egyik lehet, hogy művészibb, a másik lehet, hogy kissé műhatású eredményt ad, tehát nagyon érződik rajta, hogy mesterséges intelligenciával készült, egy harmadik pedig tökéletes valósághű fotót generál. És gyakori, hogy egyik-másik generátor hibás kimenetet ad (pl. egy konkrét márkájú terméket máshogyan ábrázol, mint ahogyan az a valóságban létezik).

Szemléltetésként ugyanazt a promptot adtuk meg négy különböző képgenerátornak (mindegyik 4 verziót generál le), és generátoronként eltérő eredmények születtek. : )

Prompt: In a sunlit garden, a joyful puppy chases a delicate butterfly amidst vibrant flowers. Their playful dance captures the essence of nature’s spontaneous joys and innocence.

Tengr.ai

Midjourney

Adobe Firefly

Leonardo.Ai


Szinte mindegyik ilyen alkalmazás bemutat mások által generáltatott képeket (általában „Explore” lehetőség alatt találjuk meg őket), melyek remek inspirációk lehetnek, és (ha vannak) a hozzájuk tartozó promptot is átnézhetjük, ötletet meríthetünk belőlük a saját promptjainkhoz.

Képszerkesztők vs. képgenerátorok

Nem mehetünk el szó nélkül az olyan képszerkesztők mellett sem, melyek szintén AI alapon működnek, vagy olyan alkalmazások, melyekben megjelentek AI alapú funkciók. Ezeknek a programoknak is nagy hasznát tudja venni a munkája során egy webdesigner is.

Ezeknek a programoknak tehát nem a képgenerálás a fő profiljuk, hanem a képekkel kapcsolatos különböző szerkesztésekre vannak specializálódva, mint például: méretezés, minőségjavítás, zajcsökkentés, színkorrekció, fényerő és kontraszt beállítása, élesítés, háttéreltávolítás, háttérelmosás, objektumok kiválasztása és pontos kijelölése, nem odavaló elemek eltávolítása, szűrők/filterek/effektek alkalmazása, generatív kitöltés/kiterjesztés.

És akkor itt álljunk is meg egy szóra: A képgenerálást és a képszerkesztést mint tevékenységeket meg kell különböztetnünk, mert egy „csak” képgeneráló eszköz nem feltétlenül lesz alkalmas a képszerkesztésre is. A képgenerátorok többsége a képgenerálásban profi, de a szerkesztésben viszonylag korlátozottak, mivel diffúziós modellként működnek, és kifejezetten arra vannak kitalálva, hogy új képeket hozzanak létre a szöveges parancsok alapján.

Tehát minden képalkotási folyamatot nem tudunk egyetlen eszközzel elvégezni. Ha egy képgenerátorral készült képről például el szeretnénk tüntetni egy elemet, akkor arra nem maga a képgenerátor lesz az ideális eszköz, hanem sokkal inkább egy olyan eszköz, mely képszerkesztésben profi (ilyen például a Photoshop vagy a Lightroom program). Érdemes tehát többféle eszközt, programot ismerni, használni, kombinálni őket a képalkotási folyamatok során.

Népszerű mesterséges intelligencia alapú képgenerátorok

FIGYELEM! Az itt leírt jellemzők, paraméterek, működési technikák a bejegyzés írásakor érvényesek! A programok, a funkcióik, az elérésük folyamatosan változhat.

Midjourney

  • Előfizetéses verzióban érhető el.
  • Fiókregisztrációt követően az ún. Discord szerveren tudjuk használni. Azért van szükség külön szerverre, mert ez az alkalmazás (mint például egy videójáték is) nagy rendszerigényű. A Discord egy ingyenes VoIP-alkalmazás és digitális terjesztési platform, amelyet legfőképp videójáték-közösségek számára terveztek, de nem zár ki semmilyen más témájú közösséget sem. A Discordot úgy tervezték, hogy nagy rendszerigényű programok (mint például videójátékok, vagy éppen mesterséges intelligencia alapú programok) futtatása mellett is gördülékenyen lehessen használni. 
  • Jelenleg a legprofibb, legigényesebb, legfotorealisztikusabb és legművészibb eredményeket adja, ugyanakkor a legnehezebb promptolni.
  • Egy prompt alapján egyszerre 4 fotót generál le. A kiválasztott fotó felskálázható, azaz lehet rajta finomítani, hogy még jobb/szebb/fotorealisztikusabb legyen, a kiválasztott fotóból variációk kérhetők (4 variációt készít), és az adott fotóból további változtatott fotók is lekérhetők. Mind a felskálázás, mind a „variális” mértéke szabályozható (finom/erős).
  • Az elkészült fotók közvetlenül is letölthetők, de a Midjourney fiókunkban is megtaláljuk őket, ahonnan szintén letölthetők.
  • Nem tanítható fel saját fotókkal (tehát arra nem képes, hogy például 20 termékfotót feltöltünk és arra kérjük, hogy tanulja meg ezeket, az adott terméket különböző környezetekbe ágyazza be, stb).

DALL•E

  • Az OpenAI (mesterséges intelligenciával foglalkozó kutatólabor) saját fejlesztése, a chatGPT (szintén az OpenAI fejlesztése) előfizetéses verziójában érhető el. Magát a képgenerátort a GPT-k között találjuk meg.
  • Előre kiválaszthatjuk, hogy milyen stílusban (pl. cukorka, nemezelt, goblein, madártávlat, 3D drótváz) szeretnénk legeneráltatni a fotót, inspirációkat is kapunk hozzájuk. A képarányt (pl. szélesvásznú) is megadhatjuk, így azt már nem kell a promptba írni.
  • Nagyon jól érti a promptjainkat, hiszen a chatGPT áll mögötte, és az segít neki elmagyarázni, hogy mit szeretnénk.
  • Egyszerre két képet generál le, melyek módosíthatók.
  • Feltöltött és legenerált képen egyaránt kijelölhető egy adott rész, és megadható, hogy oda mit helyezzen el, illetve egy adott objektum/elem is kijelölhető, és megadható, hogy mire cserélje, és az új objektum paramétereit (hogyan nézzen ki, erre irányuljon a kép fókusza, stb) is leírhatjuk.
  • Nem tanítható fel saját fotókkal.
  • Érdekesség: A Microsoft Copilot képgenerátor alkalmazása mögött is a DALLE•E működik.

Leonardo.Ai

  • Fiókregisztrációhoz kötött, ingyenes és előfizetéses verzióban is elérhető.
  • Az ingyenes verzióban naponta 150 token áll rendelkezésünkre a képek generálására, azok esetleges módosítására (pl. képrészletek cseréje, kép kiegészítése stb.). Az előfizetéses verzióban az adott csomagtól függően 8.000/25.000/60.000 token áll rendelkezésünkre.
  • A generátorral képek, mozgóképek, rajz alapján történő kép generálására, a generált képek szerkesztésére van lehetőség.
  • A képek generálása/szerkesztése prompt alapján átlagosan kb. 14 tokent, a mozgóképek kb. 25 tokent vesznek igénybe, a képek szerkesztése promptonként szintén kb. 14 tokent igényelnek.
  • A generálni kívánt fotók stílusa, tájolása, mérete, valamint a generálni kívánt fotók száma (1-8 – az ingyenes verzióban max. 4 fotó készíthető) is tetszőlegesen módosítható. Akár negatív prompt is megadható, azaz az, hogy mi ne szerepeljen a generálni kívánt képeken.
  • Két generálási módja is van:
    • „gyors” – a gyorsmód használatával sokkal gyorsabban (kb. 20 másodperc alatt) hozhatunk létre képeket, azonban ez a mód a minőség csökkenésével járhat, ellenben így is remek minőségű fotók készülnek
    • „minőségi” – ebben a módban a képgenerálási idő hosszabb, a fotók minősége viszont tökéletesebb – ez a mód csak előfizetéses verzióban érhető el
  • A generált képek szerkesztésekor egy „maszk”, egy „AI vászon” segítségével ki tudjuk jelölni a módosítani kívánt részletet, majd egy szöveges prompt alapján tudjuk megadni, hogy mit szeretnénk változtatni. A prompt alapján (beállítástól függően 1-8 elemet (az ingyenes verzióban max. 4) generál) kiválaszthatjuk a számunkra megfelelő elemet.
  • Extra funkciója: a „Generate motion video” funkcióval életre tudja kelteni a legenerált képet egy néhány másodperces videó erejéig – ez 25 tokent vesz igénybe.

Tengr.ai

  • Magyar fejlesztés. : )
  • Magyar nyelven is használható, nagyon egyszerű, átlátható felülete van.
  • Magyar nyelvű promptot is megadhatunk.
  • Napi 100 legenerált képig ingyenesen használható, a képek 2 hétig kerülnek megőrzésre, letölthetők.
  • A prompt mellett előre megadhatók paraméterek, mint stílus (pl. fotografikus, horror, ólomüveg, absztrakt tinta), kreativitás (ennek mértéke szabályozható 1-től 5-ig; 1 = ihlettelen, 5 = burjánzó), részletek (ennek mértéke is szabályozható 1-től 5-ig; 1 = minimalista, 5 = díszített) , képarány (pl. 1:1, 1024 x 1024 px).
  • Egyszerre 4 verziót készít. A kiválasztott fotó felskálázható.

Adobe Firefly

  • Az Adobe saját alkalmazása, az Adobe fiókban érthető el.
  • Az „Összes alkalmazás” előfizetési csomagban havi 1000 kredit használható fel – egy prompt alapján történő 4 kép generálása 15 kreditet vett igénybe.
  • Az ingyenes verzió havi 25 kreditet biztosít.
  • A generálandó fotók tájolása, a tartalom típusa Művészet/Fénykép stílusban választható, továbbá több struktúra, stílus, effekt közül lehet választani, a szín és a tónus, a megvilágítás és a fényképezés szöge is beállítható.
  • Egyszerre 4 képet generál, a legenerált képek nézete is tetszés szerint módosítható annak függvényében, hogy egy/két sorban szeretnénk látni őket.
  • A képgeneráláson kívül generatív kitöltésre és generatív kibővítésre is használható:
    • A generatív kibővítés során egy fotót annak elemeivel egészíti ki, folytatja – az adott prompt vagy a feltöltött fotó alapján 3 kiterjesztett változatot generál. Tehát a prompt megadása sem kötelező, elég feltölteni a képet, és az „elvágott” részeket tökéletesen kiegészíti. Ez a funkció tehát elemek hozzáadására és eltávolítására is alkalmas.
    • A generatív kitöltés során a kép adott részei tetszés szerint módosíthatók a megadott prompt vagy a feltöltött fotón kijelölt rész alapján. Például ha egy ember karját módosítjuk, és annak kijelölése után prompt megadása nélkül is tudja az alkalmazás, hogy oda egy kart kell generálnia.
  • Saját fotó módosítására, több kép kombinálására is ad lehetőséget.
  • Nem tanítható fel saját fotókkal.
  • Más Adobe alkalmazásokkal is együttműködik:
    • A Photoshop programban már elérhető Generatív kitöltés eszköz, mely az Adobe Firefly Image 3 modellre épül.
    • Egyszerű szöveges promptok beírásával generálhatunk méretezhető, szerkeszthető vektorgrafikákat az Adobe Illustrator alkalmazásban az Adobe Firefly Generatív mesterséges intelligencia technológia segítségével.
    • A Lightroom program Generatív eltávolítási funkcióját is az Adobe Firefly biztosítja.
    • Az Adobe Firefly Szövegből kép funkciójával pedig az InDesignb kiadványszerkesztő programban készíthetünk képeket közvetlenül a kiadványba.

Stable Diffusion

  • Nyílt forráskódú generátor, a stability.ai különböző eszközeiben érhető el, de más fejlesztők is fejlesztettek le rá alkalmazásokat (pl. Lensa mobilalkalmazás).
  • Regisztrációt követően API kulcs szükséges a használatához.
  • Egy chatbottal, a Stable Assistant-al dolgozhatunk.
  • Generatív kitöltésre és kibővítésre, háttéreltávolításra, stílusok közötti váltásra, felskálázásokra/finomhangolásokra, rajzolásra (fotóból rajz) egyaránt képes.
  • Saját fotó módosítására, több kép kombinálására is ad lehetőséget.
  • Például a Lensa mobilalkalmazás képes arra, hogy feltöltött/elkészített fotókat „megtanuljon”, azokat különböző kontextusokba „dolgozza be”.

Playground

  • Képgenerátor és képszerkesztő is egyben – többek között arra is ad lehetőséget, hogy egy meglévő kép kijelölt részeit újrageneráljuk.
  • Az ingyenes verzióban napi 50 token áll rendelkezésünkre, amit képgenerálásra használhatunk.
  • A Stable Diffusion XL modell is elérhető benne.
  • Számtalan előre megadott filter közül válogathatunk. Kiválaszthatjuk, hogy milyen méretben kívánjuk legeneráltatni az adott képet, valamint további képgenerálási beállításokra is van lehetőség. Az ingyenes verzió egyszerre 4 képet generál.
  • A legenerált fotók a generálást követően módosíthatók – például a kép kijelölt elemei módosíthatók, újragenerálhatók, a fotó átméretezhető, a generált fotó alapján ugyanabban a stílusban némi apró eltéréssel hasonló fotó generálható, a kép felskálázható, háttere eltávolítható.
  • A felhasználók által generált képek, illusztrációk és az azokhoz tartozó promptok is megtekinthetők, inspirációnak is remekül használhatók. A képekre, illusztrációkra témánként is szűrhetünk, valamint a kereső segítségével további témákra is kereshetünk.

A két nagy „óriás”, a Google és a Meta is fejleszti a saját mesterséges intelligencia alapú képgenerátorát.

Imagen – Google

Imagine – Meta


Szemléltetésként még egy példasorozat – egy prompt, többféle kimenet : )

Prompt: Product shot of a shampoo and conditioner set on a round pedestal, bright lighting, purple tones, stock photo style.

Adobe Firefly

Leonardo.Ai

Midjourney

Tengr.ai

Népszerű mesterséges intelligencia alapú funkciókkal felvértezett képszerkesztők

Adobe Photoshop

  • Jól felismeri az objektumokat, így precízen kijelöli őket.
  • Profin eltünteti a hátteret.
  • Generatív kitöltésre és kiterjesztésre/kibővítésre is képes – objektumok kicserélése, hiányzó elemek pótlása, fotó kibővítése.
  • Mesterséges intelligencia alapú filtereket is ad, melyek például retusálásra, méretezésre, stílusátvitelre alkalmasak.
Szemléltető példa generatív kitöltésre:
eredeti fotó
Vajon milyen tárgyat cseréltünk ki a fotón? ; )
Szemléltető példa generatív kiterjesztésre:
eredeti fotó
kibővített fotó

Adobe Lightroom

  • Rábízhatjuk a fotó szerkesztését, feljavítását – a saját belátása szerint szerkeszti a fotót.
  • Kézi kijelölgetések helyett egyszerűen megmondhatjuk neki, hogy válassza ki, jelölje ki az alanyt/a hátteret, stb. a fotón.
  • Ha nem komplex háttérrel van dolgunk, akkor a tartalomérzékény eltávolítás funkcióval a fotóról könnyedén, precízen eltávolíthatók oda nem illő/nem kívánatos elemek.
  • Minőségjavításhoz kapcsolódó zajszűrésben is profi.

Luminar neo

Egy univerzális képszerkesztő szoftver, lényegében az Adobe programok kombinációjának alternatívája. Portréretusálásra, kisebb elemek eltávolítására használatos eszköz.

Topaz Labs

Különféle szoftvereket tartalmaz, amelyek különböző területeken alkalmazhatók az utómunka során – például kisebb méretű fotók felnagyítása, zajcsökkentés, fotók élesítése, ezáltal az életlen, homályos, vagy éppen a „bemozdult” fotók is megmenthetők, feljavíthatók.

Fotor AI Photo Editor

Az előzőekben bemutatott eszközökhöz képest (még) nem annyira profi, azonban a fotók AI alapú korrekciójára, például színek korrekciójára, élesítésre, bőr retusálására, háttér eltávolítására tökéletesen alkalmas.

Pixlr AI Photo Editor

Online használható eszköz, amely szintén szuper AI alapú szerkesztéseket tesz lehetővé. Ilyen többek között a generatív kitöltés, kiterjesztés, valamint transzformáció, háttéreltávolítás, a kép minőségének feljavítása, zajcsökkentés, valamint arra is lehetőséget nyújt, hogy két fotó alanyának arcát “felcseréljük”, vagyis az egyik arcot a másikra illesszük.

Picsart AI Photo Editor

Az előző két oldalhoz hasonlóan a fotók minőségének javítására, generatív kiterjesztésre, háttér eltávolításra, háttér cseréjére alkalmas, továbbá különféle szűrők, filterek is a rendelkezésünkre állnak.

Melyiket AI alapú képgenerátort vagy képszerkesztőt próbáltad már?

Hozzászólás írása

Az e-mail-címet nem tesszük közzé.