Generatorji umetnosti z umetno inteligenco so slabi za ustvarjanje netočnih upodobitev rok. Pomerimo se med Midjourney v5 in Dall-E 2, da vidimo, kateri je boljši.

Umetni generatorji umetnosti še naprej navdušujejo in nam omogočajo ustvarjanje skoraj vsega, kar si zamislimo. Vendar se zdi, da je tehnologija zadela zid, ko gre za ustvarjanje realističnih rok.

Tukaj si ogledamo dve vodilni aplikaciji za generativno umetnost in ju medsebojno pomerimo – ali iz roke v roko – da vidimo, katera lahko ustvari boljše roke, Midjourney v5 ali Dall-E 2. Je katera od teh aplikacij obvladala roke? Pa ugotovimo!

Težava AI z rokami

Odkar je umetnost, ustvarjena z umetno inteligenco, postala razširjena na internetu, je prišlo do kritik glede kakovost rok, ki jih nariše AI. Kljub nedavnim posodobitvam, kot je prikazano v naših vzporednih primerjavah, rezultati niso bili zadovoljivi.

Oba kandidata sta z vsako ponovitvijo izboljševala svoje zmogljivosti in kakovost rezultatov. Najnovejša posodobitev, Različica 5 Midjourneyja

, je pokazal impresiven napredek. Vendar problem z rokami, ki jih nariše AI, ostaja nerešen in ga ni mogoče prezreti.

Primerjava 1: Uporaba pozivov "Hand" in "Hands"

Naše primerjave bodo vsebovale popolnoma enake pozive za Dall-E 2 in Midjourney v5. Pozive bomo oblikovali tako, da bodo specifične za roke, namesto da bi preprosto ustvarili ljudi, ki bodo videli, kako izgledajo roke. Prav tako dajemo vsaki aplikaciji samo eno priložnost (vrti) za vsak poziv.

Roka

Začnimo z najbolj osnovnim in ustreznim pozivom: "roka".

Midjourney v5:

Dall-E 2:

Nismo dobro začeli!

Midjourney je ubral nenavadno pot povezovanja roke s precej ustvarjalnimi situacijami. Namesto da bi se osredotočili samo na roko, vidimo čarovnika, rokavice, okostnjak in majhno figurico. Tudi na sliki rokavic manjka prst.

Dall-E 2 ima nasprotni pristop in nam ponuja samo eno roko na preprostem ozadju. Toda nenavadno je, da obstajajo čudne drže, zlasti s palci, ki niso videti naravne ali udobne. Vsaka roka je tudi odrezana na eni od strani podob.

Kdo zmaga v tem krogu? Dali ga bomo Dall-E 2 zaradi splošne natančnosti.

Roke

Zdaj pa naredimo takojšnjo množino, "roke", in poglejmo, kaj je izumil AI.

Midjourney v5:

Dall-E 2:

Midjourneyev poskus z "rokami" se je tokrat bolje izkazal. Toda vse štiri slike so črno-bele in imamo nekaj manjkajočih prstov. Ob natančnejšem pregledu lahko vidite tudi, da so nekatere števke nenavadne oblike ali se spreminjajo ena v drugo.

Dall-E 2 še naprej prikazuje roke z navadnim ozadjem. Ni manjkajočih števk, vendar so roke na tretji sliki obrezane, druge različice pa se zdijo nekako okorne v kompoziciji in jim primanjkuje ustvarjalnosti.

Recimo tej primerjavi remi. Dall-E 2 bi zmagal glede natančnosti, če bi bil to edini dejavnik, vendar Midjourney uspe ustvariti nekaj čudovite podobe v črno-belih izvedbah, čeprav vse štiri različice niso zelo realističen.

Vedno lahko uporabite Photoshop, da popravite svojo Midjouneyjevo umetnost, vključno z rokami.

Primerjava 2: Kretnje rok

Primerjajmo nekaj potez rok, ki so skoraj povsod priznane.

Držim pesti

Najprej poskusimo "držati pesti".

Midjourney v5:

Dall-E 2:

Varno lahko rečemo, da je Midjourney popolnoma pokvaril ta poziv. Pogrešamo prste in nobena različica sploh ne izgleda naravno.

Še enkrat kapo dol Dall-E 2 za pravilno štetje prstov, vendar je to edina dobra novica. Vsaka različica je videti, kot da prsti zasedajo svoje položaje joge v igri Twister.

V tej primerjavi ni zmagovalca.

Všeč mi je

Naprej gremo s "palcem gor".

Midjourney v5:

Dall-E 2:

Midjourney poskrbi za pravilno štetje prstov, medtem ko vsak poziv obravnava na kreativen način. Opazite uvedbo ilustrativnega sloga?

Dall-E 2 prav tako dobi točke za natančnost, medtem ko ne poskuša pretresti čolna s čimer koli kreativnim dodatkom vsakemu rezultatu.

Tukaj ni jasnega zmagovalca.

Primerjava 3: Roke s predmeti

Zdaj bomo povečali kompleksnost tako, da bomo roke spodbudili k interakciji s predmeti.

Roka, ki drži kristalno kroglo

Začnimo z naključnim predmetom z uporabo poziva "roka drži kristalno kroglo".

Midjourney v5:

Dall-E 2:

Ko stopnjujemo kompleksnost, začne Midjourney sijati. Poleg nekaj upodobitev, ki so videti nenaravno, so roke in kristalne krogle videti čudovite. Midjourney si vzame čas celo za ustvarjanje odsevov v steklu, ki zagotovo prispevajo k splošni ustvarjalnosti.

Toda prvič vidimo, da Dall-E 2 manjka številka v vsaj eni od rok, pri čemer je četrta kombinacija videti preprosto čudna. Kristalne krogle tudi ne izgledajo tako impresivno v primerjavi z Midjourneyjevimi.

Midjourney doseže svojo prvo zmago.

Roka, ki drži vodo

Poskusimo nekaj še bolj zapletenega s pozivom "roka drži vodo".

Midjourney v5:

Dall-E 2:

Midjourney uspe zavrteti samo eno sliko s pravilnim številom števk. Čeprav je lepo upodobljeno, spet začnemo opažati razpoke v oddelku verodostojnosti.

Tudi Dall-E 2 ima težave z doseganjem naravnih rok, vendar delo opravi veliko bolje. Preklopi tudi barvo v ozadju za nekaj raznolikosti.

Ta krog bomo dali Dall-E 2.

Primerjava 4: Delovne roke

Za to primerjavo bomo ustvarili pozive, ki bodo imeli vpletene roke v dejavnosti.

Glina za ročno oblikovanje

Poglejmo, kako se modeli AI obnesejo z "ročno oblikovanje gline".

Midjourney v5:

Dall-E 2:

Midjourney je zgrešil prst na dveh slikah, vendar je vse ostalo videti super.

Slike Dall-E 2 so videti zmedene in natrpane, saj so v polovici različic dodane roke druge osebe.

Rob gre do Midjourneyja.

Ročno stiskanje testa

Poskusimo podobno dejavnost, »ročno stiskanje testa«.

Midjourney v5:

Dall-E 2:

Slike Midjourneyja so na splošno videti odlično. Ampak še enkrat, polovici manjkajo števke. Toda slikam ni mogoče očitati umetniškega stila.

Tudi v različicah Dall-E 2 manjkajo prsti v polovici izročitev in celo dodajo enega zadnji roki v nizu.

Recimo temu žreb.

Če želite te primerjave preizkusiti sami, vam jih pokažemo kako uporabiti Midjourney za ustvarjanje umetnosti AI.

Kaj nam povedo rezultati?

Zabavno je delati primerjave in določiti skupnega zmagovalca. In če bi morali izbirati, bi se odločili za Midjourney v5. Čeprav je Dall-E 2 pogosteje ustvarjal roke s pravilnim številom prstov, je bil Midjourney tisti, ki je ustvaril bolj umetniško upodobljene in privlačne slike.

Toda obe aplikaciji imata mesto na trgu za umetnike, ki slike Dall-E 2 in Midjourney spremenijo v svoje delo. Oba sta sposobna ustvariti roke, ki se lahko uporabljajo kot izrezki ali v kompozitih za umetniško, uredniško in komercialno uporabo. To je le stvar osebnih preferenc.

AI bo sčasoma osvojil roke

Generativne umetniške aplikacije, kot sta Dall-E 2 in Midjourney, so daleč napredovale pri ustvarjanju realistične in fantastične umetnosti. Še vedno imajo težave z ustvarjanjem rok, a glede na pospešek generativne tehnologije lahko pričakujemo izboljšanje le v bližnji prihodnosti.