Czytaj

Czy MidJourney radzi sobie z generowaniem spójnych postaci? Testujemy

Testujemy nową funkcję w MidJourney – spójność generowanych postaci. Czy narzędzie radzi sobie z realistycznym odzwierciedlaniem znanych osób? Sprawdzamy!

Publikacja:

August 19, 2024

Aktualizacja:

October 16, 2024

Ten materiał powstał zarówno w wersji pisanej, jak i filmowej. Obejrzyj film na naszym kanale Beyond AI, lub przejdź do lektury. Dzięki!

Obejrzyj ten materiał na YouTube:

Wstęp

Cześć, jestem Ziemek i dzisiaj podzielę się moimi pierwszymi wrażeniami z nowej funkcji w Midjourney, która zapewnia spójność generowanych postaci. Opowiem co działa, co nie działa i jakie są moje wnioski.

Czym jest Midjourney?

Midjourney to narzędzie generatywne sztucznej inteligencji, które służy do generowania obrazów. Wystarczy opisać, co chcemy, żeby znalazło się na zdjęciu, bądź wygenerowanym obrazku, a sztuczna inteligencja to stworzy.

To są przykłady pokazujące, co użytkownicy w ostatnim czasie stworzyli:

Spójność generowanych postaci

Do tej pory istniał problem z generowaniem kilku takich samych postaci — za każdym razem na nowym obrazku pojawiała się nowa, inna twarz. Teraz to się zmieniło.

Zacznę od pokazania przykładu, kiedy to działa bardzo dobrze. Poprosiłem Midjourney o wygenerowanie zdjęcia twarzy wojownika.

Spodobała mi się twarz numer 2, więc poprosiłem, żeby ją powiększył.

W momencie powiększenia wystarczy kliknąć na "Open in Browser", skopiować adres URL i w następnych instrukcjach mogę już używać tego adresu jako referencji — takiego klucza, który podaje się w części instrukcji.

Stwierdziłem, że będzie ciekawie zobaczyć, w jaki sposób Midjourney wygeneruje obrazek pokazujący tego wojownika na rowerze w Warszawie. W związku z tym wykonałem prompt, w którym było napisane "man riding on bicycle in the heart of Warsaw", a jako parametr --cref podałem adres URL, który przed chwilą skopiowałem z przeglądarki.

Widzimy, że to rzeczywiście jest ten sam wojownik. Midjourney też poprawnie pokazał tę samą postać w gronie znajomych, którzy cieszą się ze wspólnie spędzonego czasu, pewnie przy piwie, a także na żaglówce.

Widać, że jest to podobna postać. Tego wojownika można również ożenić i wygenerować zdjęcie z jego przyjęcia weselnego albo skupić się na jego miękkim sercu, kiedy trzyma kociaka w dłoniach.

Znane postaci w MidJourney

Na potrzeby odcinka postanowiłem przetestować, czy uda mi się przenieść postacie, które znamy, do jakichś wymyślonych sytuacji. Wrzuciłem zdjęcie Donalda Trumpa i okazało się, że nie jest to możliwe. Została wykryta postać celebrycka bądź publiczna i Midjourney powiedział mi: "nie, tutaj tego nie będziemy dalej robili".

Niezrażony, spróbowałem z Angeliną Jolie i tutaj się “udało”. Rzeczywiście, zdjęcie Angeliny Jolie w parku... eh, na jednym z tych zdjęć wygenerowana postać przez Midjourney przypomina aktorkę.

Nie udało mi się z Donaldem Trumpem, to może uda się z Donaldem Tuskiem?

Jest coś dziwnego w tym zdjęciu. Ma jakieś cechy charakterystyczne, ale to nie jest ten polityk, o którego mi chodziło.

Próbowałem jeszcze później wielokrotnie z innymi postaciami i te wyniki nie były zadowalające. To miał być Maciej Stuhr i Angelina Jolie pijący wspólnie bubble tea w centrum Warszawy.

Nie przypomina to ani Macieja Stuhra, ani Angeliny. Jakoś to do mnie zupełnie nie przemawia.

A czy sama Angelina Jolie pijąca bubble tea w Warszawie?

W mojej ocenie: nie, to zupełnie nie przypomina tej aktorki. Ta Warszawa też nie jest Warszawą, w związku z tym widzimy, że realistyczne generowanie zdjęć przy pomocy tego narzędzia jeszcze nie jest możliwe.

Czy wiesz, że... ...po obejrzeniu kilku filmów na kanale Beyond AI można znacząco przyspieszyć swoją codzienną pracę? Nie czekaj, subskrybuj!

Podsumowanie

Jakie są wnioski z tych pierwszych kroków? Jeżeli chcemy przenieść istniejącego aktora, polityka bądź samego siebie, to jeszcze nie miałbym takich dużych oczekiwań. Natomiast jeżeli poprosimy o wymyślenie nowej postaci, takiej której Midjourney sam jest autorem, to późniejsze umieszczenie modelu wygenerowanej postaci w innych kontekstach i sytuacjach działa dobrze. Wtedy rzeczywiście mamy tę spójność.

—

Jeśli chcesz dowiedzieć się więcej o fascynującym świecie sztucznej inteligencji i jej zastosowaniach w życiu codziennym, odwiedź nasz kanał YouTube – Beyond AI. To Twój przewodnik po dynamicznym świecie AI!

Odwiedź Beyond AI na YouTube

Kanał Beyond AI jest tworzony przez specjalistów z firmy WEBSENSA, która od 2011 roku dostarcza rozwiązania AI dla czołowych przedstawicieli różnych branż.

Odwiedź

Subskrybuj

Inne wpisy z tej serii

AI używa komputera? Apple Intelligence rozczarowuje? W co inwestuje Google? | Newsy AI

Poznaj najnowsze inicjatywy AI od Anthropic, Apple i Google. Od AI sterującego komputerem po prawnicze startupy – omawiamy nowości w obszarze sztucznej inteligencji.

Przeczytaj wpis

AI na wakacjach, awatary i deepfake'i (o przyszłości, która już nadeszła) | Newsy AI

Odkryj nowości w świecie AI w kolejnym odcinku podcastu Beyond AI. Dowiedz się, jak modele językowe wpływają na komunikację, prywatność i wyzwania prawne.

Przeczytaj wpis