Beyond AI
Jak ChatGPT zmienia naszą pracę? Rewolucja w rekrutacji IT
Ten materiał powstał zarówno w wersji pisanej, jak i filmowej. Obejrzyj film na naszym kanale Beyond AI, lub przejdź do lektury. Dzięki!
Obejrzyj ten materiał na YouTube:
Cześć, jestem Ziemek i dzisiaj podzielę się moimi pierwszymi wrażeniami z nowej funkcji w Midjourney, która zapewnia spójność generowanych postaci. Opowiem co działa, co nie działa i jakie są moje wnioski.
Midjourney to narzędzie generatywne sztucznej inteligencji, które służy do generowania obrazów. Wystarczy opisać, co chcemy, żeby znalazło się na zdjęciu, bądź wygenerowanym obrazku, a sztuczna inteligencja to stworzy.
To są przykłady pokazujące, co użytkownicy w ostatnim czasie stworzyli:
Do tej pory istniał problem z generowaniem kilku takich samych postaci — za każdym razem na nowym obrazku pojawiała się nowa, inna twarz. Teraz to się zmieniło.
Zacznę od pokazania przykładu, kiedy to działa bardzo dobrze. Poprosiłem Midjourney o wygenerowanie zdjęcia twarzy wojownika.
Spodobała mi się twarz numer 2, więc poprosiłem, żeby ją powiększył.
W momencie powiększenia wystarczy kliknąć na "Open in Browser", skopiować adres URL i w następnych instrukcjach mogę już używać tego adresu jako referencji — takiego klucza, który podaje się w części instrukcji.
Stwierdziłem, że będzie ciekawie zobaczyć, w jaki sposób Midjourney wygeneruje obrazek pokazujący tego wojownika na rowerze w Warszawie. W związku z tym wykonałem prompt, w którym było napisane "man riding on bicycle in the heart of Warsaw", a jako parametr --cref podałem adres URL, który przed chwilą skopiowałem z przeglądarki.
Widzimy, że to rzeczywiście jest ten sam wojownik. Midjourney też poprawnie pokazał tę samą postać w gronie znajomych, którzy cieszą się ze wspólnie spędzonego czasu, pewnie przy piwie, a także na żaglówce.
Widać, że jest to podobna postać. Tego wojownika można również ożenić i wygenerować zdjęcie z jego przyjęcia weselnego albo skupić się na jego miękkim sercu, kiedy trzyma kociaka w dłoniach.
Na potrzeby odcinka postanowiłem przetestować, czy uda mi się przenieść postacie, które znamy, do jakichś wymyślonych sytuacji. Wrzuciłem zdjęcie Donalda Trumpa i okazało się, że nie jest to możliwe. Została wykryta postać celebrycka bądź publiczna i Midjourney powiedział mi: "nie, tutaj tego nie będziemy dalej robili".
Niezrażony, spróbowałem z Angeliną Jolie i tutaj się “udało”. Rzeczywiście, zdjęcie Angeliny Jolie w parku... eh, na jednym z tych zdjęć wygenerowana postać przez Midjourney przypomina aktorkę.
Nie udało mi się z Donaldem Trumpem, to może uda się z Donaldem Tuskiem?
Jest coś dziwnego w tym zdjęciu. Ma jakieś cechy charakterystyczne, ale to nie jest ten polityk, o którego mi chodziło.
Próbowałem jeszcze później wielokrotnie z innymi postaciami i te wyniki nie były zadowalające. To miał być Maciej Stuhr i Angelina Jolie pijący wspólnie bubble tea w centrum Warszawy.
Nie przypomina to ani Macieja Stuhra, ani Angeliny. Jakoś to do mnie zupełnie nie przemawia.
A czy sama Angelina Jolie pijąca bubble tea w Warszawie?
W mojej ocenie: nie, to zupełnie nie przypomina tej aktorki. Ta Warszawa też nie jest Warszawą, w związku z tym widzimy, że realistyczne generowanie zdjęć przy pomocy tego narzędzia jeszcze nie jest możliwe.
Jakie są wnioski z tych pierwszych kroków? Jeżeli chcemy przenieść istniejącego aktora, polityka bądź samego siebie, to jeszcze nie miałbym takich dużych oczekiwań. Natomiast jeżeli poprosimy o wymyślenie nowej postaci, takiej której Midjourney sam jest autorem, to późniejsze umieszczenie modelu wygenerowanej postaci w innych kontekstach i sytuacjach działa dobrze. Wtedy rzeczywiście mamy tę spójność.
—
Jeśli chcesz dowiedzieć się więcej o fascynującym świecie sztucznej inteligencji i jej zastosowaniach w życiu codziennym, odwiedź nasz kanał YouTube – Beyond AI. To Twój przewodnik po dynamicznym świecie AI!
Poznaj najnowsze inicjatywy AI od Anthropic, Apple i Google. Od AI sterującego komputerem po prawnicze startupy – omawiamy nowości w obszarze sztucznej inteligencji.
Odkryj nowości w świecie AI w kolejnym odcinku podcastu Beyond AI. Dowiedz się, jak modele językowe wpływają na komunikację, prywatność i wyzwania prawne.