Beyond AI
Jak zrobić muzykę z AI? SUNO – szybki, krótki poradnik
Poniższy artykuł to uzupełnienie dla filmu opublikowanego na kanale Beyond AI. Zapraszamy do odwiedzenia kanału, gdzie znajdziesz więcej informacji i inspiracji na temat sztucznej inteligencji. Hasło przewodnie kanału to: "Twój przewodnik po dynamicznym świecie AI".
Tworzenie grafik za pomocą sztucznej inteligencji (AI) stało się jednym z najbardziej ekscytujących zastosowań tej technologii. Dzięki odpowiednim narzędziom możesz generować obrazy odzwierciedlające Twoje pomysły, niezależnie od umiejętności artystycznych. W tym artykule dowiesz się, jakich darmowych narzędzi użyć, jak pisać skuteczne zapytania (tzw. prompty) oraz czy korzystanie z AI w tworzeniu obrazów jest legalne i opłacalne.
Cześć, ja jestem Tymek i na co dzień prowadzę projekty polegające na wdrażaniu narzędzi sztucznej inteligencji do firm. Dzisiaj rzucę trochę światła na temat tworzenia grafik z pomocą narzędzi AI. Pokażę, jak w praktyczny sposób i najlepiej za darmo można korzystać z generatorów obrazów.
Zaznaczę na początku, że zapytania do chatów nazywamy promptami. “Zapytanie” i “prompt” będą pojawiać się tutaj zamiennie.
Tworzenie grafik za pomocą AI to temat, który stał się dość kontrowersyjny na początku przygody z tymi narzędziami. Niektóre modele korzystały z prac wielu artystów i potrafiły dosłownie skopiować część ich dzieł w tym nawet podpisy na wygenerowanych przez siebie obrazach. Pod koniec 2024 roku sytuacja wygląda już zupełnie inaczej i najwięksi producenci oprogramowania AI dają nam gwarancję tego, że ich modele uczą się na legalnych i etycznych źródłach.
Tak. Korzystanie z obrazów wygenerowanych przez AI jest legalne, o ile korzystamy ze sprawdzonych narzędzi. Gigantom naprawdę nie zależy na kontrowersjach, a mają też takie zasoby danych, że nie muszą “kraść” ich jeszcze więcej.
W tej chwili mamy na rynku kilku największych graczy i wiele mniejszych modeli. Skupimy się na tych największych, najbezpieczniejszych i najbardziej stabilnych.
Jeśli znasz modele chatów AI takie jak ChatGPT, CoPilot, Gemini, Claude i tak dalej, to musisz wiedzieć, że modele generowania obrazów to zupełnie oddzielne modele. W ChatGPT oraz w Copilocie do generowania obrazów wykorzystywany jest algorytm DALL-E, a w Gemini jest to Imagen.
Domyślamy się więc, że obrazy stworzone Imagenem w Gemini będą inne od tych z Dalliego w chacieGPT i Copilocie. Sprawa sięga jednak trochę głębiej, ponieważ zarówno chatGPT jak i Copilot są obudowane tak zwanym promptem systemowym.
To jest dodatkowy zbiór opisów, poleceń i cech, które są dodawane do każdego wpisywanego przez nas zapytania, dlatego też copilot i chatgpt pomimo korzystania z tego samego modelu do generowania grafiki będą tworzyć inne obrazy.
Skupimy się na tych trzech powszechnie dostępnych chatach.
Żeby skorzystać z ich darmowej wersji wystarczy się tam zalogować wykorzystując na przykład dane z konta Google.
Nie oszukujmy się, większość z nas potrzebuje się tylko pobawić albo raz na jakiś czas stworzyć dosłownie kilka grafik. Dlatego nie ma sensu specjalnie wykupować abonamentów na narzędzia AI.
A czym różnią się darmowe wersje od płatnych?
Mają ograniczenia na liczbę wykonanych grafik danego dnia, licznik po upłynięciu doby się zeruje i znów możemy wykonać kilka-kilkanaście grafik.
Jeśli rzeczywiście okaże się, że chcesz się mocniej pobawić albo potrzebujesz więcej grafik, to wtedy warto rozważyć zakup abonamentu na miesiąc - to najczęściej koszt od 80 do 100 zł dla tych największych modeli, choć ja polecam Ci w takim przypadku MidJourney, gdzie za miesiąc zapłacisz około 40 zł.
To najważniejszy punkt programu! Najczęściej popełnianym błędem jest wpisywanie zbyt ogólnego zapytania. Np. “stwórz obraz lasu”. Warto zastanowić się, czy gdybyśmy zlecili takie zadanie człowiekowi, to czy wiedziałby, co dokładnie mamy na myśli. Dlatego musimy bardzo dokładnie opisywać to, czego potrzebujemy. Jeśli chat nie będzie tego wiedział, to zrobi “jak uważa”, co może nas nie zadowolić. Od czego więc zaczniemy?
“Stwórz obraz lasu” to odpowiedni ogólnik i od tego należy zacząć.
Jeśli mamy pomysł na to, żeby na skraju lasu stał mały domek, który będzie jedynie detalem, to wciąż zaczniemy opis od tego, że jest to grafika lasu, a nie domku koło lasu. “Na skraju lasu stoi niewielki domek z czerwonym dachem. “
Pamiętaj, że mówisz do chatu, więc to nie musi brzmieć ładnie, a więcej konkretnych opisów to lepszy efekt.
“Stwórz obraz spokojnego, mglistego, jesiennego lasu liściastego”
Oświetlenie gra bardzo dużą rolę w ostatecznym efekcie.
“Stwórz obraz jesiennego lasu liściastego oświetlonego zachodzącym słońcem rzucającym długie promieni po koronach drzew”
Styl może być fotorealistyczny, może być to kubizm, może być obraz olejny, może być w stylu VanGogha i tak dalej i dalej
“... Styl fotorealistyczny.”
Możesz opisać co powinno znajdować się na obrazie i z jakiego kąta “patrzy” kamera.
“Zdjęcie wykonane sponad koron drzew. W górnej części widoczny jest horyzont wraz ze słońcem”
To dość łatwa sprawa, która może wyjątkowo wiele zmienić. Jeśli potrzebujesz grafik, które trafiają w identyfikację wizualną Twojej firmy czy projektu, to zawsze możesz zabarwić całe zdjęcie w danych barwach lub dodać detale o takich barwach, jakie Cię interesują.
“Zabarwienie ciepło-pomarańczowe z elementami zieleni”.
Na przykład: “Zdjęcie pionowe, stosunek boków 3:2”.
Niestety nie każdy model i nie zawsze dobrze reaguje na takie polecenia, dlatego czasem trzeba poprosić go jeszcze raz.
Pamiętaj, że chat nie czyta w myślach, tak samo jak człowiek, dlatego jeśli podasz mu dane, które są zrozumiałe tylko dla ciebie, to na pewno ich nie rozszyfruje w taki sposób, w jaki chcesz.
Jak widzimy efekt naszego zapytania w bardzo widoczny sposób ewoluuje i choć obiektywnie rzecz ujmując niektóre z efektów pośrednich mogą wydawać się nam ładniejsze od efektu końcowego, to tylko efekt końcowy odpowiada temu, co dokładnie potrzebujemy.
Pokażę Wam teraz 5 przykładów dobrze napisanych promptów i ich efekty.
„Widok na futurystyczne miasto nocą, z wysokimi, szklanymi wieżowcami oświetlonymi neonowymi światłami w odcieniach niebieskiego i fioletu. Ruchliwa ulica poniżej, z unoszącą się mgłą w powietrzu, w oddali widać latające pojazdy. Scena ma dynamiczny, cyberpunkowy klimat, a oświetlenie tworzy kontrastowe cienie.”
„Baśniowy las o świcie, pełen wysokich drzew pokrytych miękkim mchem, przez które przenika delikatna, złota mgła. Na ziemi migoczą niebieskie świetliki, a w tle widać strumyk o krystalicznie czystej wodzie. Cała scena ma tajemniczy, spokojny nastrój, jak ilustracja z książki o elfach.”
„Portret w stylu wiktoriańskim przedstawiający elegancką damę w koronkowej sukni z wysokim kołnierzem. Ma ciemne, kręcone włosy upięte w misterny kok i nosi delikatną biżuterię z perłami. Tło jest ciemne, a oświetlenie miękkie, przypominające malarstwo olejne, co nadaje całości klasyczny, elegancki wygląd.”
„Jasna kuchnia w stylu skandynawskim z minimalistycznym, drewnianym wykończeniem. Na środku znajduje się duża wyspa kuchenna z marmurowym blatem, wokół białe szafki i półki z zielonymi roślinami. Oświetlenie jest naturalne, wpada przez duże okna, nadając wnętrzu przytulny i świeży wygląd.”
„Wojownik stojący na szczycie góry, trzymający błyszczący miecz, z rozciągającym się za nim malowniczym widokiem na dolinę oświetloną zachodzącym słońcem. Na niebie widać lecącego smoka, a chmury są podświetlone pomarańczowymi i fioletowymi odcieniami. Scena jest dynamiczna, pełna dramatyzmu, jak kadr z epickiego filmu fantasy.”
Jak widzicie, efekty są naprawdę oszałamiające i o wiele lepsze od tych, które robimy przy pomocy bardzo ogólnikowych zapytań.
W tej sekcji podsumowujemy w krótkich punktach to, czego dokonaliśmy, czego nauczyliśmy się w tym odcinku.
Dla powtórzenia:
Na początek używaj: Copilot, ChatGPT, Gemini
Modele, które są odpowiedzialne za robienie obrazów to np. DALL-E oraz IMAGEN
W trakcie pisania promptów pamiętaj o:
Dodatkową podpowiedzią jest to, że jeśli nie do końca wiesz, jak napisać zapytanie do chata, możesz poprosić o pomoc chat:
> Chcę napisać zapytanie do chata o stworzenie grafiki lasu, ale nie wiem do końca jak to zrobić, ani jak opisać to, czego potrzebuję. Zadawaj mi pytania, żebyś mógł na końcu stworzyć jak najlepszy prompt
Proste? Proste! Mam nadzieję, że moje instrukcję pomogą Ci w uzyskaniu lepszych efektów pracy z chatami. Co jeszcze Cię interesuje?
Dowiedz się, jak dzięki sztucznej inteligencji wykorzystać pełnię potencjału YouTube i ułatwić sobie publikowanie filmów.
Poznaj sposoby wykorzystania AI do wyboru idealnych prezentów! Personalizowane rekomendacje, analiza recenzji z YouTube i oszczędność czasu dzięki inteligentnym narzędziom.