Sztuczna inteligencja
Etyka w AI – równoważąc innowacyjność i odpowiedzialność w IT
Narzędzia generative AI są coraz częściej wykorzystywane dzięki ich szerokiej dostępności oraz przystępności. Mogą one wykonywać szereg rutynowych zajęć z obszaru organizacji zadań czy klasyfikacji danych. Jednak to ich zdolność pisania tekstów, komponowania muzyki i tworzenia sztuki cyfrowej najbardziej poruszyły wyobraźnię ludzi na całym świecie i przekonały do samodzielnego eksperymentowania.
Wyrażenie „przyszłość jest teraz” (ang. future is here) nigdy nie było bardziej aktualne
Uczenie maszynowe nie ogranicza się już tylko do modeli predykcyjnych, wykorzystywanych do obserwacji, identyfikowania i klasyfikowania wzorców w treści. Obecnie, dzięki generatywnej AI, umożliwia ono, w oparciu o podpowiedzi języka naturalnego, generowanie wszelkiego rodzaju nowych treści, jak tekst, obraz, film, muzyka lub kod. Znajduje to wiele praktycznych zastosowań, jak pisanie artykułów, tworzenie projektów produktów czy optymalizacja procesów biznesowych.
GenAI niesie konsekwencje dla wielu branż – od organizacji IT, które mogą korzystać z generowanego przez modele AI (w dużej mierze poprawnego) kodu, po firmy potrzebujące szybkich treści biznesowych czy marketingowych.
Wyniki uzyskiwane dzięki generatywnym modelom AI bywają nie do odróżnienia od treści tworzonych przez ludzi. Co więcej, modele te korzystają zazwyczaj z losowych elementów, co oznacza, że mogą generować różnorodne dane wyjściowe z jednego żądania wejściowego. Dzięki temu wydają się jeszcze bardziej realistyczne i unikalne.
ChatGPT nadal jest najpopularniejszym narzędziem generatywnej AI. Został przeszkolony na ogromnej ilości tekstów, książek, artykułów i repozytoriów kodu. Jest w stanie odpowiadać pełnymi zdaniami na podpowiedzi i pytania w języku naturalnym.
GPT – silnik, który go napędza – ma dwie najnowsze wersje: GPT-3 oraz bardziej wydajne GPT-4, które są dostępne z poziomu przeglądarki oraz jako API.
Podczas gdy GPT-3 jest modelem wyłącznie tekstowym, który nie bardzo radził sobie z zagadkami logicznymi, GPT-4 stał się modelem multimodalnym o zwiększonej współpracy i kreatywności.
GPT-4 przyjmuje nie tylko polecenia tekstowe, ale też graficzne, potrafi zdać egzamin na adwokata czy programistę, a nawet wyczuć sarkazm. Model ten skupia się na prawdziwości informacji, ale też sterowalności. Oznacza to, że łatwiej realizuje zadania w szczegółowo określony przez użytkownika sposób i znacznie rzadziej udziela błędnych odpowiedzi. GPT-4 łatwiej wykorzystywać też w codziennej pracy IT.
GPT-3 jest modelem darmowym, natomiast dostęp do GPT-4 kosztuje 20$ miesięcznie.
Oczywiście pojawiło się dużo innych modeli językowych (LLM), np. LaMDA, a później PaLM LLM, na których opiera się działanie chatbota Bard. Microsoft stworzył Bing AI, który udziela złożonej odpowiedzi na podstawie informacji wertowanych na żywo. Jednak zdecydowana większość generatorów tekstu AI używa modelu GPT, zwłaszcza najnowszej wersji GPT-4. To sprawia, że wszystkie są do siebie podobne i mają zbliżone funkcje.
Do rozpoznawania głosu, generowania tekstu, a częściej wideo czy obrazów stosuje się system przewidywania oparty na GAN (Generative Adversarial Network), który działa przy użyciu dwóch współzawodniczących sieci neuronowych. Obie sieci przeciwstawiają się sobie, aby wygenerować syntetyczne i nowe instancje danych, przechodząc w prawdziwe dane. Będą one dystrybuować dane i naśladować siebie nawzajem.
Potencjał GAN-ów może służyć zarówno złu, jak i dobru. Tak postają wszelkie kreacje fake pictures i fake videos. Prognozy wideo oparte na GAN mogą też pomóc, np. w wykrywaniu anomalii potrzebnych w wielu sektorach, takich jak bezpieczeństwo i nadzór.
Zasady działania GAN:
Aby móc pracować z procesami leżącymi u podstaw tych technologii, potrzebujemy wysokiej jakości danych, przejrzystości, pełnej dokumentacji i etyki AI.
Generatory AI działają często jak magiczna różdżka. I, jak wszystko w czarodziejskim świecie, magia zależy bardziej od czarodzieja niż od instrumentu.
Spośród wielu zastosowań technologii GenAI wybraliśmy te wykorzystywane w dziedzinach kreatywnych, w których bez wątpienia wpłynie na metody i optymalizację procesu twórczego. Wykorzystanie GenAI już przynosi znaczące korzyści zespołom marketingowym i projektowym, umożliwiając szybkie i wydajne tworzenie wysokiej jakości treści.
Duże firmy, takie jak Adobe, Canva, Microsoft Designer i Shutterstock, od dawna korzystają z narzędzi GenAI do oferowania użytkownikom możliwości edycji obrazów, tworzenia grafiki i generowania filmów. Wiele z nich jest typu open source, co oznacza, że każdy może uzyskać do nich dostęp i ulepszać istniejące modele lub tworzyć całkiem nowe.
Jest mało prawdopodobne, że AI wyprze ludzi pod względem kreatywności, bo mamy jedną zasadniczą przewagę: kreatywność jest zasadniczo ludzka. Sztuka zaczyna się od intencji człowieka i kończy na jego wyborze.
Obecna generacja modeli uczenia maszynowego do pracy z tekstem opiera się na tzw. samouczeniu nadzorowanym. Polega ono na podaniu modelowi ogromnej ilości tekstu, dzięki czemu jest w stanie identyfikować wzorce i przewidywać ich nowe punkty, np. ocenić na podstawie kilku słów, jak zakończyć zdanie.
Jednak już z niewielkiej ilości tekstu narzędzia GenAI mogą w ciągu kilku sekund stworzyć dobrej jakości wiarygodny tekst – artykuł, wiersz, opowiadanie, a następnie przeformułować je, aby lepiej dopasować je do celu.
GPT-4 umożliwia użytkownikowi współtworzenie i edytowanie zadań związanych z kreatywnym pisaniem na wyższym poziomie. Przykłady zadań obejmują komponowanie piosenek, realistyczne dźwięki mowy, pisanie scenariuszy lub uczenie się konkretnego stylu pisania poprzez iteracje (tj. aż do spełnienia określonego warunku).
Generowanie tekstu może wzmocnić zespoły kreatywne, przyczyniając się do lepszej rozpoznawalności marki. Za pomocą GenAI powszechne staje się tworzenie dialogów, nagłówków lub reklam w branży marketingowej, gier itd. Z narzędzi tych korzysta się w chatach do komunikacji w czasie rzeczywistym lub do tworzenia opisów produktów czy treści w mediach społecznościowych.
Funkcją większości aplikacji do generowania tekstu AI jest dostęp poprzez interfejs użytkownika do modelu GPT i możliwość kontrolowania jego danych wyjściowych. Większość z nich oferuje również edytor tekstu, w którym można edytować tekst wygenerowany przez AI bezpośrednio z aplikacji.
Powstają narzędzia pomocne firmom czy blogerom w tworzeniu treści dowolnej długości, jak Jasper czy Writesonic. Innymi przykładami zastosowania GenAI w codziennym życiu są aplikacje:
Dzięki generatorom obrazów AI w prosty sposób można wygenerować materiał wizualny. Użytkownik może przekształcać tekst w mniej lub bardziej realistyczne obrazy na podstawie określonego przez siebie ustawienia, tematu, stylu lub lokalizacji.
Generator obrazów może być przydatny w pracy np. grafika, który błyskawicznie może stworzyć inspiracje do swoich materiałów graficznych. Wystarczy wpisać prompt, a obraz, który powstał w wyobraźni, zaprezentuje się na ekranie.
Obrazy generowane przez AI są użyteczne zarówno w celach hobbystycznych, jak i komercyjnych czy edukacyjnych. Narzędzia te mogą pomóc w brandingu, tworzeniu treści do mediów społecznościowych, tablicach wizji (vision board), zaproszeniach, ulotkach itd.
Na rynku dostępnych jest kilka generatorów obrazów AI typu open source, które odpowiadają różnym potrzebom. Dzięki nim można tworzyć własne grafiki przedmiotów, zwierząt, abstrakcyjne kształty, dzieła malarskie, jak również kopie znanych obrazów.
Inne, publicznie dostępne narzędzia, to np.: Deep Art Effects, Deep Dream Generator, Artbreeder.
Artbreeder np., poza funkcją przetwarzania tekstu na rysunek i edycji obrazów (portretów, krajobrazów i różnych formy grafiki), zmiany aspektów twarzy (odcień skóry, kolor włosów i oczu) czy tworzenia kolaży z obrazów i kształtów, ma możliwość, za pomocą odpowiedniego monitu tekstowego, przekształcenia obrazu w ruchome animacje. Rzeczywiste przykłady użycia tych narzędzi można znaleźć na podanych stronach.
Oczywiście, sztuka generowana przez AI rodzi zasadnicze pytanie, czy nadal można ją nazwać „sztuką”, co nie zmienia faktu, że staje się powszechnym i użytecznym, a przy tym także zabawnym sposobem tworzenia obrazów w kilka chwil.
Generator wideo z tekstu umożliwia automatyczne tworzenie filmu, podobnie jak obrazu, na podstawie opisu ułożonego przez użytkownika. Generator analizuje dany prompt, rozpoznaje słowa kluczowe, a następnie na ich podstawie stworzy wideo, które można też edytować.
W powyższy sposób można uzyskać:
Poszczególne generatory wideo mogą zawierać zestaw generatywnych narzędzi AI, jak text-to-video, image-to-image, usuwanie i wymianę przedmiotów, zamienianie części sekcji czy możliwość trenowania własnych modeli AI do generowania obrazu.
Publiczne narzędzia do generowania prostych wideo udostępnia np. Runway. Ostatnio pojawiły się modele do tworzenia wysokiej jakości filmów, wciąż w fazie testowania. Są to:
Stable Diffusion, model GenAI opracowany przez Stability AI, ma szerokie zastosowanie – od generowania szczegółowych obrazów po uzupełnianie ich brakujących fragmentów czy kreowanie tła, a nawet tworzenie z monitu tekstowego przeobrażenia obrazu w obraz. Co istotne, Stability AI jest open source, co oznacza udostępniło kod źródłowy Stable Diffusion publicznie. Dzięki temu, na jego bazie powstały najnowsze narzędzia do generowania wideo.
Przykłady kreatywnych projektów wideo wykorzystujących te narzędzia istnieją na stronach wymienionych powyżej.
Tworzenie skomplikowanych kompozycji jest przedsięwzięciem dość kosztownym przy użyciu tradycyjnych metod produkcji muzycznej. AI sprawia, że komponowanie stało się znacznie tańsze.
Narzędzia GenAI mogą generować dźwięk na podstawie opisów tekstowych. I choć muzyka tworzona w ten sposób nie zdobędzie nagrody Grammy, tak wygenerowany dźwięk coraz bardziej brzmi jak coś, co może stworzyć człowiek.
Dotyczy to różnych aspektów procesu tworzenia dźwięku – od komponowania muzyki przez mastering audio po streaming online. Wielu muzyków i wytwórni płytowych szuka nowych sposobów integracji technologii AI. Nadal jednak wykorzystuje ją raczej jako narzędzie uzupełniające, a nie zastępujące artystów.
Niektóre systemy mogą tworzyć utwory w stylu wybranych kompozytorów, podczas gdy inne wykorzystują GenAI do generowania wyjątkowo unikalnych dźwięków. Narzędzia te mogą służyć do projektowania teledysków – nakładania nagrań dźwiękowych na sekwencje wideo.
Dostępnymi narzędziami łatwymi w użyciu są np. Google's Magenta czy OpenAI’s MuseNet. Oba typu open course. Niektóre z głównych ich zalet to:
MuseNet może generować utwory aż z 10 różnymi instrumentami i muzyką w 15 różnych stylach, a także łączyć różne style muzyczne. Narzędzie to, choć nadal nie umożliwia generowania własnej muzyki, odkrywa wzorce harmonii, rytmu i stylu, ucząc się przewidywania.
W ramach Magenta, której wtyczka współpracuje z klasycznym programem do tworzenia muzyki, stworzone są narzędzia do generowania melodii, harmonii i rytmów, które stosowane są w projektach komercyjnych, jak dżingle reklamowe czy muzyka tła w grach, gdzie duże znaczenie mają czas i fundusze, a udział muzyka nie jest wymagany.
Dostępnych jest kilku dobrych sampli generowanych z MuseNet na SoundCloud; „High on Life” gra firmy Squanch Games, gdzie muzyka, a także częściowo grafika i głosy postaci wygenerowano w narzędziu Midjourney AI.
Pomimo sprzeciwu, jaki napotkali twórcy gier i ich wydawcy wykorzystujący GenAI do tworzenia muzyki (i nie tylko), takie czołowe gry, jak Unity, Epic Games, Roblox i Ubisoft ogłosiły pełną integrację GenAI w swoich stosach technologicznych (software stack).
GenAI to potężne narzędzie do szybkiego tworzenia aplikacji mobilnych i internetowych. Można je użyć do generowania kodu programistycznego bez konieczności ręcznego kodowania. Jest to szczególnie przydatne w przypadku tzw. boilerplate code, czyli kodu, który nie realizuje żadnych ciekawych funkcji, ale trzeba go napisać, ponieważ łączy w całość inne fragmenty aplikacji.
Dzięki GenAI można też tworzyć nowy kod z monitami w języku naturalnym, a nawet tłumaczyć kod z jednego języka programowania na inny. Zastosowania GenAI w kodowaniu:
Dzięki funkcjom GenAI tworzenie kodu jest możliwe nie tylko dla profesjonalistów, ale także dla osób nietechnicznych. Jednak, jak w przypadku każdego narzędzia programistycznego, zaleca się przejrzenie wygenerowanego w ten sposób kodu przez kogoś, kto ma głębszą wiedzę w tej dziedzinie, przed włączeniem go do środowiska produkcyjnego.
Jednym z najlepszych przykładów narzędzia GenAI jest Github Copilot, który wykorzystuje model Codex OpenAI do oferowania sugestii kodu bezpośrednio z edytora programisty. Z danych Githuba wynika, że narzędzie to pozwala programistom przyspieszyć kodowanie nawet o 96% (przy większości powtarzalnych zadań), skoncentrować się na ważniejszych zagadnieniach, znacząco przyczyniając się do satysfakcji z pracy (88%).
Z pomocą narzędzi Generative AI można też obniżyć koszty budowy stron internetowych – nawet w oparciu o systemy zarządzania treścią, jak WordPress. Przykłady obejmują CodeWP – generator kodu AI zaprojektowany i przeszkolony szczególnie w zakresie WordPress, WooCommerce, PHP, JS i jQuery.
Jak wynika z licznych wypowiedzi i ankiet badawczych, wiele firm wykorzystuje już narzędzia GenAI. Używa ich do generowania pomysłów, tworzenia tekstów reklam, analizowania danych lub automatyzowania czasochłonnych i żmudnych zadań.
Jeśli Twoja firma chce wykorzystać potencjał tych narzędzi, a nie wie, od czego zacząć, polecamy odwiedzenie naszego kanału YouTube Beyond AI. Przybliżamy na nim tematykę rozwoju sztucznej inteligencji. Pokazujemy też praktyczne zastosowania najnowszych narzędzi GenAI. Zapewniamy, że już po kilku filmach będziecie mieli lepszy obraz trwającej obecnie rewolucji AI!
Dowiedz się, jak duże modele językowe (LLM) rewolucjonizują przetwarzanie języka, redefiniują branże i tworzą nowe wartości biznesowe w erze AI.
Odkryj, jak rozwiązania oparte na sztucznej inteligencji mogą przekształcić zarządzanie zasobami i efektywność Twojej firmy. Przeczytaj nasz wpis na blogu!