Czytaj

ChatGPT, Bard, Bing czy Claude – który chatbot AI jest najlepszy?

Giganci technologiczni ścigają się w tworzeniu najlepszego chatbota AI. O to miano walczą: ChatGPT, Bard, Bing i Claude. Oto porównanie tych 4 narzędzi.

Publikacja:

16/11/2023

Aktualizacja:

24/11/2023

AI eksplodowała wraz z rozwojem dużych modeli językowych. Modele te stanowią podstawę algorytmiczną dla narzędzi GenAI, doskonalonych w błyskawicznym tempie. Giganci technologiczni ścigają się obecnie w tworzeniu najlepszego chatbota AI. O miano pretendentów walczą: ChatGPT, Bard, Bing (Copilot) i Claude. Zapoznaj się z naszym zestawieniem tych 4 narzędzi.

1. ChatGPT

ChatGPT firmy OpenAI to jedyny produkt generatywnej AI dostępny z dwoma różnymi LLM, GPT-3 i GPT-4. Jego uruchomienie w listopadzie 2022 pobiło wszelkie rekordy popularności w zakresie oprogramowania konsumenckiego i aplikacji internetowych.

To jeden z najbardziej zaawansowanych chatbotów AI, który może naśladować ludzkie rozmowy, zapewniając użytkownikom łatwą i spersonalizowaną obsługę. Jego zdolność do udzielania długich, dobrej jakości odpowiedzi oraz generowanie specjalistycznych tekstów na różne tematy, wyznaczyły wysoką poprzeczkę zarówno dla samego LLM, jak i konkurencji.

Firma OpenAI nie ustaje w rozwoju swojego produktu, regularnie dodając nowe funkcje. Obecnie (listopad 2023) za pomocą ChatGPT można skorzystać między innymi z:

przeszukiwania Internetu (funkcja Browse with Bing);
generowania obrazów (funkcja DALL-E 3);
rozmów głosowych z chatem (dostępne w aplikacji mobilnej).

Więcej o ChatGPT w innym naszym artykule: ChatGPT i Generative AI – zrozum je teraz.

Możliwości:

duży wybór wtyczek do różnych zastosowań;
możliwość wpisania niestandardowych instrukcji (Custom instructions) dla lepszej personalizacji wyników;
przejrzyste API z dobrą dokumentacją;
funkcja przeszukiwania sieci (Browse with Bing) w wersji płatnej;
możliwość generowania obrazów za pomocą wbudowanego modelu DALL-E 3 (Uwaga: pierwsze 4 obrazy w tym artykule wygenerowaliśmy właśnie w ChatGPT);
rozmowy głosowe z chatem w aplikacji mobilnej (także w języku polskim).

Ograniczenia:

dane szkoleniowe ograniczone są do kwietnia 2023 roku, co, zgodnie z zapewnieniami OpenAI, ma być stopniowo poprawiane (częściowo rekompensuje to funkcja Browse with Bing);
zdarzające się błędne odpowiedzi i podatność na tzw. halucynacje;
interfejs użytkownika;
wersja darmowa nie obsługuje wielu funkcji.

2. Bard

Kiedy OpenAI udostępniło publicznie ChatGPT, Google w lutym 2023 roku pospiesznie wypuścił wersję tekstowego generatywnego produktu AI – Bard. Była to zarazem odpowiedź na integrację ChatGPT z Bing od Microsoft.

Chatbot Bard został zaprojektowany w celu symulowania rozmów z człowiekiem i generowania realistycznych odpowiedzi na pytania. Aby dostarczać jeszcze bardziej odpowiednie rekomendacje wyszukiwania, Bard przeszukuje na bieżąco cały Internet w czasie rzeczywistym. Od samego początku jest to jego flagowa funkcja.

Możliwości:

przyjazny interfejs użytkownika;
cytuje źródła i daje najbardziej aktualne odpowiedzi;
ma przycisk do tworzenia kopii zapasowych swoich wypowiedzi za pomocą wyników wyszukiwania lub do wyjaśniania, gdy nie ma źródeł;
generuje tekst na zadany temat i oferuje opcje kontynuacji dla ukończonych wpisów – można się przełączać między alternatywnymi wersjami i wybrać optymalną dla siebie;
generuje i debuguje kod w 20 językach programistycznych oraz tłumaczy kod z jednego języka na inny.

Ograniczenia:

nie generuje i nie czyta dokumentów takich jak pliki PDF, obrazy itp.;
generowanie wyników bywa powolne.

Mimo że Bard ma wbudowane mechanizmy kontroli bezpieczeństwa i jasnego przekazywania informacji zwrotnych, może wyświetlać nieprecyzyjne odpowiedzi lub, co gorsza, stwierdzenia obraźliwe. Dlatego Google zaangażowało tysiące testerów, aby poprawić jego jakość, bezpieczeństwo i dokładność.

3. Bing (obecnie Copilot)

Widząc ogromny sukces ChatGPT, Microsoft w marcu 2023 roku zintegrował podobne funkcje AI ze swoją wyszukiwarką internetową Bing (jedna z największych wyszukiwarek na świecie, z zaledwie 3% wyszukiwań). Utrzymując bliską współpracę techniczną i finansową z ChatGPT, stworzył Bing AI Chat.

Należy tutaj wspomnieć o niedawnej zmianie nazwy tego narzędzia. Bing Chat został przemianowany na Copilot podczas wydarzenia Microsoft Ignite 2023 (14-17 listopada), co jest częścią strategii Microsoftu w zakresie wzmocnienia brandingu narzędzia.

Copilot (dawniej Bing Chat) wykorzystuje LLM, ale ma dodatkowe funkcje czyniące go bardziej eksperymentalnym i dokładnym. Opiera się bowiem nie tylko na danych szkoleniowych, ale także na funkcjach indeksowania i tzw. web scraping, polegającym na zautomatyzowanym pobieraniu danych z Internetu. Dzięki temu może generować odpowiedzi w oparciu o aktualne dane.

Możliwości:

czytelne i przyjemne w użyciu narzędzie;
ma różne interfejsy użytkownika do rozmaitych celów;
wykazuje głębię i dokładność oraz ciekawy i zabawny styl konwersacji;
domyślnie przeszukuje Internet;
cytuje źródła;
generuje obrazy dobrej jakości przy użyciu silnika DALL-E 3.

Ograniczenia:

działa zasadniczo tylko w przeglądarce Microsoft Edge;
nadal jest podatny na błędy w wynikach – mogą być trafione lub chybione;
niezbyt dobrze radzi sobie z generowaniem lub wyświetlaniem kodu.

4. Claude

Claude to chatbot AI opracowany przez firmę badawczą Anthropic (założoną przez byłych członków OpenAI). Zaprojektowano go tak, aby był przyjazny dla użytkownika i łatwiejszy w użyciu niż np. ChatGPT. Przoduje w twórczym pisaniu i programowaniu przy pomocy Pythona, a także kładzie nacisk na bezpieczeństwo, kontrolę i etykę.

Ma służyć nie tylko do pisania treści przypominających ludzkie, ale też naśladowania niektórych pozakognitywnych cech behawioralnych. Nie jest ograniczony danymi historycznymi i dostarcza aktualne wyniki.

Przeszkolono go z użyciem tzw. konstytucyjnej sztucznej inteligencji. Oznacza to, że skupia się na uczciwej konwersacji, aby uzyskać „mniej szkodliwe” wyniki, generując odpowiedzi, które są społecznie odpowiedzialne i etyczne. Jak dotąd wyniki okazały się zróżnicowane, a recenzenci podkreślali, że nadal generuje treści, które mogą być stronnicze, nieprawdziwe lub potencjalnie szkodliwe.

Obecne wersje Claude 1, Claude 2 i Claude Instant dostępne są od niedawna dla szerszej publiczności, wobec wcześniejszych – osiągalnych tylko dla firm.

Możliwości:

silne zdolności rozumowania opartego na zdrowym rozsądku, ale unika problematycznych odpowiedzi;
zaprojektowany tak, by jak najlepiej rozpoznawać, czy dana informacja jest prawdziwa;
funkcja załączania plików oraz analizowania ich (zadawania pytań na ich temat);
okno kontekstowe obsługuje do 100 000 tokenów (dla porównania: Bard – 1000).

Ograniczenia:

brak wielu multimedialnych i internetowych funkcji (wobec ChatGPT), np. generowania obrazów.

Architektura i technologia poszczególnych chatbotów AI

ChatGPT

Opiera się na architekturze głębokiego uczenia się zwanej Generative Pre-trained Transformer (GPT). Pozwala ona na generowanie dość dokładnych i wysoce spersonalizowanych odpowiedzi na zapytania użytkowników.

Architektura GPT wykorzystuje technikę zwaną uczeniem bez nadzoru – może uczyć się na danych oznaczonych i nieoznaczonych, aby upewnić się, że rozumie zapytania. Dane oznaczone pozwalają chatbotowi dokładnie zidentyfikować intencje stojące za zapytaniami użytkowników i wygenerować właściwe odpowiedzi.

Bard

Wykorzystuje technologię LaMDA oraz architekturę sieci neuronowej tak, aby udzielać odpowiedzi na złożone pytania użytkownika w czasie rzeczywistym. Uwzględnia przy tym kontekst, temat i poprzednie wypowiedzi. Dzięki zaawansowanym technikom uczenia maszynowego, LaMDA jest w stanie nauczyć się nowych koncepcji i być wykorzystywany w wielu różnych dziedzinach.

Transformer firmy Google, który jest podstawą innych narzędzi do generowania AI, jak model językowy GPT-3.5, używany jest też w ChatGPT. Mają one tendencję do naśladowania odpowiedzi, co może prowadzić do błędów i pomyłek. Naukowcy, którzy stworzyli model LaMDA, próbowali rozwiązać ów problem przez zwiększenie rozmiaru modelu. Stwierdzili jednak, że podejście to nie działa w obszarach i branżach, w których fakty stale się zmieniają.

Bing (obecnie Copilot)

Działa na bazie zastrzeżonej przez Microsoft technologii Prometheus – modelu AI łączącym kompleksowy indeks wyszukiwania, rankingi i wyniki odpowiedzi z wyszukiwania Bing z kreatywnym wnioskowaniem najbardziej zaawansowanych modeli GPT OpenAI. Następnie łączy dane wyjściowe wygenerowane przez Bing i GPT w celu opracowania wewnętrznych zapytań z użyciem komponentu o nazwie Bing Orchestrator. Tak połączona odpowiedź jest prezentowana użytkownikowi w postaci tekstu przypominającego ludzki.

Zapytania wewnętrzne i wyszukiwanie Bing to kluczowe elementy architektury Prometheusa. Dzięki nim dostarcza on aktualne informacje do podstawowego modelu języka, umożliwiając odpowiadanie na bieżące pytania i redukując niedokładności – metoda ta nazywa się uziemieniem.

Claude

Działanie Claude oparto na nowatorskim podejściu do AI określanym jako „architektura kognitywna”. Ma ono na celu odtworzenie sposobu, w jaki ludzki mózg przetwarza informacje, umożliwiając systemom AI uczenie się i rozumowanie w bardziej ludzki sposób.

Łącząc kognitywną architekturę z najnowocześniejszymi technikami uczenia maszynowego, Claude dąży do osiągnięcia poziomu inteligencji i zdolności adaptacyjnych, które prawdopodobnie znacznie przewyższą istniejące systemy AI.

Zasadnicze różnice

Podczas gdy Bard i Claude są wciąż na etapie ulepszania, ChatGPT i Bing już wykazują zaawansowaną inteligencję i użyteczność – informacje zwrotne wydają się na ogół bardziej zgodne z oczekiwaniami, a odpowiedzi bardziej wyrafinowane.
ChatGPT (mimo nowej funkcji generowania obrazów) i Claude specjalizują się głównie na interakcjach tekstowych, zaś Bing i Bard mają na celu zbudowanie półautomatycznej wyszukiwarki internetowej. Wczesne demonstracje sugerują, że Bard ma pewne problemy z dokładnością wobec innych chatów, ale ogromny zasób Google może dać Bardowi przewagę w rozmowach opartych na faktach.
ChatGPT i Claude zdecydowanie przewyższają dwa inne chatboty pod względem wielkości okna kontekstowego. ChatGPT (GPT-4 Turbo) jest w tym momencie w stanie przetworzyć 128 000 tokenów (odpowiednik 300 stron tekstu), a Claude – 100 000 tokenów. Pozwala im to lepsze odczytywanie i generowanie odpowiedzi w kontekście, co sprawia, że mają ogromny potencjał do zadań wymagających rozumienia i precyzji.

Gdzie najlepiej sprawdzą się poszczególne chatboty AI?

ChatGPT

Możliwość prowadzenia wieloturowych rozmów. Na tle innych chatbotów, działających w formacie pytanie-odpowiedź, ChatGPT może utrzymywać kontekst rozmowy i generować odpowiedzi, które są istotne dla poprzednich tur.
Silnik NLP ChatGPT zawiera komponent analizy nastrojów pozwalający zrozumieć emocje stojące za zapytaniami użytkowników. Funkcja ta jest przydatna dla firm chcących zapewnić empatyczną obsługę klienta, dostarczyć mu spersonalizowane rekomendacje dotyczące produktów, w oparciu o jego preferencje i historię zakupów.
Może pomóc firmom różnych branż automatyzować operacje obsługi klienta, zmniejszając obciążenie personelu i skracając czas reakcji.
Osoby prywatne mogą go użyć jako wirtualnego asystenta do doskonalenia umiejętności językowych – w naturalny sposób można z tym asystentem ćwiczyć nie tylko pisanie, ale i mówienie.

Bard

Dzięki temu, że przeszukuje na bieżąco cały Internet i zbiera najświeższe dane z całego świata, jego odpowiedzi są zawsze aktualne i dodatkowo modyfikowane.
Ma nową funkcję przesyłania obrazów za pomocą Obiektywu Google oraz otrzymywania odpowiedzi w formie obrazów z wyszukiwarki Google.
Można go użyć do zadań na żywo, np. do utworzenia dokumentu z planem podróży lub spotkania czy przygotowania reklamy online lub pisania artykułu na blog.
Google twierdzi, że Bard jest świetny w pisaniu kodu – obsługuje ponad 20 języków programowania, jak: C++, Go, Java, JavaScript, Python, TypeScript.

Bing (obecnie Copilot)

Opracowany głównie do wyszukiwania i zoptymalizowany pod kątem lepszego zrozumienia przetwarzania języka naturalnego niż np. ChatGPT. I choć Bing jest od niego mniej elastyczny i kreatywny, ma kilka unikalnych funkcji, które wynikają z bezpośredniej integracji z wyszukiwarką internetową.
Funkcja generowania obrazów daje możliwość zachowania płynności „rozmowy”, dając uwagi na bieżąco, bez konieczności wpisywania za każdym razem kolejnych wymogów dotyczących obrazu.

Claude

Innowacyjne w nim jest jego uczenie się z wielu różnych źródeł danych – tekstu, obrazów, a także ludzkich zachowań. Pozwala to systemowi rozwinąć bogate zrozumienie świata i jego złożoności; może to przynieść znaczące implikacje dla branż takich jak obsługa klienta, by zapewnić im bardziej angażujące wsparcie.
Zdolność do szybkiego i dokładnego identyfikowania obiektów i wzorców na obrazach może okazać się w pewnych dziedzinach nieocenione, np. w obrazowaniu medycznym – systemy AI mogą pomóc lekarzom w dokładniejszym diagnozowaniu i leczeniu pacjentów.

Koszt i dostępność

ChatGPT

OpenAI oferuje trzy plany korzystania z niego:

podstawowy – darmowy, z dostępem do modelu GPT-3,5;
ChatGPT Plus – 20 USD miesięczne, z dostępem do modelu GPT-4, wtyczek, przeszukiwania internetu i generowania obrazu;
ChatGPT Enterprise – dedykowane rozwiązanie dla firm, z cenami ustalanymi indywidualnie przez dział sprzedażowy.

Bard

Jest całkowicie darmowy i mówi się, że przynajmniej przez pewien czas tak pozostanie. Google planuje integrację tego narzędzia ze swoimi innymi produktami.

Początkowo był do dyspozycji w USA i Wielkiej Brytanii, zaś od lipca 2023 jest dostępny w całej Europie i ponad 40 językach, także w polskim.

Bing (obecnie Copilot)

Do niedawna był dostępny tylko w przeglądarce Microsoft Edge; z końcem sierpnia 2023 Bing AI trafił też do przeglądarki Google Chrome i powoli się adaptuje. Microsoft pracuje nad wprowadzeniem jego funkcji do innych przeglądarek na urządzeniach stacjonarnych i mobilnych.

Bing od początku stał się fenomenem w kwestii darmowego dostępu. Obecna innowacja utrzymuje ten stan – użytkownicy z różnych zakątków świata mają dostęp do obu wersji zaawansowanych narzędzi: Bing AI i Bing Image Creator. Dziennie można w Bing wygenerować 50 bezpłatnych grafik (mając konto Microsoft). Chatbot rozumie polecenia zarówno po angielsku, jak i po polsku.

Claude

Do niedawna Claude 2 dopuszczał użytkowników tylko z USA i Wielkiej Brytanii i oferował priorytetową płatną usługę (z ofertą pięciokrotnie większej liczby wiadomości w porównaniu do wersji darmowej). Jesienią br. firma otworzyła dostęp dla 95 krajów na świecie – większości w Europie, także Azji, Afryki, Ameryki Płd. i Australii.

Informacji o nowym planie subskrypcji dla każdej z wersji, tj. Claude 1, Claude 2 i Claude Instant należy szukać na stronie Anthropic. Wiadomo na razie, że różne poziomy cenowe umożliwiają dostosowanie dostępu do potrzeb.

Czy musimy wybierać? Integracja chatbotów AINowością na liście produktów jest aplikacja umożliwiająca użytkownikom wygodną interakcję z wszystkimi chatbotami. To aplikacja Poe AI firmy Quora na komputery Mac – ekskluzywna możliwość czatowania na żywo z ChatGPT-4 czy Claude. Po sierpniowym ogłoszeniu aktualizacji produktu, Poe zaprezentował trzy dodatkowe boty zapewniające dostęp do modelu Meta Llama 2.

Podsumowanie

Wymienione chatboty AI i ich ciągłe ulepszanie jest symbolem ogromnego potencjału tej dziedziny. Co prawda wszystkie LLM wymagają ostrożności w związku z potencjalną dezinformacją, ale nadal dają ekscytujący wgląd w przyszłość AI.

Zmiany na rynku chatbotów i GenAI zachodzą tak dynamicznie, że potrzeba dużo wysiłku i umiejętności oceny sytuacji, aby być na bieżąco. Jeśli szukasz wiarygodnego i aktualnego źródła wiedzy, zajrzyj na nasz kanał YouTube Beyond AI. Regularnie publikujemy tam informacje o najnowszych rozwiązaniach i praktycznym wykorzystaniu AI.

Powiązane artykuły

Transkrypcja nagrań na tekst – wybierz najlepsze narzędzie online

Automatyczna transkrypcja AI to przyszłość. Dowiedz się, jak AI eliminuje ograniczenia ręcznego przepisywania i przyspiesza pracę. Wypróbuj najlepsze rozwiązania online.

Przeczytaj Artykuł

LLM – jak duże modele językowe zmieniają przyszłość?

Dowiedz się, jak duże modele językowe (LLM) rewolucjonizują przetwarzanie języka, redefiniują branże i tworzą nowe wartości biznesowe w erze AI.

Przeczytaj Artykuł