Calvin Wankhede / Android AuthorityMinęła już znacznie rocznica wydania ChatGPT. Od tego czasu chatbot otrzymał wiele aktualizacji, które dodały funkcje, takie jak niestandardowe instrukcje, GPT i nowsze modele, takie jak GPT-4 Turbo. Jednak w ciągu ostatniego roku konkurencja również zaostrzyła się, a Microsoft Copilot i Gemini firmy Google czasami zapewniały lepsze wyniki w porównaniu z ChatGPT. Mimo że chatbot pozostaje popularny do dziś, uważam, że ChatGPT może czerpać inspirację z konkurencji. W tym celu przedstawiam pięć rzeczy, które chciałbym zobaczyć w ChatGPT w nadchodzących miesiącach.
1. Wyszukiwanie i sprawdzanie faktów dla wszystkich
Calvin Wankhede / Android AuthorityWszystkie duże modele językowe, takie jak ten obsługujący ChatGPT, cierpią z powodu jednego głównego problemu: halucynacji. Termin ten odnosi się do tendencji współczesnej sztucznej inteligencji do generowania tekstu, który na pozór brzmi wiarygodnie, ale jest pełen nieścisłości w zakresie faktów lub wręcz fałszywych informacji. Efekt ten można znacznie złagodzić, „podłączając” ChatGPT do Internetu, podobnie jak Ty i ja wyszukujemy zapytanie w Google. ChatGPT uzyskał możliwość przeszukiwania Internetu na początku 2023 r., ale od tego czasu funkcja ta jest zablokowana za zaporą płatniczą. W szczególności musisz płacić 20 USD miesięcznie za ChatGPT Plus, aby dodać obsługę przeglądania stron internetowych. Z drugiej strony mamy chatboty, takie jak Copilot, Perplexity AI i Gemini, które oferują tę funkcję w standardzie i za darmo. Mając to na uwadze, mam nadzieję, że OpenAI zapewni obsługę przeglądania sieci wszystkim użytkownikom, niezależnie od tego, czy mają aktywne abonament czy nie. Alternatywa jest niebezpieczna, ponieważ oznacza, że ChatGPT może w dalszym ciągu rozpowszechniać niedokładne informacje i w dłuższej perspektywie zszarganić swoją reputację. Nie sądzę, że proszę o zbyt wiele — OpenAI może nadal trzymać znacznie lepszy model GPT-4 w ramach subskrypcji.
2. Ulepszenia grafiki generowane przez sztuczną inteligencję i edycja obrazu
Chociaż ChatGPT zaczynał wyłącznie jako chatbot tekstowy, ostatecznie zyskał możliwość tworzenia grafiki generowanej przez sztuczną inteligencję. Wykorzystuje pod maską własny model zamiany tekstu na obraz DALL-E OpenAI, co oznacza, że zapewnia doskonałe wyniki. Brakuje jednak wielu funkcji, które można uzyskać, korzystając bezpośrednio z generatora obrazów AI. Jedyne, co może zrobić ChatGPT, to utworzyć obraz na podstawie podpowiedzi tekstowej. Nie możesz prosić o drobne modyfikacje w obrębie pojedynczego obrazu, chyba że nie masz nic przeciwko chatbotowi tworzącemu zupełnie nowy zestaw obrazów. Nie możesz także przesyłać własnych zdjęć lub obrazów i prosić sztuczną inteligencję o dokonanie na nich edycji, mimo że jest to funkcja dostępna w DALL-E. Wreszcie ChatGPT nie może przeskalować preferowanych obrazów do większych rozdzielczości. Jednym z rozwiązań jest użycie interpretera kodu ChatGPT do wykonania podstawowych edycji (jak pokazano powyżej), ale wykorzystuje to po prostu narzędzia programistyczne, a nie sztuczną inteligencję. Biorąc pod uwagę, że ChatGPT blokuje generowanie obrazów w ramach płatnej subskrypcji, mam nadzieję, że te funkcje związane z grafiką AI sprawią, że ich droga do chatbota. W końcu rywale, tacy jak Stable Diffusion i Midjourney, oferują wszystkie te funkcje niezależnie od poziomu subskrypcji. Nawet pakiet oprogramowania Galaxy AI firmy Samsung umożliwia teraz bezpłatną edycję obrazów opartą na sztucznej inteligencji na smartfonie.
3. Pełne doświadczenie asystenta cyfrowego
Mishaal Rahman / Android AuthorityKilka miesięcy temu obszernie pisałem o funkcji czatu głosowego ChatGPT, która umożliwia prowadzenie długich rozmów z chatbotem. Ta funkcja ostatecznie zeszła z poziomu płatnego, co oznacza, że teraz każdy może z niej korzystać. Jest to jednak wciąż stosunkowo nieznana funkcja, o której większość nawet nie wie. Tryb ten jest dostępny wyłącznie za pośrednictwem aplikacji mobilnej i obecnie jest jedynie wokalnym rozszerzeniem chatbota. Przejdźmy szybko do początków tego roku i znaleźliśmy kod sugerujący, że ChatGPT wkrótce pozwoli Ci ustawić go jako domyślnego asystenta na Androidzie. Niestety Google pobił ChatGPT wypuszczeniem w lutym Gemini, które pozwala teraz zastąpić Asystenta, a nawet wykonywać podstawowe zadania, takie jak ustawianie przypomnień. Tryb czatu głosowego ChatGPT zasługuje na więcej uwagi i rozwoju. Jednakże dla tych z nas, którzy preferują konwersację ChatGPT, mam nadzieję, że funkcja ta będzie nadal rozwijana. Nie mogę się też doczekać, aż chatbot będzie mógł wykonywać takie czynności, jak ustawianie timerów, pobieranie wiadomości i kontrolowanie mojego inteligentnego domu. Na razie musisz przejść do aplikacji mobilnej ChatGPT i dotknąć ikony słuchawek za każdym razem, gdy chciałbym zadać kilka pytań. Wiem, że wydaje się to bardzo przestarzałe.
4. Mniej rozmowne doświadczenie
Edgar Cervantes / Android Authority Być może pomyślisz, że zwariowałem, prosząc chatbota o wysyłanie mniejszej ilości tekstu, ale wysłuchaj mnie. Kiedy zadajesz pytanie ChatGPT, często szukasz tylko małej informacji. Dlaczego więc muszę przeglądać długą preambułę, zanim dojdę do odpowiedzi za każdym razem, gdy korzystam z ChatGPT? W przypadku Siri i Asystenta Google marzyłem o dłuższych odpowiedziach, ale ChatGPT popada w drugą skrajność. Uważam, że Microsoft Copilot osiągnął idealną równowagę między gadatliwością a ilością informacji. Oferuje trzy różne tryby czatu: Kreatywny, Zrównoważony i Precyzyjny, z których możesz wybierać za każdym razem, gdy inicjujesz rozmowę. Jak można się spodziewać po tytułach, Precise skondensuje dane wyjściowe chatbota w zaledwie kilku zdaniach, podczas gdy Creative daje odpowiedź bardziej przypominającą ChatGPT. ChatGPT z mniej szczegółowymi odpowiedziami lub różnymi trybami czatu zmotywowałby mnie do częstszego korzystania z chatbota, chociaż mam nadzieję, że nie odbędzie się to kosztem dokładności.
5. Natywne integracje z usługami zewnętrznymi
Edgar Cervantes / Android AuthorityJeśli kiedykolwiek korzystałeś z Gemini, być może zauważyłeś, że może on czytać Twoje e-maile z Gmaila, a nawet wchodzić w interakcję z różnymi usługami Google, takimi jak Dokumenty, Mapy i Loty. Jest to poziom spójności, jakiego można oczekiwać od prawdziwego asystenta cyfrowego, ale podczas korzystania z ChatGPT zupełnie nie ma tego doświadczenia. Nawet na poziomie płatnym możesz używać niestandardowej funkcji GPT tylko do interakcji z platformami zewnętrznymi, takimi jak Wolfram Alpha i Kajak. Chociaż są przydatne, wymagają od Ciebie zejścia z drogi, aby je włączyć i trwać tylko przez czas trwania czatu. Nie pomaga również to, że OpenAI wycofało teraz funkcję wtyczek, która jednocześnie umożliwiła dostęp do wielu usług zewnętrznych na czacie. Prawdziwy asystent powinien być w stanie pomóc mi zarezerwować lot, zaplanować kalendarz i nie tylko. Wierzę, że prawdziwy ChatGPT nowej generacji to taki, który wchodzi w interakcję z usługami stron trzecich w moim imieniu, bez wcześniejszych instrukcji. Podobnie myślę, że chatbot byłby o wiele bardziej przydatny, gdyby mógł czytać moją pocztę i kalendarz (oczywiście za wcześniejszą zgodą). Zmiany te sprawią, że ChatGPT będzie bardziej spersonalizowany i zapewni mu większą autonomię. Uwagi