Nie tak dawno temu OpenAI zaprezentowało nową wersję ChatGPT, znaną jako ChatGPT-4V lub 4 Vision. Ta wersja umożliwia użytkownikom przesyłanie obrazów, zdjęć, tekstu lub problemów matematycznych, a następnie może je analizować i odpowiadać na pytania na podstawie przesłanego obrazu. Ta niezwykle zaawansowana funkcja jest obecnie dostępna tylko dla posiadaczy kont ChatGPT Plus. Jeśli jesteś subskrybentem, oto dziewięć rzeczy, które możesz zrobić za pomocą ChatGPT-4 Vision. Aby zobaczyć pełną demonstrację korzystania z ChatGPT-4 Vision do wykonania tych zadań, obejrzyj wideo umieszczone powyżej.
Identyfikuj i kontekstualizuj obiekty
Andy Walker / Android Authority Zacząłem od czegoś prostego: zdjęcia rośliny domowej, która wyglądała jak kapusta rosnąca w doniczce. Poprosiłem ChatGPT z Vision o identyfikację. Okazuje się, że jest to jarmuż lub kapusta ozdobna, znana z żywych i kolorowych liści i często wykorzystywana do celów dekoracyjnych.
Konwertuj odręczne notatki na kod
Andy Walker / Android AuthorityJedną z imponujących funkcji ChatGPT-4 Vision jest możliwość czytania odręcznych notatek i diagramów. Przetestowałem to za pomocą schematu blokowego opisującego prostą pętlę. Pomimo słabego pisma i rysunku, ChatGPT zdołał go dokładnie zinterpretować, a nawet przekonwertować na kod Pythona.
Konwertuj wykresy na tabele
Andy Walker / Android Authority Wykorzystałem także wykres z niedawnego filmu o chipsecie Tensor G3, który pokazuje wyniki wielordzeniowych testów Geekbench 6. Poprosiłem ChatGPT o przekształcenie tego w tabelę i zrobiło to z łatwością. Ta funkcja może być przydatna do konwertowania danych graficznych na łatwiejszy w obsłudze format.
Oblicz wizualne problemy matematyczne
Andy Walker / Android Authority Następnie przedstawiłem mu wizualną łamigłówkę matematyczną z udziałem fajerwerków i gwiazd. Pomimo pewnego zamieszania związanego z kolorami, ChatGPT poprawnie zidentyfikował fajerwerki, które nie zostały wystrzelone.
Opisz i analizuj wykresy
Andy Walker / Android Authority Następnie przesłałem wykres przeliczeniowy dolara amerykańskiego na euro obejmujący okres jednego roku. ChatGPT dokładnie opisał wykres, a nawet przedstawił analizę wartości dolara amerykańskiego w porównaniu do euro. Należy jednak pamiętać, że ChatGPT nie powinien być używany do udzielania porad finansowych lub medycznych.
Transkrypcja tekstu na obrazie
Andy Walker / Android AuthorityDla osób zainteresowanych badaniem historii rodziny przydatnym narzędziem może być ChatGPT. Przesłałem obraz dokumentu spisu powszechnego Wielkiej Brytanii z 1851 r. i poprosiłem ChatGPT o jego transkrypcję. Pomimo drobnego błędu w transkrypcji nazwiska, spisał się znakomicie.
Interpretuj złożone obrazy utworzone przez sztuczną inteligencję
Andy Walker / Android AuthorityPrzetestowałem to również na wygenerowanym przez sztuczną inteligencję obrazie krajobrazu morskiego z dwoma księżycami. ChatGPT dostarczył szczegółowy opis obrazu, uwzględniając najmniejsze elementy, demonstrując jego zdolność do interpretacji i opisu złożonych wizualizacji.
Twórz scenariusze lekcji dla nauczycieli
Andy Walker / Android AuthorityNa koniec dałem mu obraz niezrównoważonego drzewa binarnego i drzewa AVL i poprosiłem o stworzenie na podstawie tego obrazu planu lekcji dla zajęć z informatyki w szkole średniej. Opracowano kompleksowy plan lekcji, demonstrując jego potencjał jako narzędzia edukacyjnego.
Czytaj „ukryte” wiadomości
Andy Walker / Android AuthorityW ramach zabawnego testu końcowego przesłałem pozornie pusty żółty obraz z ukrytą wiadomością. ChatGPT pomyślnie odczytał ukrytą wiadomość napisaną w kolorze ledwo zauważalnym gołym okiem. To pokazuje zdolność ChatGPT-4 Vision do wykrywania subtelnych różnic kolorów.
Podsumowując, ChatGPT-4 Vision to potężne narzędzie o wielu zastosowaniach, od analizy obrazu po planowanie edukacji. To ekscytujący rozwój w dziedzinie sztucznej inteligencji i nie mogę się doczekać dalszych postępów. Uwagi