Edgar Cervantes / Android Authority Produkty i usługi Google przez lata zyskały reputację zagmatwanych, a projekt Gemini AI nie jest wyjątkiem. Podobnie jak Google Meet, które opiera się na Google Duo i Hangouts, termin Bliźnięta może odnosić się do różnych rzeczy w zależności od kontekstu. Na przykład wiele najnowszych smartfonów, takich jak seria Pixel 8 i Galaxy S24, reklamuje obecność Gemini na pokładzie, ale to nie to samo, co chatbot Gemini, do którego można uzyskać dostęp za pośrednictwem aplikacji lub przeglądarki. Przy tak wielu różnych produktach i usługach Google oznaczonych znakiem Gemini tytuł, uważamy, że warto cofnąć się o krok i rozszyfrować, co to wszystko oznacza.
Co to jest Bliźnięta?
Calvin Wankhede / Android AuthorityGemini odnosi się do chatbota Google I rodzina dużych modeli językowych (LLM) – dwie różne rzeczy, ale wciąż ściśle powiązane. Aspekt chatbota jest stosunkowo prosty do zrozumienia — pomyśl o nim jako o wewnętrznej alternatywie ChatGPT firmy Google. Chatbot Gemini może odpowiadać na pytania, wyszukiwać informacje w Internecie, generować obrazy i nie tylko. Możliwości te wynikają z podstawowego modelu dużego języka sztucznej inteligencji, zwanego także Gemini. Nie jest to jednak pojedynczy, monolityczny LLM — Gemini to rodzina dużych modeli językowych, obecnie dostępna w trzech rozmiarach: Nano, Pro i Ultra. Inaczej mówiąc, Gemini jest analogiczny nie tylko do ChatGPT, ale także rodziny GPT modeli językowych. Google w mylący sposób używa tej samej nazwy dla obu produktów, więc często będziesz musiał odgadnąć znaczenie z kontekstu. Gemini to zarówno chatbot, jak i rodzina dużych modeli językowych. Przykładowo, gdy gigant wyszukiwarek reklamuje Gemini na swoich smartfonach Pixel, jest to nawiązanie do modelu językowego. Jednak nie możesz bezpośrednio rozmawiać z Gemini na Pixelu, przynajmniej jeszcze nie. Zamiast tego telefon wykorzystuje model sztucznej inteligencji do obsługi takich funkcji, jak Inteligentna odpowiedź. Na wypadek, gdybyś chciał dowiedzieć się więcej, przygotowaliśmy listę funkcji obsługiwanych przez Gemini dostępnych w Pixelu 8. Google często odwołuje się do Gemini także w formie chatbota i tak rozpoznaje go większość ludzi. Chatbot ma zastąpić Asystenta Google na Androidzie, co oznacza, że możesz używać Gemini do sterowania inteligentnym domem, wyszukiwania tanich lotów i wszystkiego pomiędzy. Dostęp do niego można jednak uzyskać także za pośrednictwem przeglądarki internetowej, co zapewnia bardziej tradycyjne działanie chatbota. Pomijając podstawy, w projekcie Google dotyczącym sztucznej inteligencji jest jeszcze sporo więcej, co nie jest od razu oczywiste. Od Gemini „1.5 Pro” po subskrypcję Gemini Advanced – oto wszystko, co musisz wiedzieć o żargonie Google dotyczącym sztucznej inteligencji.
1. Bliźnięta Nano
Gemini Nano to najmniejszy model językowy w ofercie Google. Został zaprojektowany tak, aby był smukły i wydajny, dzięki czemu można go uruchamiać bezpośrednio na smartfonach. Jak wspomniano wcześniej, obsługuje szereg funkcji sztucznej inteligencji na urządzeniu, takich jak Magic Compose i podsumowania w aplikacji Rejestrator. Gemini Nano nie oferuje jednak chatbota i nie można się z nim bezpośrednio komunikować. Zaletą jest to, że całe przetwarzanie odbywa się lokalnie, więc nie musisz się martwić, że wrażliwe dane kiedykolwiek opuszczą Twoje urządzenie.
2. Bliźnięta Pro
Gemini Pro to średniej wielkości model językowy, który radzi sobie z szerszą gamą zadań. W szczególności obsługuje domyślny chatbot. Kiedy odwiedzasz gemini.google.com lub korzystasz z aplikacji na smartfona, pod maską korzysta ona z modelu językowego Gemini Pro. Google twierdzi, że pod względem możliwości Gemini Pro jest co najmniej na równi z GPT-3.5 OpenAI, a nawet go przewyższa niektóre przypadki.
3. Bliźnięta Ultra
Gemini Ultra to największy model w rodzinie i, zgodnie z oczekiwaniami, oferuje najwyższy poziom wydajności. Wymaga także największej mocy obliczeniowej, dlatego Google zablokował ją za miesięczną subskrypcję w wysokości 20 dolarów. Więcej na ten temat w dalszej części. Kontynuując wcześniejszą analogię do GPT, Google Gemini Ultra może konkurować z najnowocześniejszym modelem języka GPT-4. Jednak od tego czasu został zastąpiony przez Gemini 1.5 Pro.
4. Gemini 1.5 Pro: najnowszy flagowy model AI firmy Google
Zaledwie kilka miesięcy po wypuszczeniu Gemini w trzech rozmiarach, Google wprowadził model nowej generacji o nazwie Gemini 1.5. Nazwa sygnalizuje niewielką rewizję, podobnie jak OpenAI wypuściło swój najnowszy model GPT-4o jako skromną aktualizację do GPT-4. Według Google Gemini 1.5 Pro dorównuje możliwościom Gemini 1.0 Ultra. A ponieważ jest to model średniej wielkości w generacji 1.5, możemy jedynie stwierdzić, że jest mniej kosztowny obliczeniowo w przeliczeniu na słowo.
5. Bliźnięta zaawansowane
Calvin Wankhede / Android AuthorityPo czterech rozmiarach można by pomyśleć, że Gemini Advanced to kolejny model językowy. Jednak Gemini Advanced w rzeczywistości odnosi się do opcjonalnej subskrypcji Google, która obejmuje dostęp do najbardziej wydajnego modelu językowego (1.5 Pro). Abonament za 20 dolarów miesięcznie może wydawać się wysoki, ale zapewnia także inne korzyści Google One, takie jak 2 TB przestrzeni dyskowej w chmurze. Dodatkowo otrzymujesz Gemini for Workspace i możliwość uruchamiania kodu Pythona bezpośrednio w czatach. Naszym zdaniem jest to hojna oferta, zwłaszcza jeśli weźmiemy pod uwagę, że ani ChatGPT Plus, ani Copilot Pro nie oferują dodatkowej przestrzeni dyskowej w chmurze.
6. Gemini dla Workspace
Google Workspace to kolejny nieco mylący produkt Google, występujący w wersjach konsumenckich i korporacyjnych. Gemini for Workspace jest podobny — jest to inny produkt w zależności od tego, czy jesteś użytkownikiem, właścicielem firmy czy dużym przedsiębiorstwem. Gemini for Workspace skupia się na aspekcie użytkownika, jest to w zasadzie asystent oparty na sztucznej inteligencji w aplikacjach Google, takich jak Gmail, Dokumenty, Prezentacje i Arkusze. Możesz na przykład poprosić Gemini o podsumowanie wiadomości e-mail w Gmailu lub utworzenie tabeli w Arkuszach. Jednak aby uzyskać dostęp do Gemini for Workspace, potrzebujesz subskrypcji Gemini Advanced (patrz wyżej).
7. Generator obrazu Gemini AI
Podobnie jak w przypadku konkurencyjnych chatbotów, możesz poprosić chatbota Google o utworzenie grafiki generowanej przez sztuczną inteligencję. Narzędzie to nie ma nazwy takiej jak Microsoft Designer czy Midjourney — zamiast tego Gemini opiera się na wewnętrznym modelu generowania obrazów Google. Generator obrazów AI Gemini jest bezpłatny, ale na razie obsługuje tylko podpowiedzi w języku angielskim. Nie działa również w Europejskim Obszarze Gospodarczym (EOG), Szwajcarii i Wielkiej Brytanii z nieujawnionych powodów regulacyjnych. Wreszcie chatbot odmówi także generowania obrazów związanych z drażliwymi tematami i odkryłem, że nie będzie mógł odtwarzać ludzkich cech.
8. Jakie języki obsługuje Gemini?
Chatbot Gemini obsługuje 40 różnych języków. Na liście znajduje się wiele najczęściej używanych języków świata, od arabskiego po japoński. Jednak nie wszystkie funkcje są dostępne w tak wielu językach. Na przykład aplikacja mobilna Gemini obsługuje tylko 21 języków.
9. Dostępność Gemini: obsługiwane kraje i regiony
Ogólnie rzecz biorąc, chatbot Gemini jest dostępny w 230 krajach, czyli zasadniczo na całym świecie. Jednak niektóre funkcje, takie jak aplikacja mobilna, są ponownie ograniczone w zależności od tego, gdzie mieszkasz. Na przykład generowanie obrazów AI nie będzie działać w większości krajów Europy.
To wszystko, co musisz wiedzieć. Będziemy aktualizować powyższą listę, gdy Google ogłosi nowe funkcje i warunki związane z Gemini, więc dodaj tę stronę do zakładek i sprawdź później! Uwagi