W maju na Google I/O firma zaprezentowała nową multimodalną sztuczną inteligencję znaną jako Google Gemini. Podczas tej premiery Google opowiadał o tym, co może zrobić Gemini i jak zmieni wiele produktów firmy. Jednak dopiero na początku grudnia mogliśmy zobaczyć Gemini w akcji i zobaczyć, jak zacznie zmieniać telefony Pixel firmy Google. Teraz, gdy Gemini jest już dostępny na całym świecie, korzystając z serii Pixel 8, a przed nami jeszcze więcej , stworzyliśmy listę wszystkich funkcji, jakie do tej pory można wykonać na telefonie Pixel, oraz kilka krótkich pomysłów na funkcje, które mamy nadzieję zobaczyć w przyszłości.
Z której wersji Google Gemini korzystają telefony Pixel?
Gemini to architektura sztucznej inteligencji nowej generacji firmy Google. Został zaprojektowany od podstaw, aby zastąpić obecny model sztucznej inteligencji Google, znany jako PaLM2. Obecnie PaLM2 jest tym, co działa pod maską dla różnych funkcji i produktów Google AI, takich jak Google Bard, Duet AI w aplikacjach Workspace itp. Pomyśl o Gemini jako o czymś podobnym do GPT-4, podstawowej architektury, która napędza popularną ChatGPT. Dużą różnicą między Gemini w porównaniu z PaLM2 lub wydarzeniem GPT-4 jest sposób, w jaki został zbudowany. Większość modeli multimodalnych jest budowana fragmentarycznie — budujesz jedną rzecz do wykonania zadania A, a drugą do wykonania zadania B, a następnie łączysz je w całość, tak aby system mógł wykonać zadanie C. Jednak według Google Gemini jest „natywnie multimodalny, wstępnie – od początku przeszkolony w oparciu o różne metody.” Teoretycznie powinno to sprawić, że będzie on szybszy, dokładniejszy i wydajniejszy w wykonywaniu swoich zadań. Powinien także umożliwiać mu wykonywanie zadań, których nie są w stanie wykonać inne systemy. Istnieją trzy wersje Gemini, z których każda jest przeznaczona do określonego rodzaju pracy. Bliźnięta Ultra jest DUŻY. To model multimodalny, który wykona niezwykle złożone zadania. Bliźnięta Pro będzie zasilać produkty Google dla konsumentów, które działają w chmurze. Pomyśl o Google Bard i innych produktach PaLM2. I wreszcie jest Bliźnięta Nano, który został zaprojektowany do natywnego działania na urządzeniu i jest wyświetlany na telefonach Pixel. Jest to najmniej wydajna wersja Gemini, ale może być najbardziej praktyczna w użyciu, ponieważ nie będzie wymagać połączenia do transmisji danych i można ją włączyć bezpośrednio do produktów konsumenckich. Więcej o różnicach pomiędzy trzema wersjami Gemini przeczytacie w naszym objaśnieniu pod linkiem. Co zatem telefony Pixel mogą zrobić z Gemini Nano? Dowiedzmy Się!
Funkcja Gemini Nano: Podsumowania rejestratora
Na Google Pixel 8 Pro możesz korzystać z funkcji opartej na technologii Gemini Nano w aplikacji Rejestrator. Po otwarciu transkrypcji nagrania zobaczysz nowy przycisk Podsumuj. Kliknięcie tego spowoduje wykorzystanie mocy Gemini do utworzenia szybkiego podsumowania transkrypcji. Aby to zadziałało, musisz używać Pixela 8 Pro z aktualizacją z 6 grudnia 2023 r. lub nowszą. Będziesz także potrzebować najnowszej wersji aplikacji Rejestrator. Ponieważ jest to funkcja Gemini Nano, podsumowaniem zajmuje się procesor Twojego telefonu. Oznacza to, że nie musisz mieć połączenia z Internetem, aby przycisk Podsumuj działał.
Funkcja Gemini Nano: Inteligentna odpowiedź Gboard
Jest to również obsługiwane tylko na Pixelu 8 Pro z łatką z grudnia 2023 r., przynajmniej na razie. Jest to również funkcja dostępna w wersji deweloperskiej, co oznacza, że należy ją włączyć ręcznie. Zasadniczo umożliwia to otrzymywanie sugestii odpowiedzi w ramach czatów WhatsApp. Działa poprzez skanowanie najnowszych czatów w wątku, a następnie wyświetlanie sugerowanej odpowiedzi, która byłaby odpowiednia w danym momencie. Zamiast ręcznie wpisywać tę odpowiedź, po prostu klikniesz sugestię, a Gemini wykona całą pracę za Ciebie. Oczywiście nie różni się to od starej Inteligentnej Odpowiedzi. Ponieważ jednak korzysta z Gemini Nano, będzie działać szybciej, lepiej i korzystać z procesora Twojego telefonu, a nie z chmury. Aby włączyć tę funkcję, musisz mieć dostęp do Opcji programisty. Aby aktywować tę opcję na swoim Pixelu 8 Pro, przejdź do Ustawienia > Informacje o telefonie i przewiń w dół, aby znaleźć numer kompilacji oprogramowania. Stuknij ten numer siedem razy, a następnie wprowadź swój PIN. Teraz idź do Ustawienia > System > Opcje programistyczne i przewiń w dół, aż znajdziesz Ustawienia AICore. Kliknij to i upewnij się, że Włącz opcję trwałą AICore przełącznik jest włączony. Dzięki temu uzyskasz dostęp do inteligentnej odpowiedzi Gboard w WhatsApp obsługiwanym przez Gemini Nano.
Gemini Pro działa również w Google Bard
Edgar Cervantes / Android Authority 6 grudnia 2023 r. Google oficjalnie włączył Gemini Pro w Google Bard. Według Google dzięki temu Bard będzie „znacznie bardziej zdolny do rozumienia i podsumowywania, wnioskowania, kodowania i planowania”. Jeśli dzisiaj komunikujesz się z Bardem za pomocą tekstu w języku angielskim, będziesz używać Gemini. Obecnie nie działa to w żaden inny sposób niż podpowiedzi tekstowe, więc przesyłanie obrazów lub nagrań głosowych do Barda będzie nadal korzystać z PaLM2. Technicznie rzecz biorąc, nie jest to funkcja Pixel, ale możesz uzyskać dostęp do Bard na Pixelu za pośrednictwem przeglądarki. Możesz to wypróbować na portalu internetowym Barda. Jak dotąd nie widzieliśmy dużej różnicy pomiędzy Gemini Pro Bard i PaLM2 Bard. Jednak to dopiero początek, więc w przyszłości możemy spodziewać się bardziej znaczących wyników.
Mamy nadzieję, że wkrótce pojawią się funkcje oparte na technologii Gemini w telefonach Pixel
Ryan Haines / Android Authority Widzieliśmy dopiero kilka funkcji integrujących Gemini, ale niewątpliwie jest ich znacznie więcej. Poniżej mamy kilka pomysłów na nowe, fajne sztuczki, które mogą zrobić telefony Pixel. Żeby było jasne, nie są to plotki ani rzeczy, o których Google powiedział nam, że mogą być w drodze — to tylko pomysły na to, co mamy nadzieję zobaczyć.
Funkcje fotograficzne i edycyjne
Google wykorzystuje już dużo sztucznej inteligencji do fotografowania, filmowania i edycji multimediów na Pixelach. Dzięki tym narzędziom Pixele są jednymi z najlepszych telefonów z aparatem, jakie można kupić. Gemini może podnieść te funkcje na wyższy poziom i tworzyć zdjęcia i filmy, jakich nigdy wcześniej nie widzieliśmy na telefonie. Jako przykład tego, co to może oznaczać, Pixel 8 Pro ma nową funkcję o nazwie Video Boost. Przetwarza to każdą klatkę filmu przy użyciu tych samych zasad, co przetwarzanie Pixela w przypadku przechwyconego zdjęcia. Aby jednak skorzystać z funkcji Video Boost, musisz nagrać ten film na Pixelu 8 Pro, przesłać go do Google, poczekać, aż Google go przetworzy, a następnie pobrać. Być może w pewnym momencie w przyszłości proces ten będzie mógł nastąpić na urządzeniu dzięki mocy Gemini. Idąc dalej, w odległej przyszłości może się to zdarzyć nawet w czasie rzeczywistym podczas nagrywania klipu. Podobnie mamy już Magic Editor dla telefonów Pixel. Jednak w tej chwili jest to dość uproszczone i wymaga również połączenia do transmisji danych. Dzięki Gemini Magic Editor może stać się kolejnym Photoshopem, ale jednocześnie być tak łatwym w obsłudze, że każdy może to zrobić. Biorąc pod uwagę popularność pikseli w przypadku zdjęć i filmów, jesteśmy pewni, że Google ma wiele dużych planów wobec Gemini w tej dziedzinie.
Złożone mapowanie
Mapy Google oferują już mnóstwo możliwości w zakresie map i wskazówek. Jednak nawet na komputerze nie można tego zrobić zbyt skomplikowanie. Na przykład nie możesz uwzględnić w swojej trasie zmiennych, takich jak prognoza pogody, koncerty lub inne wydarzenia, które mogłyby spowodować znaczne wzrosty ruchu lub Twoje osobiste nawyki za kierownicą. Jednak w przypadku Gemini wszystkie te zmienne mogą mieć znaczenie. Możesz poprosić o wskazówki dojazdu do danej lokalizacji, a Google może pobrać te wszystkie czynniki, aby wskazać Ci idealną trasę. Może nawet dać Ci niezwykle dokładne okno czasowe na przybycie. Dzięki nadchodzącemu Asystentowi Google z Bardem możesz nawet sprawić, że tworzenie złożonej nawigacji będzie całkowicie naturalne. Możesz na przykład powiedzieć: „Hej, Google, potrzebuję wskazówek dojazdu do pracy, które ominą trasę 101 i dotrą tam o zwykłej porze”. To polecenie jest zbyt skomplikowane, aby Mapy/Asystent mogły je teraz zrozumieć, ale Gemini mogłoby to umożliwić.
Szybka produktywność
Zaczynamy widzieć, że Bard potrafi tworzyć tabele w Arkuszach, dokumenty w Dokumentach i e-maile w Gmailu, korzystając wyłącznie z podpowiedzi głosowych. Jednak w przypadku Gemini może to stać się niezwykle potężne. Wyobraź sobie, że możesz nagrać spotkanie z Rejestratorem, a następnie poprosić Barda/Asystenta o utworzenie tabeli zawierającej wszystkie główne omówione punkty danych. Możesz też sobie wyobrazić, że Gmail automatycznie wypisuje Ci subskrypcję dowolnej listy e-mailowej, której nie otwierałeś w ciągu ostatnich 90 dni. Możesz nawet sporządzić raport w Dokumentach, a następnie poprosić o jego sformatowanie w określonym stylu, na przykład w stylu Chicago lub Associated Press Stylebook, co może zaoszczędzić mnóstwo czasu.
Jakie funkcje Gemini najbardziej ekscytują Cię w Pixelu? Jakie funkcje masz nadzieję zobaczyć w przyszłości? Daj nam znać w komentarzach! Uwagi