Edgar Cervantes / Android Authority Mamy sporo przewodników dotyczących korzystania z Amazon Alexa w Android Authority, ale być może zainteresuje Cię technologia leżąca u podstaw asystenta głosowego. Oto krótkie wyjaśnienie działania Alexy, od jej ogólnej struktury po sposób, w jaki słyszy i reaguje na polecenia głosowe.
Jak działa Alexa: przegląd
Podstawowymi elementami Alexy, z punktu widzenia użytkownika, są konto Amazon i urządzenie obsługujące Alexę podłączone do Internetu, zwykle inteligentny głośnik lub wyświetlacz. Konto umożliwia utworzenie profilu, zapisanie ustawień oprogramowania i sprzętu oraz połączenie zgodnych urządzeń, usług i akcesoriów. Urządzenia Alexa nasłuchują poleceń głosowych, przesyłają je na serwery Amazon w celu przetłumaczenia, a następnie dostarczają wyniki w postaci plików audio, wideo lub wyzwalaczy urządzeń/akcesoriów. Niektóre modele służą również jako kontrolery Matter, routery Thread Border i/lub koncentratory Zigbee dla kompatybilnych produktów inteligentnego domu. Wszystkie polecenia głosowe zaczynają się od słowa budzenia, które nakazuje urządzeniu nasłuchiwać. Domyślną wartością jest oczywiście „Alexa”, ale korzystając z aplikacji asystenta na Androida lub iPhone'a/iPada, możesz zmienić tę opcję na „Amazon”, „Komputer”, „Echo” lub „Ziggy”. W rzeczywistości aplikacja jest trzecim podstawowym komponentem, ponieważ jest (zwykle) potrzebna do konfiguracji urządzenia i łączenia rzeczy z kontem Amazon. Amazon prawie całkowicie wycofał konfigurację opartą na Internecie. Istnieje wiele możliwych poleceń Alexy, więc nie będziemy się tutaj zagłębiać, ale reprezentują one polecenia głosowe w języku naturalnym dotyczące wszystkiego, od pytań wiedzy po odtwarzanie multimediów i inteligentne sterowanie domem. Na przykład: Niektóre funkcje wymagają włączenia „umiejętności” za pośrednictwem witryny Amazon lub aplikacji Alexa. Używając powyższych poleceń jako przykładów, muzyka nie działałaby bez umiejętności połączenia konta Spotify, a sterowanie termostatem wymagałoby odpowiednich umiejętności związanych z marką, takich jak Ecobee lub Google Nest. Większość umiejętności można włączyć bezpłatnie, ponieważ tak naprawdę są one po prostu wspieranie istniejących produktów i usług. Płatne umiejętności są rzadkie, ale istnieją, takie jak rozszerzone pętle wysokiej jakości dla dźwięków snu. Aplikacja Alexa umożliwia również wykonywanie procedur, co jest po prostu innym określeniem automatyzacji. Możesz dowiedzieć się więcej na ich temat w naszym przewodniku po procedurach. Krótka wersja jest taka, że są tworzone przez użytkowników i uruchamiają akcje na podstawie poleceń głosowych lub różnych warunków, takich jak lokalizacja, stan akcesoriów czy pora dnia. Na przykład rutyna „Dzień dobry” może włączyć światła, odtworzyć wiadomości NPR i podgrzać ekspres do kawy za pomocą inteligentnej wtyczki, gdy powiesz „Alexa, zacznij mój dzień”. Aby inteligentne akcesoria domowe mogły być kontrolowane przez Alexę, muszą być specjalnie wspierać platformę lub uniwersalny standard Matter. Dostępny jest jednak niemal każdy rodzaj akcesoriów. Oprócz wtyczek, termostatów i inteligentnych żarówek możesz kupić wszystko, od oczyszczaczy powietrza po odkurzacze automatyczne. Są one parowane za pomocą aplikacji Alexa, niezależnie od tego, czy łączą się za pomocą umiejętności, Wi-Fi, Thread i/lub Zigbee.
Więcej: Jak korzystać z Amazon Alexy
Jak Alexa słyszy?
Dhruv Bhutani / Android Authority Chociaż wszystkie urządzenia wyposażone w Alexę mają co najmniej jeden mikrofon, inteligentne głośniki i wyświetlacze często mają dwa lub więcej. Ułatwia to izolowanie głosów od hałasu otoczenia, ponieważ tworzy dane kierunkowe, które można porównywać i filtrować za pomocą algorytmów przetwarzania sygnału. Istnieją oczywiście ograniczone granice — nie można stać obok głośnego telewizora lub zmywarki i oczekiwać, że głośnik Echo zrozumie. Wbrew temu, co mogłeś usłyszeć, Alexa nie nagrywa w sposób ciągły wszystkiego, co mówisz. Nieustannie nasłuchuje słowa budzenia, a kolejny dźwięk (kończący się po tym, jak przestaniesz mówić) jest zwykle wysyłany do Amazon w celu interpretacji. Mówimy zwykle, ponieważ Amazon eksperymentował z przetwarzaniem w trybie offline na urządzeniach takich jak Echo czwartej generacji lub Echo Show 10, które mają jeden z procesorów AZ Neural Edge firmy. Wygląda jednak na to, że z nieznanych powodów odeszli od tego pomysłu. Amazon twierdzi, że szyfruje przesłane nagrania audio, ale domyślnie je zapisuje i analizuje „niezwykle małą próbkę” anonimowych klipów, aby poprawić wydajność Alexy. Nagrania były wykorzystywane w sprawach karnych, a niektóre dźwięki lub frazy mogą zostać błędnie zinterpretowane jako słowa budzące. Jeśli więc obawiasz się o prywatność, warto zrezygnować z zapisywania historii głosu lub regularnie ją usuwać. Więcej szczegółów i porównań znajdziesz w naszym przewodniku po prywatności w inteligentnym domu.
Zobacz też: Jak skonfigurować Alexę na wypadek sytuacji awaryjnych
Jak Alexa reaguje?
Powodem, dla którego Alexa była do niedawna całkowicie zależna od chmury, są wymagania związane z przetwarzaniem języka naturalnego. Każde polecenie należy podzielić na poszczególne jednostki mowy zwane fonemami, a jednostki te są następnie porównywane z bazą danych w celu znalezienia najbliższego dopasowania słów. Ponadto oprogramowanie musi identyfikować strukturę zdań, a także terminy istotne dla różnych podsystemów. Jeśli powiesz „ustaw termostat na chłodzenie”, Alexa będzie wiedziała, że powinna przekazać to do inteligentnego domu API (interfejs programowania aplikacji). Alexa potrafi rozróżnić różne akcenty i dialekty, ale istnieją unikalne bazy danych dla każdego języka obsługiwanego przez Amazon, w tym różnice regionalne. Użytkownicy muszą wybrać je w aplikacji Alexa, jeśli ich urządzenie nie jest dostarczane z fabrycznie załadowanymi urządzeniami. Na przykład osoba mówiąca w programie American Echo nie rozumie niemieckiego od razu, co może potwierdzić każdy, kto zostanie poproszony o piosenki Nachtmahra lub Grausame Töchtera. Uczenie maszynowe odgrywa kluczową rolę, ponieważ kontekst i historia dają Alexie lepszą szansę na odgadnięcie Twojego intencje. Właśnie dlatego Amazon tak bardzo angażuje się w analizę nagrań od rzeczywistych klientów. Ludzie mają tendencję do oceniania znaczenia rozmowy za pomocą kontekstu i historii — stosując ścisłą logikę komputerową, Alexa może zinterpretować coś w rodzaju „włącz muzykę CHVRCHES” (szkockiego zespołu synthpopowego) jako prośbę o usłyszenie muzyki chórów kościelnych. Alexa może i popełnia błędy, ale morze danych, do których Amazon ma dostęp, oznacza, że asystentka ewoluuje z biegiem czasu.
Często zadawane pytania
Czy Alexa wymaga połączenia z Internetem? Skutecznie. Chociaż niektóre urządzenia mogą umożliwiać sterowanie głosowe w trybie offline głośnością i podłączonymi do koncentratora inteligentnymi akcesoriami domowymi lub sprawdzanie i anulowanie takich rzeczy, jak timery i przypomnienia, prawie wszystko inne wymaga komunikacji z serwerami Amazon i/lub połączonymi usługami stron trzecich. Nawet urządzenia, które mogą lokalnie przetwarzać dźwięk, nadal przesyłają transkrypcje poleceń głosowych. Czy Alexa zawsze słucha? Zawsze nasłuchuje sygnału aktywacji, zakładając, że nie wyciszyłeś mikrofonów urządzenia. Co jednak najważniejsze, nie nagrywa wszystkiego. Nagrywanie jest uruchamiane dopiero po wykryciu słowa budzącego i kończy się, gdy przestaniesz mówić (a przynajmniej Alexa myśli, że to zrobiłeś). Jeśli obawiasz się o prywatność, musisz zrezygnować z zapisywania tych nagrań lub regularnie usuwać historię głosu. Czy Alexa liczy się jako sztuczna inteligencja? Według niektórych definicji. Ma ograniczone możliwości uczenia się i rozwiązywania problemów, na przykład interpretowania poleceń głosowych, do których nie został wcześniej zaprogramowany. To powiedziawszy, zwykle opiera się na tak zwanej „słabej” sztucznej inteligencji. Nie wykazuje takich samych zdolności adaptacyjnych jak umysł ludzki czy zwierzęcy. Nie można prowadzić prawdziwej rozmowy, a jej nauka odbywa się stopniowo, a nie w locie. Z pewnością nie jest to poziom odczuwający, niezależnie od tego, jak trudno to zdefiniować. Amazon planuje w najbliższej przyszłości wprowadzić generatywne rozmowy oparte na sztucznej inteligencji, ale warto pamiętać, że technologia generatywna symuluje jedynie naturalne rozmowy — za chatbotem nie stoi mózg ani osobowość . Uwagi