Kaitlyn Cimino / Android Authority Kiedy w 2010 roku po raz pierwszy zadebiutowali asystenci cyfrowi, tacy jak Siri i Asystent Google, ich zdolność rozumienia języka naturalnego została ogłoszona wręcz rewolucyjna. Jednak prawie dziesięć lat później ich blask przygasł i zamiast nich na scenę wkroczyły konwersacyjne platformy AI, takie jak ChatGPT. Potrafią zrozumieć ogólny język, w tym slang, bez konieczności powtarzania za każdym razem sztywnych poleceń. Ale co dokładnie oznacza konwersacyjna sztuczna inteligencja i jak działa leżąca u jej podstaw technologia? Rozbijmy to.
Co to jest konwersacyjna sztuczna inteligencja?
Konwersacyjna sztuczna inteligencja to najnowsze osiągnięcie w technologii przetwarzania języka naturalnego (NLP), wspomagane przez nowe, przełomowe osiągnięcia w uczeniu maszynowym opracowane przez takie firmy jak Google i OpenAI. Chociaż badacze od dziesięcioleci próbują nauczyć komputery replikowania ludzkiego języka, w ostatnich latach wysiłki te znacznie przyspieszyły. Na przykład nowoczesny chatbot, taki jak ChatGPT, może rozumieć i rozmawiać na różne tematy w różnych stylach językowych. W sercu współczesnej konwersacyjnej sztucznej inteligencji leżą najnowocześniejsze modele dużych języków. Są to modele uczenia maszynowego, które zostały przeszkolone na dużych zbiorach danych, w tym tekstach z książek, Wikipedii, a nawet platform mediów społecznościowych. W miarę trwania szkolenia model identyfikuje wzorce w tekście i tworzy relacje między słowami i zdaniami. Dzięki temu model nie tylko rozumie rozmowy, ale także generuje zupełnie nowy tekst, z którym nigdy wcześniej się nie spotkał. Konwersacyjna sztuczna inteligencja odnosi się do zaawansowanych modeli, które potrafią zrozumieć i reagować na zróżnicowany dialog ludzki. Konwersacyjna sztuczna inteligencja nie ogranicza się tylko do słowa pisanego. Mamy teraz przekonujące silniki głosowe, które potrafią czytać tekst wygenerowany przez sztuczną inteligencję z niemal idealną intonacją, tonem i emocjami. Niedawno pisałem na przykład o trybie czatu głosowego ChatGPT i jego zdolności do brzmienia ludzkiego poprzez dodanie pauz i dźwięków wahania. Wspominałem już o ChatGPT kilka razy, głównie dlatego, że jest to najbardziej rozpoznawalna obecnie sztuczna inteligencja do konwersacji. ChatGPT używa nieco innej wersji GPT-3.5 lub GPT-4, która została specjalnie dostosowana do naśladowania ludzkiego dialogu. Innymi słowy, ChatGPT sam w sobie jest przykładem konwersacyjnej sztucznej inteligencji, ale leżący u jego podstaw model językowy niekoniecznie zasługuje na ten sam tytuł.
Jak działa konwersacyjna sztuczna inteligencja?
W 2017 roku grupa badaczy Google opublikowała artykuł zatytułowany „Attention Is All You Need”. Zaproponowali w nim nowatorską architekturę sieci neuronowej zwaną Transformerem, która umożliwia modelom języka naturalnego selektywne skupianie się na kluczowych częściach zdania w celu zrozumienia kontekstu, nastrojów i większego znaczenia próbki tekstu. Wcześniejsze architektury nie potrafiły łączyć słów i zdań w ten sam sposób, dlatego nie mogły dobrze rozumieć ani replikować ludzkiej mowy. Obecnie architektura Transformer stanowi podstawę większości dużych modeli językowych (LLM). Modele te są trenowane na gigabajtach tekstu pobranego ze wszystkich zakątków Internetu, aby zrozumieć, w jaki sposób ludzie tworzą zdania. Twórca ChatGPT, OpenAI, poszedł o krok dalej w architekturze Transformera i zastosował technikę znaną jako Uczenie się przez wzmacnianie za pomocą informacji zwrotnej od ludzi (na zdjęciu powyżej). Zasadniczo polegało to na zatrudnieniu ludzi do oceny tysięcy próbek tekstu, co ostatecznie przeszkoliło sztuczną inteligencję, aby brzmiała bardziej naturalnie. Możesz także wziąć udział w tym procesie oceniania, jeśli głosujesz za lub przeciw odpowiedziom podczas korzystania z ChatGPT. Większość konwersacyjnej sztucznej inteligencji opierała się na ludziach, którzy oceniali swoje reakcje na pewnym etapie procesu szkoleniowego. Google zastosował podobne, oparte na człowieku podejście do szkolenia swoich konwersacyjnych produktów AI, takich jak Bard. W swoim raporcie na temat modelu językowego PaLM 2 firma stwierdziła: „Stawki godzinowe dla pracowników zależą od szybkości wykonania orzeczeń. Większość oceniających będzie zarabiała od 0,90 dolara za godzinę (przy jednym komentarzu na minutę) do 5,40 dolara za godzinę (przy 6 komentarzach na minutę), co odpowiada typowej stawce godzinowej w regionach geograficznych, w których znajduje się większość oceniających. Zachęcam do przeczytania pełnego raportu, jeśli chcesz zrozumieć, w jaki sposób nowoczesne systemy sztucznej inteligencji są szkolone i dostosowywane tak, aby brzmiały bardziej po ludzku.
Konwersacyjna sztuczna inteligencja vs generatywna sztuczna inteligencja vs chatboty: jaka jest różnica?
Robert Triggs / Android Authority Oprócz konwersacyjnej sztucznej inteligencji mogłeś spotkać się także z takimi terminami, jak chatboty i generatywna sztuczna inteligencja. Nie ma jasno określonych granic pomiędzy tymi terminami i można nawet zauważyć, że w dużym stopniu się pokrywają. Zacznijmy od chatbotów, czyli najstarszego terminu z całej trójki. Wczesne chatboty pracowały na bardzo podstawowym mechanizmie opartym na regułach. Zasadniczo należy wpisać kilka wstępnie zaprogramowanych odpowiedzi i spróbować przechwycić wszystkie możliwe polecenia. Jednak tradycyjne chatboty prawie zawsze zawodzą, gdy pojawia się unikalne pytanie lub niewidoczne polecenie. Być może doświadczyłeś tej frustracji podczas interakcji z Asystentem Google lub inteligentnym głośnikiem zasilanym przez Alexę. Przechodząc do konwersacyjnej sztucznej inteligencji, jest to termin używany do opisania najnowocześniejszych chatbotów, które mogą reagować na niemal każdy ludzki dialog. Nie wymaga wstępnego programowania, aby symulować rozmowę, ponieważ nauczył się rozumieć kontekst i reagować w realistyczny sposób. Generatywna sztuczna inteligencja stanowi szkielet wielu konwersacyjnych platform sztucznej inteligencji, ale oferuje też znacznie więcej możliwości. Wreszcie mamy generatywną sztuczną inteligencję. Jest to technologia leżąca u podstaw wielu nowoczesnych usług konwersacyjnych AI. Termin ten opisuje sztuczną inteligencję, która może generować różne rodzaje treści, od tekstu po obrazy, a nawet głosy. Midjourney i Bing Image Creator to przykłady generatywnej sztucznej inteligencji, ponieważ mogą tworzyć całe obrazy, które nigdy wcześniej nie istniały. Mówiąc prościej, konwersacyjna sztuczna inteligencja, taka jak ChatGPT, może należeć zarówno do kategorii chatbotów, jak i generatywnej sztucznej inteligencji. Jednak bardziej podstawowe chatboty, takie jak Alexa, nie mają wbudowanych żadnych funkcji generatywnych i mogą również nie zasługiwać na miano konwersacyjnej sztucznej inteligencji.
Zalety i wady konwersacyjnej sztucznej inteligencji
Jak każda nowa technologia, konwersacyjna sztuczna inteligencja ma swoje zalety i wady. Tutaj jest kilka z nich:
Efektywność: Wyobraź sobie przeniesienie zadań, takich jak dokument lub podsumowanie spotkania, do chatbota. Korzystając z konwersacyjnej i generatywnej sztucznej inteligencji, wszyscy moglibyśmy zwolnić czas na pracę nad naprawdę istotnymi zadaniami.
Pomoc na żądanie: Konwersacyjna sztuczna inteligencja może pomóc w przyziemnych zadaniach, takich jak pisanie szablonowego kodu, a nawet w rzeczywistych zadaniach — wyobraź sobie, że prosisz o pomoc przy wymianie opony w samochodzie, gdy utkniesz na odludziu. Konwersacyjna sztuczna inteligencja może przeprowadzić Cię przez kolejne etapy prostym językiem angielskim i odpowiedzieć na wszelkie nieoczekiwane pytania, jakie możesz mieć po drodze.
Uprzedzenia: W zależności od zbioru danych konwersacyjna sztuczna inteligencja może wzmacniać uprzedzenia rasowe lub płciowe, powtarzając stereotypy lub wspierając określone ideologie. Są one często niezamierzone, ale są nieuniknione w każdym systemie sztucznej inteligencji przeszkolonym w zakresie różnych tematów.
Mylna informacja: W ciągu pierwszych kilku tygodni od wydania ChatGPT i Bing Chat odpowiedziały zmyślonymi informacjami. Zjawisko to znane jest jako halucynacje i stanowi ciągłe wyzwanie w przestrzeni generatywnej sztucznej inteligencji.
Przykłady konwersacyjnej sztucznej inteligencji
Calvin Wankhede / Android Authority Ostatnio byliśmy świadkami eksplozji konwersacyjnej sztucznej inteligencji, co oznacza, że mamy teraz wiele usług do wyboru. Niektórzy specjalizują się w rozwiązywaniu problemów i ustalaniu faktów tak jak zrobiłby to człowiek, podczas gdy inni ograniczają się do pełnienia roli kreatywnego towarzysza. Mając na uwadze tę różnorodność, oto kilka przykładów konwersacyjnych usług AI, z których możesz już dziś skorzystać:
CzatGPT: OpenAI prawdopodobnie zapoczątkowało szum wokół konwersacyjnej sztucznej inteligencji za pomocą ChatGPT, kiedy pod koniec 2022 r. udostępniło otwarty dostęp do chatbota. Większość poniższych usług została udostępniona publicznie dopiero w odpowiedzi na ChatGPT.
Google Bard: Firma Google szybko podjęła działania po udostępnieniu ChatGPT i na początku 2023 r. firma zaprezentowała światu Barda. Wykorzystuje własny model językowy Gemini giganta wyszukiwania zamiast GPT, który został podobnie dostosowany do dialogów. Osobiście odkryłem, że Bard dobrze radzi sobie z zadaniami kreatywnymi, ale ma tendencję do popełniania błędów rzeczowych, gdy jest pytany o złożone tematy.
Charakter.AI: W przeciwieństwie do innych konwersacyjnych usług AI na tej liście, Character.AI umożliwia symulowanie rozmów ze znanymi osobistościami. Oznacza to, że możesz rozmawiać z podszywającymi się pod gwiazdy z prawdziwego świata, takimi jak Elon Musk, lub ożywiać postacie z komiksów.
Klaudiusz: Stworzony przez byłych badaczy OpenAI, Claude jest asystentem AI, dla którego priorytetem są bezpieczne i uczciwe odpowiedzi ponad wszystko inne. Został przeszkolony na mniejszym, sprawdzonym zbiorze danych, aby zmniejszyć ryzyko stronniczości i niebezpiecznych reakcji.
Drugi pilot Microsoftu: Zbudowany na tym samym fundamencie co ChatGPT, Copilot jest wbudowany w różne produkty Microsoft, takie jak Windows 11 i Bing. Potrafi także przeszukiwać Internet w poszukiwaniu nowych informacji oraz generować lub analizować obrazy. Bez wątpienia w nadchodzących miesiącach i latach będziemy świadkami jeszcze większej liczby konwersacyjnych usług AI. Na przykład Asystent Google z Bardem łączy tradycyjne doświadczenie chatbota z generatywną sztuczną inteligencją. Przy obecnym tempie innowacji technologia ta może wkrótce stać się integralną częścią naszego codziennego życia.
Często zadawane pytania
Czy ChatGPT jest przykładem konwersacyjnej sztucznej inteligencji? Tak, ChatGPT jest przykładem konwersacyjnej sztucznej inteligencji — potrafi zrozumieć niuanse w złożonych zdaniach i reagować w sposób ludzki. Dlaczego konwersacyjna sztuczna inteligencja jest ważna? Konwersacyjna sztuczna inteligencja jest ważna dla wielu osób, ponieważ przypomina posiadanie osobistego asystenta dostosowanego do Twoich konkretnych potrzeb i zadań. Wpływ kulturowy konwersacyjnej sztucznej inteligencji można przyrównać do wczesnych kalkulatorów, które automatyzowały proste obliczenia i pozwalały nam zająć się innymi zadaniami. W jaki sposób szkoli się konwersacyjne sztuczną inteligencję? Konwersacyjne usługi sztucznej inteligencji są zazwyczaj szkolone na bardzo dużych zbiorach danych, które mogą obejmować tysiące książek, całe strony internetowe, takie jak Wikipedia, a nawet kanały mediów społecznościowych, takich jak Twitter i Reddit. Dzięki temu sztuczna inteligencja może zdobyć wiedzę na różne tematy i reagować różnymi tonami. Uwagi