Calvin Wankhede / Android Authority Jeśli czytałeś o szumie wokół chatbotów, takich jak ChatGPT i generatorów obrazów, takich jak Midjourney, być może spotkałeś się z terminem generatywna sztuczna inteligencja. Termin ten jest zwykle używany do opisania nowoczesnych systemów sztucznej inteligencji, które mogą naśladować ludzi i wykonywać złożone zadania w ciągu kilku sekund. Generatywna sztuczna inteligencja jest szczególnie imponująca w zadaniach kreatywnych, takich jak rysowanie i pisanie poezji, z którymi komputery w przeszłości miały problemy. Ale co spowodowało nagłą eksplozję generatywnej sztucznej inteligencji i jak działa ta technologia? Oto wszystko, co musisz wiedzieć.
Co to jest generatywna sztuczna inteligencja?
Rita El Khoury / Android AuthorityGenerative AI to ogólny termin używany do opisania programów komputerowych, które mogą samodzielnie generować tekst, obrazy, wideo i dźwięk. Do tego momentu większość systemów AI nie była zbyt kreatywna i zapewniała znacznie gorsze wyniki niż człowiek. Jednak nie dotyczy to już generatywnej sztucznej inteligencji. Na przykład możesz poprosić generatywne narzędzie sztucznej inteligencji, takie jak Bing Image Creator, o utworzenie fotorealistycznego obrazu „uroczego niebieskiego stworzenia AI z pomarańczowymi oczami”, a ono dostarczy wyniki, które widzisz powyżej. Narzędzie, o którym mowa, nie zostało wyraźnie nauczone ani przeszkolone do tworzenia tego obrazu, ale i tak przyniosło imponujące rezultaty. Generatywna sztuczna inteligencja może błyskawicznie tworzyć tekst i grafikę. Narzędzia generatywnej sztucznej inteligencji stają się coraz bardziej wydajne, a nowe rozwiązania pojawiają się co kilka miesięcy. Najnowsza wersja generatora obrazów AI zdołała nawet oszukać ekspertów i wygrać prestiżowy konkurs fotograficzny. Podobnie, kilka obrazów wygenerowanych przez sztuczną inteligencję stało się wirusowych w mediach społecznościowych, w tym niektóre z agendą polityczną. Niezależnie od tego, czy planujesz używać generatywnej sztucznej inteligencji dla siebie, ważne jest, aby wiedzieć, że one istnieją i jakie są ich ograniczenia. Na szczęście nie osiągnęliśmy punktu, w którym te narzędzia są doskonałe. W rzeczywistości są skłonni do popełniania rażących błędów. Oznacza to, że dzięki odpowiednim informacjom i szkoleniom możesz odróżnić treści rzeczywiste od treści generowanych przez sztuczną inteligencję.
Jak działa generatywna sztuczna inteligencja?
Generatywna sztuczna inteligencja należy do kategorii uczenia maszynowego, które jest szerokim terminem używanym do opisania dowolnego algorytmu komputerowego analizującego duże ilości danych. Algorytmy te mają naśladować sposób, w jaki ludzie wykonują zadania. Pierwszym krokiem jest wyodrębnienie wzorców z istniejących danych, więc jeśli potrzebujesz sztucznej inteligencji, która może generować nowe twarze, musisz wprowadzić zestaw danych zawierający obrazy twarzy. Po wystarczającym przeszkoleniu algorytm nauczy się, jak wygląda twarz, a także typowe cechy, takie jak nos, oczy, uszy i usta. Stamtąd może rozpocząć pracę nad mniejszymi szczegółami, takimi jak mimika, zarost i odcienie skóry. Generatywna sztuczna inteligencja może popełniać rażące błędy, ale musisz się uważnie przyjrzeć. Bez wystarczającego szkolenia model uczenia maszynowego w naszym przykładzie nie da wyników, które wyglądają jak ludzka twarz. W rzeczywistości ten sam problem dotyczy obecnie generatorów obrazów AI, takich jak Midjourney. Eksperci byli w stanie szybko wykryć fikcyjne wizerunki papieża Franciszka poprzez dokładne zbadanie palców widocznych na obrazie. Ponieważ zdjęcia osób trzymających przedmioty nie zawierają pełnych palców, algorytmy generatywnej sztucznej inteligencji mogą mieć trudności z zebraniem wystarczającej ilości informacji z danych treningowych.
Transformatory i uczenie przez wzmacnianie
Wiele nowoczesnych generatywnych narzędzi sztucznej inteligencji, o których być może słyszałeś, w tym ChatGPT, opiera się na architekturze Transformer. Transformatory pozwalają algorytmowi skupić się na relacjach w danych. Na przykład w dużym modelu językowym, takim jak GPT-3, przewidują, które słowo prawdopodobnie pojawi się jako następne. Uczenie się ze wzmocnieniem to kolejna powszechna technika stosowana w generatywnej sztucznej inteligencji. Mówiąc prościej, człowiek ręcznie ocenia dane wyjściowe modelu, aby odfiltrować złe odpowiedzi i skłonić algorytm do reagowania w określony sposób. Dzięki publicznemu artykułowi badawczemu na temat modelu językowego LaMDA wiemy, że Google zatrudnił pracowników w niepełnym wymiarze godzin do uczenia się przez wzmacnianie. Z biegiem czasu ich opinie pomogły modelowi dostarczać wysokiej jakości i przydatne odpowiedzi na pytania użytkowników.
Jakie są zalety i ograniczenia Generative AI?
Edgar Cervantes / Android Authority Jak w przypadku każdej nowej technologii, na pewno będziemy ją wykorzystywać jednocześnie w kreatywny i złośliwy sposób. Zacznijmy od zalet generatywnej sztucznej inteligencji:
Zredukowana praca fizyczna: W zadaniach, które wymagają wielu powtórzeń, generatywna sztuczna inteligencja może zmniejszyć obciążenie przy niewielkim lub zerowym wysiłku. Na przykład kod komputerowy zawiera dużo tekstu standardowego. Deweloper może zautomatyzować większość początkowych kroków za pomocą chatbota.
Zwiększona wydajność: Komputery mogą przetwarzać duże ilości informacji znacznie szybciej niż jakikolwiek człowiek. Model języka może szybko podsumować długi dokument lub artykuł naukowy i odpowiedzieć na pytania wymagające krytycznego myślenia.
Podejmowanie decyzji po ludzku: Generatywna sztuczna inteligencja bardzo dobrze radzi sobie z nowymi i niewidzianymi scenariuszami, co oznacza, że może również przodować w podejmowaniu decyzji. Na przykład GPT-4 może już zdawać standardowe testy przeznaczone dla studentów i rozwiązywać złożone problemy matematyczne. Chociaż generatywne narzędzia sztucznej inteligencji są obiecujące, mają one również wiele wad. Mamy już dedykowany post dotyczący niebezpieczeństw związanych ze sztuczną inteligencją, ale oto krótkie podsumowanie:
Stronniczość: Jak wspomniano wcześniej, generatywne narzędzia sztucznej inteligencji działają dobrze dopiero po przejściu wystarczającej liczby szkoleń. Niestety, niekończące się wariacje w prawdziwym świecie sprawiają, że bezstronna lub doskonała sztuczna inteligencja jest dziś poza zasięgiem. Na przykład sztuczna inteligencja zaprojektowana do wybierania kandydatów do pracy może przypadkowo wybierać na podstawie określonych ras lub płci z powodu uprzedzeń szkoleniowych.
Złośliwe czyny: Od programistów-amatorów używających ChatGPT do generowania złośliwego oprogramowania po użytkowników mediów społecznościowych tworzących głębokie fałszywe obrazy polityków, generatywne narzędzia sztucznej inteligencji mogą już przy niewielkim wysiłku szkodzić lub wprowadzać w błąd ogół społeczeństwa.
Utrata pracy: Generatywna sztuczna inteligencja może sprawić, że niektóre zawody staną się przestarzałe lub przynajmniej zmniejszy popyt na pracowników. Jest to szczególnie prawdziwe w branży artystycznej, gdzie pojedyncza zachęta tekstowa może niemal natychmiast wygenerować obrazy. Wyszkolony człowiek może wtedy poświęcić tylko krótką ilość czasu na udoskonalanie grafiki generowanej przez sztuczną inteligencję, zamiast tworzyć ją od podstaw.
Jakie są przykłady generatywnej sztucznej inteligencji?
Calvin Wankhede / Android AuthorityW tym artykule omówiliśmy już kilka przykładów generatywnej sztucznej inteligencji. Ale możemy też pójść o krok dalej i pogrupować je na podstawie ich roli.
Tekst i dialogi: Chatboty, takie jak ChatGPT, Bing Chat i Google Bard, należą do tej kategorii. Zostali przeszkoleni i dopracowani, aby angażować się w wymianę zdań, dzięki czemu idealnie nadają się do zadań takich jak badania i obsługa klienta.
Obraz i wideo: Generatory obrazów AI, takie jak Midjourney, DALL-E i Stable Diffusion, mogą przekształcić kilka słów w grafikę. Mogą również pracować z istniejącymi obrazami, aby zastępować tła, dodawać lub mieszać elementy oraz tworzyć przeskalowane kopie danych wejściowych o niskiej jakości.
Mowa i dźwięk: Firmy takie jak Google pracują nad wykorzystaniem generatywnej sztucznej inteligencji do syntezy mowy. Być może znasz już model zamiany tekstu na mowę WaveNet, ponieważ jest on używany przez Asystenta Google. Ale to nie wszystko, inne generatywne AI, takie jak OpenAI Jukebox, mogą również tworzyć muzykę z instrumentami i wokalami w określonych gatunkach i stylach.
Kod: Co by było, gdyby komputery mogły pisać własne programy? Jeszcze nie jesteśmy na miejscu, ale programiści mogą już korzystać z towarzyszącej sztucznej inteligencji, takiej jak GitHub Copilot lub OpenAI Codex, aby przyspieszyć przepływ pracy. Warto zauważyć, że większość z tych generatywnych narzędzi AI jeszcze kilka lat temu nie istniała. Ponieważ przełomy pojawiają się pozornie co drugi tydzień, nie można przewidzieć, co przyniesie przyszłość. Uwagi