Algorytmy sztucznej inteligencji stojące za programem chatbota ChatGPT – który zwrócił uwagę swoją zdolnością do generowania odpowiedzi pisemnych przypominających ludzi na niektóre z najbardziej kreatywnych zapytań – mogą pewnego dnia pomóc lekarzom wykryć chorobę Alzheimera we wczesnych stadiach. Badania przeprowadzone na Drexel University’s School of Biomedical Engineering, Science and Health Systems wykazały niedawno, że program GPT-3 OpenAI może identyfikować wskazówki ze spontanicznej mowy, które są w 80% dokładne w przewidywaniu wczesnych stadiów demencji.
Zgłoszone w czasopiśmie PLOS Digital Health, badanie Drexel jest najnowszym z serii wysiłków mających na celu wykazanie skuteczności programów przetwarzania języka naturalnego we wczesnym przewidywaniu choroby Alzheimera – wykorzystując aktualne badania sugerujące, że upośledzenie językowe może być wczesnym wskaźnikiem zaburzeń neurodegeneracyjnych .
Znalezienie wczesnego znaku
Obecna praktyka diagnozowania choroby Alzheimera zazwyczaj obejmuje przegląd historii medycznej oraz długi zestaw fizycznych i neurologicznych ocen i testów. Chociaż wciąż nie ma lekarstwa na tę chorobę, jej wczesne wykrycie może dać pacjentom więcej opcji terapeutycznych i wsparcia. Ponieważ upośledzenie językowe jest objawem u 60-80% pacjentów z demencją, badacze skupili się na programach, które mogą wykryć subtelne wskazówki – takie jak wahanie, popełnianie błędów gramatycznych i wymowy oraz zapominanie znaczenia słów – jako szybkie test, który mógłby wskazać, czy pacjent powinien przejść pełne badanie.
„Z trwających badań wiemy, że efekty poznawcze choroby Alzheimera mogą przejawiać się w produkcji języka” – powiedział dr Hualou Liang, profesor w Drexel’s School of Biomedical Engineering, Science and Health Systems oraz współautor badań. „Najczęściej stosowane testy do wczesnego wykrywania choroby Alzheimera, poza testami poznawczymi, obejmują cechy akustyczne, takie jak pauzy, artykulacja i jakość głosu. Wierzymy jednak, że udoskonalenie programów przetwarzania języka naturalnego zapewnia inną ścieżkę do wspierania wczesnej identyfikacji Alzheimera”.
Program, który słucha i uczy się
GPT-3, oficjalnie trzecia generacja General Pretrained Transformer (GPT) firmy OpenAI, wykorzystuje algorytm głębokiego uczenia — wyszkolony przez przetwarzanie ogromnych ilości informacji z Internetu, ze szczególnym naciskiem na to, jak używane są słowa i jak zbudowany jest język . To szkolenie pozwala mu na uzyskanie odpowiedzi podobnej do ludzkiej na każde zadanie, które wymaga języka, od odpowiedzi na proste pytania, po pisanie wierszy lub esejów.
GPT-3 jest szczególnie dobry w „uczeniu się bez danych” – co oznacza, że może odpowiadać na pytania, które normalnie wymagałyby wiedzy z zewnątrz, która nie została dostarczona. Na przykład poproszenie programu o napisanie tekstu „Notatki Cliffa” normalnie wymagałoby wyjaśnienia, że oznacza to podsumowanie. Jednak GPT-3 przeszedł wystarczające szkolenie, aby zrozumieć odniesienie i przystosować się, aby uzyskać oczekiwaną reakcję.
„Systemowe podejście GPT3 do analizy i tworzenia języka sprawia, że jest to obiecujący kandydat do identyfikacji subtelnych cech mowy, które mogą przewidywać początek demencji” – powiedział Felix Agbavor, doktorant w Szkole i główny autor artykułu. „Trening GPT-3 z ogromnym zestawem danych z wywiadów – z których część dotyczy pacjentów z chorobą Alzheimera – dostarczyłby mu informacji potrzebnych do wyodrębnienia wzorców mowy, które można by następnie zastosować do identyfikacji markerów u przyszłych pacjentów”.
Poszukiwanie sygnałów mowy
Naukowcy przetestowali swoją teorię, trenując program z zestawem transkryptów z części zestawu danych nagrań mowy, skompilowanych przy wsparciu National Institutes of Health specjalnie w celu przetestowania zdolności programów do przetwarzania języka naturalnego do przewidywania demencji. Program przechwytywał znaczące cechy użycia słów, struktury zdań i znaczenia z tekstu, aby stworzyć to, co naukowcy nazywają “osadzeniem” – charakterystyczny profil mowy Alzheimera.
Następnie wykorzystali osadzenie, aby ponownie wyszkolić program – zamieniając go w maszynę do badań przesiewowych Alzheimera. Aby to przetestować, poprosili program, aby przejrzał dziesiątki transkryptów ze zbioru danych i zdecydował, czy każdy z nich został wyprodukowany przez kogoś, kto rozwijał chorobę Alzheimera.
Przeprowadzając dwa najlepsze programy do przetwarzania języka naturalnego w tym samym tempie, grupa odkryła, że GPT-3 działał lepiej niż oba pod względem dokładnej identyfikacji przykładów choroby Alzheimera, identyfikowania przykładów innych niż choroba Alzheimera oraz mniejszej liczby pominiętych przypadków niż oba programy.
Drugi test wykorzystywał analizę tekstową GPT-3 do przewidywania wyniku różnych pacjentów ze zbioru danych we wspólnym teście do przewidywania nasilenia demencji, zwanym Mini-Mental State Exam (MMSE).
Następnie zespół porównał dokładność przewidywania GPT-3 z analizą, wykorzystując jedynie cechy akustyczne nagrań, takie jak pauzy, siła głosu i bełkot, aby przewidzieć wynik MMSE. GPT-3 okazał się prawie o 20% dokładniejszy w przewidywaniu wyników MMSE pacjentów.
„Nasze wyniki pokazują, że osadzanie tekstu generowane przez GPT-3 może być niezawodnie wykorzystywane nie tylko do wykrywania osób z chorobą Alzheimera wśród zdrowych osób kontrolnych, ale także do wnioskowania o wyniku testu poznawczego podmiotu, oba oparte wyłącznie na danych dotyczących mowy” – napisali. . „Dalej pokazujemy, że osadzanie tekstu przewyższa konwencjonalne podejście oparte na cechach akustycznych, a nawet działa konkurencyjnie z precyzyjnie dostrojonymi modelami. Wszystkie te wyniki sugerują, że osadzanie tekstu oparte na GPT-3 jest obiecującym podejściem do oceny AD i ma potencjał poprawić wczesną diagnostykę demencji”.
Kontynuacja wyszukiwania
Aby oprzeć się na tych obiecujących wynikach, naukowcy planują opracować aplikację internetową, której można by używać w domu lub w gabinecie lekarskim jako narzędzie do badań wstępnych.
„Nasza weryfikacja koncepcji pokazuje, że może to być proste, dostępne i odpowiednio czułe narzędzie do testowania opartego na społeczności” – powiedział Liang. „Może to być bardzo przydatne we wczesnych badaniach przesiewowych i ocenie ryzyka przed postawieniem diagnozy klinicznej”.