Naukowcy z Dartmouth przeprowadzili pierwsze badanie kliniczne chatbota terapii napędzanego generatywnym AI i stwierdzili, że oprogramowanie spowodowało znaczną poprawę objawów uczestników, zgodnie z wynikami opublikowanymi w NEJM AI, czasopisma wydawców New England Journal of Medicine.
Osoby w badaniu poinformowali również, że mogą zaufać i komunikować się z systemem, znanym jako Therabot, w stopniu porównywalnym z pracą z profesjonalistą zdrowia psychicznego.
Badanie polegało na 106 osób z całych Stanów Zjednoczonych, zdiagnozowanym poważnym zaburzeniu depresyjnym, uogólnionym zaburzeniu lękowym lub zaburzeniu odżywiania. Uczestnicy wchodzili w interakcje z Therabot za pośrednictwem aplikacji na smartfony, wpisując odpowiedzi na podpowiedzi na temat tego, jak się czują lub inicjują rozmowy, gdy musieli rozmawiać.
Naukowcy podają, że zdiagnozowane depresja doświadczyły średnich zmniejszenia objawów o 51%, co prowadzi do klinicznie znaczącej poprawy nastroju i ogólnego samopoczucia. Uczestnicy z uogólnionym lękiem zgłosili średnie zmniejszenie objawów o 31%, przy czym wiele przesuwa się z lęku umiarkowanego do łagodnego lub z łagodnego lęku do progu klinicznego do diagnozy.
Wśród osób zagrożonych zaburzeniami odżywiania – które tradycyjnie są trudniejsze do leczenia – użytkownicy Therabot wykazali średnio 19% zmniejszenie obaw związanych z wizerunkiem ciała i wagą, co znacznie wyprzedziło grupę kontrolną, która również była częścią badania.
Naukowcy stwierdzili, że chociaż terapia napędzana AI nadal jest potrzebna nadzoru klinicystów, może zapewnić wsparcie w czasie rzeczywistym wielu osobom, które nie mają regularnego lub natychmiastowego dostępu do specjalisty ds. Zdrowia psychicznego.
„Zauważona przez nas objawy były porównywalne z tym, co zgłasza się w tradycyjnej terapii ambulatoryjnej, sugerując, że to podejście wspomagane przez AI może oferować klinicznie znaczące korzyści”, mówi Nicholas Jacobson, starszy autor i profesor nadzwyczajny danych nauk biomedycznych i psychiatrycznej psychiatrycznej w Dartmouth.
„Nie ma zastępstwa opieki osobistej, ale nie ma tak wystarczającej liczby dostawców, aby się obejść”-mówi Jacobson. Mówi, że dla każdego dostępnego dostawcy w Stanach Zjednoczonych jest średnio 1600 pacjentów z depresją lub lękiem.
„Chcielibyśmy, aby generatywne AI pomogło zapewnić wsparcie zdrowia psychicznego ogromnej liczbie osób spoza systemu opieki osobistej. Widzę potencjał terapii osobowej i oprogramowania do współpracy”-mówi Jacobson, który jest dyrektorem ds. Rozwoju i oceny leczenia w centrum technologii i zdrowia behawioralnego.
Michael Heinz, pierwszy autor badania i asystent profesora psychiatrii w Dartmouth, twierdzi, że wyniki próby podkreślają również krytyczne prace, zanim generatywna sztuczna inteligencja może zostać wykorzystana do bezpiecznego i skutecznego traktowania ludzi.
„Podczas gdy wyniki te są bardzo obiecujące, żaden generatywny agent AI nie jest gotowy do pełnego działania w zakresie zdrowia psychicznego, w którym istnieje bardzo szeroki zakres scenariuszy wysokiego ryzyka, które może napotkać”, mówi Heinz, który jest także psychiatrą w Dartmouth Hitchcock Medical Center w Lebanonie.
Therabot jest w programie AI i Laboratorium Zdrowia Psychicznego Jacobsona w Dartmouth od 2019 r. Proces obejmował ciągłe konsultacje z psychologami i psychiatrą powiązanymi z Dartmouth i Dartmouth Health.
Kiedy ludzie inicjują rozmowę z aplikacją, Therabot odpowiada na naturalne, otwarte okno dialogowe tekstowe oparte na oryginalnym zestawie szkoleniowym, który naukowcy opracowali z obecnych, opartych na dowodach najlepszych praktyk psychoterapii i terapii poznawczej, mówi Heinz.
Na przykład, jeśli osoba z lękiem mówi Therabotowi, że ostatnio czuł się bardzo zdenerwowany i przytłoczony, może odpowiedzieć: „Odzyskajmy krok i zapytaj, dlaczego tak się czujesz”. Jeśli Therabot wykryje zawartość wysokiego ryzyka, takie jak myśli samobójcze podczas rozmowy z użytkownikiem, zapewni szybkie połączenie pod numer 911, lub skontaktowanie się z infaktują zapobiegania samobójstwom lub infolinii kryzysowej, z naciśnięciem przycisku na ekranie.
Badanie kliniczne zapewniło uczestnikom losowo wybranymi do użycia Therabota z czterema tygodniami nieograniczonego dostępu. Naukowcy śledzili także grupę kontrolną 104 osób z takimi samymi zdiagnozowanymi warunkami, które nie miały dostępu do Therabot.
Prawie 75% grupy Therabot nie było w tym czasie w leczeniu farmaceutycznym ani innym terapeutycznym. Aplikacja zapytała o dobre samopoczucie ludzi, personalizowanie jej pytań i odpowiedzi na podstawie tego, czego nauczył się podczas rozmów z uczestnikami. Naukowcy ocenili rozmowy, aby zapewnić, że oprogramowanie reaguje w ramach najlepszych praktyk terapeutycznych.
Po czterech tygodniach naukowcy ocenili postępy osoby poprzez znormalizowane kwestionariusze, których klinicyści używają do wykrywania i monitorowania każdego stanu. Zespół dokonał drugiej oceny po kolejnych czterech tygodniach, kiedy uczestnicy mogli rozpocząć rozmowy z Therabot, ale nie otrzymywali już podpowiedzi.
Jacobson mówi, że po ośmiu tygodniach wszyscy uczestnicy korzystający z Therabot doświadczyli wyraźnego zmniejszenia objawów, które przekraczają to, co klinicyści uważają za istotne statystycznie.
Różnice te stanowią solidną, rzeczywistą poprawę, którą pacjenci prawdopodobnie zauważyliby w ich codziennym życiu, mówi Jacobson. Mówi, że użytkownicy zajmowali się Therabot przez średnio sześć godzin w trakcie badania lub równoważny około ośmiu sesji terapeutycznych.
„Nasze wyniki są porównywalne z tym, co widzielibyśmy dla osób z dostępem do standardowej terapii poznawczej ze złotem z dostawcami ambulatoryjnymi”-mówi Jacobson. „Mówimy o tym, że potencjalnie daje ludziom odpowiednik najlepszego leczenia, jakie możesz uzyskać w systemie opieki przez krótsze okresy”.
Badanie wykazało, że krytycznie ludzie zgłaszali stopień „sojuszu terapeutycznego” zgodnie z tym, co pacjenci zgłaszają dla osób dostawców osobistych. Sojusz terapeutyczny odnosi się do poziomu zaufania i współpracy między pacjentem a jego opiekunem i jest uważany za niezbędny dla pomyślnej terapii.
Jednym z wskazówek tej więzi jest to, że ludzie nie tylko udzielili szczegółowych odpowiedzi na podpowiedzi Therabot – często inicjowali rozmowy, mówi Jacobson. Interakcje z oprogramowaniem również wykazywały wzrosty czasami związane z chory, na przykład w środku nocy.
„Nie spodziewaliśmy się, że ludzie prawie będą traktować oprogramowanie jak przyjaciel. Mówi mi, że faktycznie nawiązują relacje z Therabot” – mówi Jacobson. „Mam wrażenie, że ludzie również czuli się komfortowo, rozmawiając z botem, ponieważ ich nie oceni”.
Próba Therabot pokazuje, że generatywna sztuczna inteligencja może zwiększyć zaangażowanie pacjenta i, co ważne, ciągłe korzystanie z oprogramowania, mówi Heinz.
„Therabot nie ogranicza się do biura i może pójść w dowolnym miejscu, gdy idzie pacjent. Był dostępny przez całą dobę wyzwań, które powstały w życiu codziennym i mogło przeprowadzać użytkowników przez strategie radzenia sobie z nimi w czasie rzeczywistym” – mówi Heinz. „Ale cechą, która pozwala AI tak skuteczne, jest również to, co stanowi jego ryzyko – pacjenci mogą powiedzieć wszystko i może powiedzieć wszystko”.
Heinz mówi, że opracowanie i testy kliniczne tych systemów muszą mieć rygorystyczne punkty odniesienia dla bezpieczeństwa, skuteczności i tonu zaangażowania oraz potrzeby włączenia ścisłego nadzoru i zaangażowania ekspertów od zdrowia psychicznego.
„To badanie skupiło się na tym, że zespół badawczy musi zostać przygotowany do interwencji – być może od razu – jeśli pacjent wyraża ostre obawy dotyczące bezpieczeństwa, takie jak myśli samobójcze, lub jeśli oprogramowanie reaguje w sposób, który nie jest zgodny z najlepszymi praktykami” – mówi. „Na szczęście nie widzieliśmy tego często w Therabot, ale zawsze jest to ryzyko z generatywną sztuczną inteligencją, a nasz zespół studiów był gotowy”.
Jacobson mówi, że w ocenie wcześniejszych wersji Therabot ponad dwa lata temu ponad 90% odpowiedzi było zgodne z najlepszymi praktykami terapeutycznymi. To dało zespołowi pewność siebie do kontynuowania badania klinicznego.
„Od czasu wydania Chatgpt jest wielu ludzi w tej przestrzeni, i łatwo jest wydać dowód koncepcji, który na pierwszy rzut oka wygląda świetnie, ale bezpieczeństwo i skuteczność nie są dobrze ugruntowane” – mówi Jacobson. „Jest to jeden z tych przypadków, w których potrzebny jest pilny nadzór i zapewnianie, które naprawdę nas wyróżnia w tej przestrzeni”.