Sztuczną inteligencję opracowaną do modelowania języka pisanego można wykorzystać do przewidywania wydarzeń w życiu ludzi. Projekt badawczy prowadzony przez DTU, Uniwersytety w Kopenhadze, ITU i Northeastern University w USA pokazuje, że jeśli wykorzysta się duże ilości danych o życiu ludzi i wytrenuje tak zwane „modele transformatorowe”, które (jak ChatGPT) służą do przetwarzania języka mogą systematycznie porządkować dane i przewidywać, co wydarzy się w życiu danej osoby, a nawet oszacować czas śmierci.
W nowym artykule naukowym „Using Sequences of Life-events to Predict Human Lives”, opublikowanym w Nature Computational Science, naukowcy przeanalizowali dane dotyczące zdrowia i przywiązania do rynku pracy 6 milionów Duńczyków w modelu nazwany life2vec. Po przeszkoleniu modelu w początkowej fazie, tj. po nauczeniu się wzorców z danych, wykazano, że osiąga on lepsze wyniki niż inne zaawansowane sieci neuronowe (patrz ramka faktów) i z dużą dokładnością przewiduje wyniki, takie jak osobowość i czas śmierci.
„Wykorzystaliśmy ten model, aby odpowiedzieć na podstawowe pytanie: w jakim stopniu możemy przewidzieć wydarzenia w przyszłości na podstawie warunków i wydarzeń z przeszłości? Z naukowego punktu widzenia ekscytujące jest dla nas nie tyle samo przewidywanie, ale aspekty danych które umożliwiają modelowi udzielenie tak precyzyjnych odpowiedzi” – mówi Sune Lehmann, profesor na DTU i pierwszy autor artykułu.
Przewidywania czasu śmierci
Przewidywania Life2vec są odpowiedzią na ogólne pytania, takie jak: „śmierć w ciągu czterech lat”? Kiedy badacze analizują odpowiedzi modelu, wyniki są zgodne z istniejącymi ustaleniami w naukach społecznych; na przykład, przy założeniu równości, szanse na przeżycie mają osoby na stanowiskach kierowniczych lub osoby o wysokich dochodach, podczas gdy bycie mężczyzną, wykwalifikowanie się lub posiadanie diagnozy psychicznej wiąże się z większym ryzykiem śmierci. Life2vec koduje dane w dużym systemie wektorów, strukturze matematycznej organizującej różne dane. Model decyduje, gdzie umieścić dane dotyczące czasu urodzenia, nauki, wykształcenia, wynagrodzenia, miejsca zamieszkania i stanu zdrowia.
„Ekscytujące jest postrzeganie życia ludzkiego jako długiej sekwencji wydarzeń, podobnie jak zdanie w języku składa się z szeregu słów. Zwykle jest to tego rodzaju zadanie, do którego wykorzystuje się modele transformatorów w sztucznej inteligencji, ale w naszych eksperymentach używamy ich do analizy tego, co nazywamy sekwencjami życiowymi, tj. wydarzeń, które miały miejsce w życiu człowieka” – mówi Sune Lehmann.
Rodzące się pytania etyczne
Autorzy artykułu wskazują, że wokół modelu life2vec pojawiają się kwestie etyczne, takie jak ochrona wrażliwych danych, prywatność i rola stronniczości w danych. Należy głębiej poznać te wyzwania, zanim będzie można zastosować model, na przykład do oceny ryzyka zarażenia się chorobą lub innymi zdarzeniami życiowymi, którym można zapobiec.
„Model otwiera ważne pozytywne i negatywne perspektywy do dyskusji i zajęcia się polityką. Podobne technologie do przewidywania wydarzeń życiowych i ludzkich zachowań są już dziś stosowane w firmach technologicznych, które na przykład śledzą nasze zachowanie w sieciach społecznościowych, niezwykle dokładnie nas profilują i korzystaj z tych profili, aby przewidywać nasze zachowanie i wpływać na nas. Ta dyskusja musi stanowić część demokratycznej rozmowy, abyśmy mogli zastanowić się, dokąd prowadzi nas technologia i czy jest to rozwój, jakiego chcemy” – mówi Sune Lehmann.
Według naukowców kolejnym krokiem byłoby uwzględnienie innych rodzajów informacji, takich jak tekst i obrazy lub informacje o naszych powiązaniach społecznych. Takie wykorzystanie danych otwiera zupełnie nową interakcję między naukami społecznymi i naukami o zdrowiu.
Projekt badawczy
Projekt badawczy „Wykorzystanie sekwencji zdarzeń życiowych do przewidywania życia ludzkiego” opiera się na danych z rynku pracy oraz danych z Krajowego Rejestru Pacjentów (LPR) i Duńskiego Urzędu Statystycznego. Zbiór danych obejmuje wszystkich 6 milionów Duńczyków i zawiera informacje na temat dochodów, wynagrodzeń, stypendiów, rodzaju pracy, branży, świadczeń socjalnych itp. Zbiór danych dotyczących zdrowia obejmuje zapisy wizyt u pracowników służby zdrowia lub w szpitalach, diagnozę, rodzaj pacjenta i stopień pilności. Zbiór danych obejmuje lata 2008–2020, ale w kilku analizach badacze skupiają się na okresie 2008–2016 i podzbiorze osób objętych ograniczeniami wiekowymi.
Model transformatora
Model transformatora to sztuczna inteligencja, architektura danych głębokiego uczenia się, używana do uczenia się języka i innych zadań. Modele można wytrenować w zakresie rozumienia i generowania języka. Model transformatora został zaprojektowany tak, aby był szybszy i wydajniejszy niż poprzednie modele i często jest używany do uczenia dużych modeli językowych na dużych zbiorach danych.
Sieci neuronowe
Sieć neuronowa to model komputerowy inspirowany mózgiem i układem nerwowym ludzi i zwierząt. Istnieje wiele różnych typów sieci neuronowych (np. modele transformatorów). Podobnie jak mózg, sieć neuronowa składa się ze sztucznych neuronów. Neurony te są połączone i mogą wysyłać między sobą sygnały. Każdy neuron otrzymuje dane wejściowe od innych neuronów, a następnie oblicza dane wyjściowe przekazywane innym neuronom. Sieć neuronowa może nauczyć się rozwiązywania zadań poprzez uczenie się na dużych ilościach danych. Sieci neuronowe opierają się na danych szkoleniowych, aby uczyć się i poprawiać swoją dokładność w miarę upływu czasu. Kiedy jednak te algorytmy uczenia się zostaną dostrojone pod kątem dokładności, staną się potężnymi narzędziami w informatyce i sztucznej inteligencji, które pozwalają nam klasyfikować i grupować dane z dużą szybkością. Jedną z najbardziej znanych sieci neuronowych jest algorytm wyszukiwania Google.