Kiedy woda zamarza, przechodzi z fazy ciekłej w fazę stałą, co powoduje drastyczną zmianę właściwości, takich jak gęstość i objętość. Przejścia fazowe w wodzie są tak powszechne, że większość z nas prawdopodobnie nawet o nich nie myśli, ale przejścia fazowe w nowych materiałach lub złożonych układach fizycznych stanowią ważny obszar badań.
Aby w pełni zrozumieć te systemy, naukowcy muszą być w stanie rozpoznać fazy i wykryć przejścia pomiędzy nimi. Jednak sposób ilościowego określenia zmian fazowych w nieznanym układzie jest często niejasny, zwłaszcza gdy dostępnych jest niewiele danych.
Naukowcy z MIT i Uniwersytetu w Bazylei w Szwajcarii zastosowali do tego problemu generatywne modele sztucznej inteligencji, opracowując nową platformę uczenia maszynowego, która może automatycznie odwzorowywać diagramy fazowe dla nowatorskich układów fizycznych.
Ich podejście do uczenia maszynowego opartego na fizyce jest skuteczniejsze niż pracochłonne, ręczne techniki, które opierają się na wiedzy teoretycznej. Co ważne, ponieważ ich podejście wykorzystuje modele generatywne, nie wymaga ogromnych, oznakowanych zbiorów danych szkoleniowych wykorzystywanych w innych technikach uczenia maszynowego.
Takie ramy mogłyby pomóc naukowcom na przykład w badaniu właściwości termodynamicznych nowych materiałów lub wykrywaniu splątania w układach kwantowych. Ostatecznie technika ta może umożliwić naukowcom samodzielne odkrywanie nieznanych faz materii.
„Jeśli masz nowy system o całkowicie nieznanych właściwościach, jak wybrałbyś obserwowalną wielkość do zbadania? Mamy nadzieję, przynajmniej w przypadku narzędzi opartych na danych, że możesz skanować duże nowe systemy w sposób zautomatyzowany, co wskaże może to być narzędzie w przygotowaniu do automatycznego odkrywania nowych, egzotycznych właściwości faz” – mówi Frank Schäfer, postdoc w Julia Lab w Laboratorium Informatyki i Sztucznej Inteligencji (CSAIL). i współautorem artykułu poświęconego temu podejściu.
Do Schäfera piszącego tę pracę dołączył pierwszy autor Julian Arnold, absolwent Uniwersytetu w Bazylei; Alan Edelman, profesor matematyki stosowanej na Wydziale Matematyki i kierownik Julia Lab; oraz starszy autor Christoph Bruder, profesor na Wydziale Fizyki Uniwersytetu w Bazylei. Wyniki badania opublikowano dzisiaj w czasopiśmie Physical Review Letters.
Wykrywanie przejść fazowych za pomocą sztucznej inteligencji
Chociaż przemiana wody w lód może być jednym z najbardziej oczywistych przykładów zmiany fazowej, naukowcy cieszą się bardziej egzotycznymi zmianami fazowymi, na przykład przejściem materiału ze zwykłego przewodnika do nadprzewodnika.
Przejścia te można wykryć, identyfikując „parametr kolejności”, czyli ilość, która jest ważna i oczekuje się, że ulegnie zmianie. Na przykład woda zamarza i przechodzi w fazę stałą (lód), gdy jej temperatura spada poniżej 0 stopni Celsjusza. W tym przypadku odpowiedni parametr porządku można zdefiniować w kategoriach proporcji cząsteczek wody wchodzących w skład sieci krystalicznej w stosunku do tych, które pozostają w stanie nieuporządkowanym.
W przeszłości badacze polegali na wiedzy fizycznej, aby ręcznie tworzyć diagramy fazowe, opierając się na wiedzy teoretycznej, aby wiedzieć, które parametry kolejności są ważne. Jest to nie tylko uciążliwe w przypadku złożonych systemów i być może niemożliwe w przypadku nieznanych systemów o nowych zachowaniach, ale także wprowadza do rozwiązania ludzkie uprzedzenia.
Niedawno badacze zaczęli wykorzystywać uczenie maszynowe do tworzenia klasyfikatorów dyskryminacyjnych, które mogą rozwiązać to zadanie, ucząc się klasyfikowania statystyki pomiarowej jako pochodzącej z określonej fazy układu fizycznego, w taki sam sposób, w jaki takie modele klasyfikują obraz jako kot lub pies.
Naukowcy z MIT pokazali, jak można wykorzystać modele generatywne do znacznie skuteczniejszego rozwiązania tego zadania klasyfikacji w sposób oparty na fizyce.
Język programowania Julia, popularny język obliczeń naukowych, używany także na wprowadzających zajęciach z algebry liniowej w MIT, oferuje wiele narzędzi, które czynią go nieocenionym przy konstruowaniu takich modeli generatywnych, dodaje Schäfer.
Modele generatywne, takie jak te leżące u podstaw ChatGPT i Dall-E, zazwyczaj działają poprzez oszacowanie rozkładu prawdopodobieństwa niektórych danych, którego używają do generowania nowych punktów danych pasujących do rozkładu (takich jak nowe zdjęcia kotów podobne do istniejących obrazów kotów). .
Jeśli jednak dostępne są symulacje układu fizycznego przy użyciu sprawdzonych technik naukowych, badacze otrzymują model jego rozkładu prawdopodobieństwa za darmo. Rozkład ten opisuje statystyki pomiarowe układu fizycznego.
Bardziej kompetentny model
Zespół MIT zauważył, że ten rozkład prawdopodobieństwa definiuje również model generatywny, na podstawie którego można zbudować klasyfikator. Podłączają model generatywny do standardowych formuł statystycznych, aby bezpośrednio skonstruować klasyfikator, zamiast uczyć się go na próbach, jak miało to miejsce w przypadku podejść dyskryminacyjnych.
„To naprawdę fajny sposób na włączenie wiedzy o systemie fizycznym głęboko do schematu uczenia maszynowego. Wykracza to daleko poza zwykłe wykonywanie inżynierii funkcji na próbkach danych lub proste odchylenia indukcyjne” – mówi Schäfer.
Ten klasyfikator generatywny może określić, w jakiej fazie znajduje się system, biorąc pod uwagę pewien parametr, taki jak temperatura lub ciśnienie. A ponieważ badacze bezpośrednio przybliżają rozkłady prawdopodobieństwa leżące u podstaw pomiarów z układu fizycznego, klasyfikator dysponuje wiedzą systemową.
Dzięki temu ich metoda działa lepiej niż inne techniki uczenia maszynowego. A ponieważ może działać automatycznie, bez konieczności intensywnego szkolenia, ich podejście znacznie zwiększa wydajność obliczeniową identyfikacji przejść fazowych.
Na koniec, podobnie jak można poprosić ChatGPT o rozwiązanie problemu matematycznego, badacze mogą zadać klasyfikatorowi generatywnemu pytania, takie jak „czy ta próbka należy do fazy I czy fazy II?” lub „czy ta próbka została wygenerowana w wysokiej czy niskiej temperaturze?”
Naukowcy mogliby również zastosować to podejście do rozwiązywania różnych zadań klasyfikacji binarnej w układach fizycznych, na przykład do wykrywania splątania w układach kwantowych (czy stan jest splątany czy nie?) lub do określenia, czy teoria A czy B najlepiej nadaje się do rozwiązania konkretnego problemu. Mogliby również zastosować to podejście, aby lepiej zrozumieć i ulepszyć duże modele językowe, takie jak ChatGPT, poprzez określenie, w jaki sposób należy dostroić określone parametry, aby chatbot zapewniał najlepsze wyniki.
W przyszłości badacze chcą także zbadać teoretyczne gwarancje dotyczące liczby pomiarów potrzebnych do skutecznego wykrycia przejść fazowych i oszacowania wymaganej ilości obliczeń.
Praca ta została częściowo sfinansowana przez Szwajcarską Narodową Fundację Nauki, MIT-Switzerland Lockheed Martin Seed Fund oraz MIT International Science and Technology Initiatives.