Równoważenie danych szkoleniowych i wiedzy ludzkiej sprawia, że ​​sztuczna inteligencja działa bardziej jak naukowiec

Równoważenie danych szkoleniowych i wiedzy ludzkiej sprawia, że ​​sztuczna inteligencja działa bardziej jak naukowiec

Kiedy uczysz dziecko rozwiązywania zagadek, możesz albo pozwolić mu dojść do tego metodą prób i błędów, albo możesz poprowadzić je, stosując podstawowe zasady i wskazówki. Podobnie włączenie zasad i wskazówek do szkoleń dotyczących sztucznej inteligencji – takich jak prawa fizyki – może sprawić, że będą one skuteczniejsze i lepiej odzwierciedlają rzeczywisty świat. Jednak pomaganie sztucznej inteligencji w ocenie wartości różnych zasad może być trudnym zadaniem.

Badacze donoszą 8 marca w czasopiśmie Nexus, że opracowali ramy oceny względnej wartości reguł i danych w „świadomych modelach uczenia maszynowego”, które obejmują oba. Pokazali, że w ten sposób mogą pomóc sztucznej inteligencji we włączeniu podstawowych praw świata rzeczywistego i lepszym radzeniu sobie z problemami naukowymi, takimi jak rozwiązywanie złożonych problemów matematycznych i optymalizacja warunków eksperymentalnych w eksperymentach chemicznych.

„Osadzanie wiedzy ludzkiej w modelach sztucznej inteligencji może potencjalnie poprawić ich wydajność i zdolność do wyciągania wniosków, ale pytanie brzmi, jak zrównoważyć wpływ danych i wiedzy” – mówi pierwszy autor Hao Xu z Uniwersytetu w Pekinie. „Nasze ramy można wykorzystać do oceny różnej wiedzy i zasad w celu zwiększenia zdolności predykcyjnej modeli głębokiego uczenia się”.

Modele generatywnej sztucznej inteligencji, takie jak ChatGPT i Sora, opierają się wyłącznie na danych — modele otrzymują dane szkoleniowe i uczą się samodzielnie metodą prób i błędów. Jednakże systemy te, dysponując jedynie danymi, na których można pracować, nie mają możliwości poznania praw fizycznych, takich jak grawitacja czy dynamika płynów, a także mają trudności z działaniem w sytuacjach różniących się od danych treningowych. Alternatywnym podejściem jest świadome uczenie maszynowe, w ramach którego badacze dostarczają modelowi pewne podstawowe reguły, które pomagają kierować procesem uczenia, ale niewiele wiadomo na temat względnego znaczenia reguł w porównaniu z danymi w zapewnianiu dokładności modelu.

„Staramy się uczyć modeli sztucznej inteligencji praw fizyki, aby lepiej odzwierciedlały one świat rzeczywisty, co uczyniłoby je bardziej użytecznymi w nauce i inżynierii” – mówi starszy autor Yuntian Chen ze Wschodniego Instytutu Technologii w Ningbo.

Aby poprawić wydajność świadomego uczenia maszynowego, zespół opracował platformę do obliczania udziału pojedynczej reguły w dokładności predykcyjnej danego modelu. Naukowcy zbadali także interakcje między różnymi regułami, ponieważ większość świadomych modeli uczenia maszynowego zawiera wiele reguł, a posiadanie zbyt wielu reguł może spowodować załamanie się modeli.

Umożliwiło im to optymalizację modeli poprzez dostosowanie względnego wpływu różnych reguł i całkowite odfiltrowanie reguł zbędnych lub zakłócających. Zidentyfikowali także pewne zasady, które działały synergistycznie, i inne, które były całkowicie zależne od obecności innych reguł.

„Odkryliśmy, że reguły mają różne rodzaje relacji i wykorzystujemy te relacje, aby przyspieszyć uczenie modeli i uzyskać większą dokładność” – mówi Chen.

Naukowcy twierdzą, że ich struktura ma szerokie zastosowania praktyczne w inżynierii, fizyce i chemii. W artykule wykazali potencjał metody poprzez wykorzystanie jej do optymalizacji modeli uczenia maszynowego w celu rozwiązywania równań wielowymiarowych oraz przewidywania wyników eksperymentów chromatografii cienkowarstwowej, a tym samym optymalizacji przyszłych warunków chemii doświadczalnej.

Następnie badacze planują rozwinąć swoje środowisko w narzędzie w postaci wtyczki, z którego będą mogli korzystać twórcy sztucznej inteligencji. Docelowo chcą także trenować swoje modele, aby mogły one wydobywać wiedzę i reguły bezpośrednio z danych, a nie zlecać badaczom wybieranie reguł.

„Chcemy, aby była to pętla zamknięta, przekształcając model w prawdziwego naukowca zajmującego się sztuczną inteligencją” – mówi Chen. „Pracujemy nad opracowaniem modelu, który będzie w stanie bezpośrednio wydobywać wiedzę z danych, a następnie wykorzystywać ją do tworzenia reguł i samodoskonalenia”.

Badania te były wspierane przez Narodowe Centrum Matematyki Stosowanej w Shenzhen, Kluczowe Laboratorium Hydratów Gazu Ziemnego w Shenzhen, Instytut Badawczy Nowych Technologii Energii SUSTech – Qingdao oraz Chińską Narodową Fundację Nauk Przyrodniczych.

Click to rate this post!
[Total: 0 Average: 0]
science