Nowe algorytmy AI zwiększą autonomię robotów

Naukowcy z Massachusetts Institute of Technology pracują nad algorytmami, które pozwolą sztucznej inteligencji decydować, czy w danej sytuacji bazować na danych szkoleniowych AI, czy też zastosować uczenie przez wzmacnianie – metodę prób i błędów. Wdrożenie tego typu algorytmów pozwoli zminimalizować ludzką ingerencję podczas działania maszyn oraz umożliwi opracowywanie coraz bardziej autonomicznych rozwiązań, które będą w stanie analizować szerszy kontekst danej sytuacji.

Nowe generacje sztucznej inteligencji otwierają fascynujące możliwości oraz skłaniają do rozważań na temat obszarów, w których AI mogłaby przewyższyć ludzkie umiejętności i całkowicie zastąpić pracę człowieka. Jednocześnie coraz częściej podkreśla się niedoskonałości, jakie posiada sztuczna inteligencja w obecnym stanie zaawansowania rozwoju. Są to, między innymi, brak zdolności wykorzystania wyobraźni i myślenia kontrfaktycznego – czyli umiejętności rozważania hipotetycznych zdarzeń i przewidywania wyników w oparciu o zmienne warunki (np. Co mogłoby być, gdyby było inaczej?). Wątpliwości budzi także zbytnie poleganie narzędzi AI na danych wejściowych, co może prowadzić do generowania niewłaściwych informacji lub podejmowania błędnych decyzji. Wydawałoby się, że w związku z tym jesteśmy jeszcze daleko od zastąpienia ludzi przez maszyny na szeroką skalę, ale specjaliści od sztucznej inteligencji cały czas pracują nad rozwojem technologii w celu zniwelowania dostrzeganych niedoskonałości.

Przykładowo, badacze z MIT i Izraelskiego Instytutu Technicznego Technion, opracowali algorytm, który automatycznie i niezależnie decyduje, kiedy w działaniu stosować uczenie nadzorowane (odtwarzanie danych i zachowań na podstawie przykładów), a kiedy uczenie przez wzmacnianie (metodę prób i błędów, wraz z nagradzaniem po osiągnięciu celu). Dzięki temu jednostka ucząca się przestaje naśladować wzorzec, kiedy nie jest on wystarczająco dobry – oraz powraca do podążania za wzorcem w dowolnej chwili, kiedy uzna to działanie za efektywne. Przetestowanie tego podejścia w symulacjach wykazało, iż połączenie tych dwóch metod pozwala maszynom uzyskać znacznie lepsze efekty uczenia się niż dotychczas. Przykładowo, może pomóc robotom nauczyć poruszać się w budynku, o którym wcześniej nie posiadały żadnych informacji. Tego typu algorytmy ulepszą również działanie robotów manipulacyjnych, zaprojektowanych aby rozpoznawać i dokonywać zmian położenia poszczególnych obiektów, np. w naszych domach.

Twórcy rozwiązania podkreślają, iż poza ulepszeniem procesu uczenia się robotów, algorytmy mogą zwiększyć efektywność działania dotychczasowych narzędzi, wykorzystujących uczenie nadzorowane oraz uczenie przez wzmacnianie (dotyczy to również popularnych modeli językowych, takich jak GPT-4). Tego typu modele mogłyby być dzięki temu wykorzystane do opracowywania kolejnych rozwiązań, bardziej wyspecjalizowanych w danej dziedzinie. Mamy zatem nadzieję, że nowy, skuteczniejszy sposób uczenia się maszyn sprosta wymaganiom zmienności i niepewności, jakie niesie za sobą funkcjonowanie w świecie rzeczywistym.

Więcej o wynikach prac naukowców z Massachusetts Institute of Technology nad sztuczną inteligencją na stronie:

https://news.mit.edu/2023/more-effective-train-machines-uncertain-real-world-situations-0531