System opracowany przez naukowców z Massachusetts Institute of Technology jest zbudowany w oparciu o liniową logikę temporalną, czyli język zdań ułatwiający robotom porządkowanie zdarzeń. Badacze przygotowali szablony, które modelują warunki czasowe, a więc określają, co musi wydarzyć się w danej chwili lub do czasu, kiedy nastąpi coś innego. Wskazali też czynności niezbędne do zakończenia całego zadania. Robot przyglądał się 30 działaniom ludzi i na ich podstawie przygotował rozkład prawdopodobieństwa zdarzeń. W oparciu o probabilistykę, czyli „przekonanie” robota o określonym następstwie zdarzeń, algorytmy dają mu informacje zwrotne – „nagradzają” lub „karzą” – i w ten sposób maszyna uczy się.
PUnS ma bardzo wysoką efektywność
We wczesnych testach system Planning with Uncertain Specifications okazał się bardziej wydajny od innych. Korzystający z rozwiązania robot zrobił tylko 6 błędów, kiedy 20 tysięcy razy nakrywał do stołu – choć naukowcy nie ułatwiali mu zadania, zmieniając ustawienie i liczbę elementów rozłożonych na blacie. Gdyby robot działał w oparciu o z góry określoną sekwencję, uznałby zadanie za zakończone bez ułożenia wszystkiego lub utknąłby na etapie, kiedy nie znalazł przedmiotu niezbędnego do sfinalizowania pracy. Naukowcy przekonują, że dzięki systemowi PUnS pracownicy fabryk będą mogli szkolić roboty bez konieczności przewidywania i programowania każdego kolejnego ruchu mechanicznych ramion.
Dalsze prace obejmą reakcje na słowne polecenia
Naukowcy chcą, żeby w przyszłości roboty reagowały nie na obraz, ale na instrukcje przekazywane im ustnie. Chodzi o to, aby maszyny bez konieczności demonstrowania były w stanie wykonać identyczne działanie również w innych miejscach lub potrafiły w razie potrzeby jednorazowo zmodyfikować swoją pracę, na przykład w czasie montowania konstrukcji z elementów.