Jak działa wielomodalny model językowy w prognozowaniu zachowań pieszych

Naukowcy stojący za OmniPredict podkreślają, że ten nowy model daje przedsmak przyszłości, w której maszyny nie tylko widzą, co się dzieje, ale także potrafią przewidywać, co ludzie prawdopodobnie zrobią. Chodzi o poprawę bezpieczeństwa na drogach. Miasta są nieprzewidywalne. Piesi są nieprzewidywalni, co może stanowić poważne zagrożenie dla rozwoju autonomicznych pojazdów.

OmniPredict dodaje nową warstwę „świadomości ulicy”, zbliżając się do ludzkiej intuicji.

Zamiast reagować wyłącznie na aktualny ruch pieszego, system próbuje przewidzieć jego kolejne działanie. Jeśli zadziała zgodnie z założeniami, takie podejście może wpłynąć na sposób poruszania się autonomicznych pojazdów w gęsto zabudowanych obszarach miejskich i umożliwić im płynniejsze manewrowanie po zatłoczonych ulicach, a także znacznie ograniczyć liczbę wypadków z udziałem pieszych.

Zastosowania OmniPredict wykraczają jednak daleko poza ruchliwe ulice, chaotyczne skrzyżowania czy zatłoczone przejścia dla pieszych. Naukowcy uważają, że system otwiera drzwi do ekscytujących zastosowań, na przykład możliwości wykrywania, rozpoznawania i przewidywania skutków zachowań osoby wykazującej sygnały zagrożenia. System AI zdolny do odczytywania zmian postawy, wahań, orientacji ciała czy oznak stresu może okazać się przełomowy dla personelu wojskowego oraz służb ratunkowych. Celem projektu nie jest zastąpienie ludzi, lecz wzmocnienie ich możliwości dzięki inteligentniejszemu partnerowi – zapewniają naukowcy.

OmniPredict przewyższa konkurencję

Zespół przetestował OmniPredict na dwóch najbardziej wymagających zestawach danych do badań nad zachowaniami pieszych – JAAD i WIDEVIEW – bez wcześniejszego specjalistycznego szkolenia.