Sara AI, spółka założona przez Macieja Matuszewskiego i Artura Majtczaka, na przełomie III i IV kwartału br. wprowadzi na rynek „ulepszenie” dla asystentów głosowych. Dzięki niemu inteligentne głośniki staną się jeszcze bardziej „smart”.

– Do tej pory asystenci to w najlepszym wypadku po prostu głośniki sterowane głosem. My podnosimy te rozwiązania na wyższy poziom. Projekt jest na zaawansowanym etapie – wskazuje Majtczak. I podkreśla, że lubliński startup pokaże, iż w naszym kraju mogą powstawać ciekawe innowacje.

Przełom w branży AI?

Zresztą Majtczak i Matuszewski udowodnią to nie po raz pierwszy. Obaj stoją za ALLPlayerem. To chyba najpopularniejszy w Polsce darmowy odtwarzacz wideo i audio, konkurent m.in. dla Winampa. Dla wielu użytkowników komputerów to jeden z programów multimedialnych, który trzeba mieć zainstalowany. Sukces twórców tego narzędzia jest niepodważalny.

CZYTAJ TAKŻE: Era cyfrowych asystentów. Jak oswoić bota

Maciek jest prezesem grupy ALLPlayer, a Artur – szefem zespołu programistów. Teraz obaj chcą zawojować świat sztucznej inteligencji. Założyli start-up Sara AI, który pracuje nad technologią, która ma sprawić, że asystenci nie tylko będą odpowiadać na pytania, ale zdobędą zdolność ich zadawania, czyli rozmowy z człowiekiem. To zatem znacznie więcej, niż oferują Amazon Alexa czy Google Home. Sara AI nie tylko rozumie ludzką mowę, ale także rozpoznaje twarz użytkownika i jego przyjaciół czy domowników, potrafi także identyfikować np. pokazywane jej przedmioty, czy przekazywać informacje tylko wybranemu adresatowi. W ramach projektu rozwijany jest bowiem koncept SaraVision (twórcy przekonują, że rozpoznawanie obrazu już działa prawie 20 razy szybciej niż podobne systemy oparte na sieciach neuronowych) i SaraCam.

Sara AI rozumie ludzką mowę. rozpoznaje twarz użytkownika i jego przyjaciół czy domowników, potrafi identyfikować przedmioty, czy przekazywać informacje tylko wybranemu adresatowi

Założyciele startupu zaznaczają, iż ich rozwiązanie nie bazuje na uczeniu systemu tysiącami próbek, bo wystarczy kilka, kilkanaście. Co istotne, dla rozpoznania twarzy czy przedmiotu nie jest ważny kąt, pod którym analizowany jest obraz, a wystarcza minimalna moc komputera (mikrokomputer Raspberry Pi może wykryć twarz w 10 ms). W dodatku nie jest potrzebne połączenie z internetem.

Oko w oko ze sztuczną inteligencją

Sara AI istnieje od 2019 r., ale sam projekt Majtczak rozwija od czasu studiów. Koncept tzw. silnej sztucznej inteligencji opracował już w 1994 r. Teraz go ulepsza. Tak powstała w ub.r. inteligentna kamera – SaraCam (projekt przyspieszył m.in. dzięki uzyskanemu dofinansowaniu PARP i współpracy z MindSailors Design Studio). W 2020 r. firma Majtczaka i Matuszewskiego została wyróżniona przez „Rzeczpospolitą” w kategorii „Startup z potencjałem. Polska–świat” w konkursie Orzeł Innowacji, promującym innowacyjne i kreujące wartość produkty i usługi.

SaraCam sprawia, że smart głośniki Amazon Echo czy Google Home stają się jeszcze bardziej inteligentne. Można komunikować się z nimi bez konieczności ciągłego powtarzania: „Alexa” czy „OK Google”. Wystarczy kontakt wzrokowy, a raczej spojrzenie w kamerkę. Dzięki funkcji rozpoznawania twarzy Sara wie, z kim rozmawia. To istotne, bo może danej osobie przypomnieć o wzięciu leku, czy przekazać informację od innego użytkownika. Może to wyglądać tak: „powiedz Arturowi, że idę do sklepu i będę wieczorem”, a gdy Artur wejdzie do domu, a kamera wykryje jego twarz, powie „Monika kazała przekazać, że poszła do sklepu i będzie wieczorem”.

CZYTAJ TAKŻE: Okulary z AI, zginane laptopy, przełom w LCD… Trendy 2021

SaraCam to w praktyce asystent głosowy (oparty na systemie Amazona lub Google’a i posiadający wszystkie ich funkcje), ale dzięki wbudowanej ruchomej kamerze, która potrafi „śledzić” użytkownika, do standardowych funkcji smart dodaje dodatkowe możliwości. Startup z Lublina planuje trzy wersje urządzenia.