Z tego artykułu dowiesz się:
- W jaki sposób pozyskuje się dane treningowe dla humanoidów?
- Na czym polegają kluczowe różnice w danych treningowych dla fizycznej AI i modeli językowych?
- Jakie są prognozy rynkowe dla robotyki humanoidalnej?
Tysiące dorywczych pracowników w ponad 50 krajach każdego dnia przypina do głowy kamerkę lub włącza obiektyw smartfona, by – na zlecenie firm technologicznych – nagrywać prozaiczne, domowe obowiązki. Składanie prania, zmywanie naczyń czy krojenie cebuli stają się bezcennym towarem – to kluczowe dane treningowe, które mają nauczyć humanoidalne roboty funkcjonowania w sposób zbliżony do człowieka. Jak donosi „MIT Technology Review”, ten proceder stał się jednym z najszybciej rosnących segmentów gospodarki określanej jako gig-economy (krótkoterminowe zlecenia, praca dorywcza dla firm aplikacyjnych).
Gig-worker filmujący ścielenie łóżka zwiastuje rewolucję na miarę chatbota OpenAI.
Fizyczna AI czeka na swój moment
Po boomie na chatboty, teraz nadchodzi czas na nowy technologiczny przełom – Physical AI. Tradycyjne, sztywne i wymagające ręcznego programowania roboty, a przez to mocno ograniczone w swoich możliwościach, ustępują miejsca modelom fizycznej sztucznej inteligencji. Maszyny, dzięki nowej architekturze, potrafią uczyć się z danych i adaptować do nowych środowisk. Problem w tym, że materiału szkoleniowego, w odróżnieniu od potężnych zbiorów , na których budowano LLM-y (duże modele językowe), zwyczajnie brakuje. Humanoidalne maszyny wciąż czekają więc na swój tzw. moment ChatGPT.
Czytaj więcej
Rok 2026 może zostać uznany za punkt zwrotny w historii robotyki. Po latach eksperymentów humanoidalne roboty wchodzą w fazę masowego wdrożenia w p...
– Dane robotyczne są niezwykle wielowymiarowe, podczas gdy dane tekstowe, wykorzystywane do trenowania dużych modeli językowych, zasadniczo są jednowymiarowe – wyjaśnia różnice Shao Hao, główny naukowiec laboratorium robotyki chińskiego koncernu Vivo, cytowany przez „South China Morning Post”.
W branży robotyki odniesienia do ChatGPT stały się skrótem oznaczającym moment, w którym technologia pokonuje główne bariery techniczne i osiąga powszechną akceptację. Dzięki znacznemu zwiększeniu objętości danych szkoleniowych – obejmujących duże ilości danych wejściowych – opracowano właśnie popularnego chatbota. Eksperci wskazują, że OpenAI wykorzystało dane, które były łatwo dostępne online i to na dużą skalę.
Tymczasem branża robotyki wciąż nie znalazła podobnie taniego i niezawodnego źródła danych. Jak ujawnia Wang Xiaogang, współzałożyciel SenseTime i prezes Ace Robotics, branża do tej pory zgromadziła zaledwie setki tysięcy godzin danych szkoleniowych. To wynik znikomy w porównaniu choćby z powiązanym sektorem, jak autonomiczna jazda. Tam, przy użyciu najnowocześniejszych symulacji, każdego dnia generuje się miliony godzin danych. Specjaliści tego sektora uważają, że na przełom w robotyce przyjdzie nam zatem poczekać, nawet około dekady. Ale znaczący postęp przyjdzie szybciej, ma być już w ciągu dwóch lat. Nadzieją są eksperymentalne techniki generowania danych, które rozszerzą dostępne zbiory do dziesiątek milionów godzin w perspektywie do 2027 r. Podejścia te obejmują szkolenie robotów w zakresie obserwacji i naśladowania zachowań człowieka w różnych scenariuszach życia realnego. I właśnie tu swoją rolę do odegrania mają masy tzw. gig-workerów.
Stawka 15 dol. za godzinę w krajach rozwijających się kusi rzesze „cyfrowych wyrobników”. Wykonywanie codziennych zadań i ich filmowanie ciężko nawet nazwać pracą, ale zbierane w ten sposób dane są dla firm technologicznych na wagę złota.
Czytaj więcej
Chiński gigant Xiaomi zapowiada rewolucję w produkcji. Humanoidalne roboty mają zastąpić ludzi w fabrykach w ciągu pięciu lat, a sztuczna inteligen...
Prywatność na sprzedaż w cieniu miliardowych inwestycji
Skala zjawiska jest ogromna – start-up Micro1 z Palo Alto zatrudnia tysiące kontraktorów w Indiach czy Nigerii, odsprzedając ich nagrania twórcom systemów humanoidalnych, Scale AI już zgromadziło 100 tys. godzin takich materiałów, a firma DoorDash udostępniła aplikację Tasks, pozwalając milionom amerykańskich kurierów na dorabianie poprzez filmowanie prac domowych między kursami. Popyt wynika z wyzwań stojących przed branżą i ogromnego zapotrzebowania na filmy „bogate w kontakt”. Systemy Physical AI muszą zobaczyć ludzkie dłonie chwytające i układające przedmioty w chaotycznym środowisku domowym oraz reakcje człowieka w najbardziej prozaicznych sytuacjach. Ulrik Hansen ze start-upu Encord tłumaczy, że w robotyce „dane trzeba po prostu generować od podstaw w świecie rzeczywistym”. W ich zbieraniu pojawia się jednak przeszkoda. Chodzi o ochronę danych osobowych i prywatność – warunki narzucane pracownikom pozostają niezwykle ogólne, mają oni ograniczony wgląd w to, w jaki sposób firmy przechowują i wykorzystują ich prywatne nagrania. „MIT Technology Review” podaje, że np. DoorDash wykluczył z programu Tasks stany z surowszym prawem chroniącym prywatność, takie jak Kalifornia czy Nowy Jork. Przypadek?
Dziś liderem w rozwoju robotów humanoidalnych pozostają Chiny. Prym wiodą m.in. Unitree Robotics i AgiBot. Ta pierwsza firma chce wydać ponad 90 mln dol. na budowę zakładu produkującego humanoidy. Projekt zakłada, że rocznie z taśmy montażowej będzie zjeżdżać 75 tys. robotów dwunożnych oraz 115 tys. czworonożnych. Morgan Stanley prognozuje, że sprzedaż robotów humanoidalnych w samych Chinach w tym roku skoczy ponad dwukrotnie, do 28 tys. sztuk. Wedle analityków GGII do 2030 r. globalna sprzedaż robotów humanoidalnych osiągnie pułap ponad 600 tys. sztuk (przy szacowanej wartości rynku na 15 mld dol.). W przypadku czworonożnych maszyn dostawy mogą przebić próg 560 tys. sztuk.
Czytaj więcej
Już nie tylko AI budzi obawy o inwestycyjną bańkę. Rodney Brooks, współtwórca iRobota i były profesor MIT, ostrzega: miliardy dolarów wpompowane w...
W 2025 r. branża ta pozyskała rekordowe finansowanie rzędu 40,7 mld dol., co oznacza wzrost o 74 proc. rok do roku. W praktyce niemal co dziesiąty dolar zainwestowany przez fundusze VC płynie dziś do sektora robotyki. Ten stał się, obok oprogramowania AI, głównym celem inwestycyjnym.
Trend ten aktywnie wykorzystują najwięksi rynkowi gracze. Amazon przejął ostatnio dwie firmy robotyczne, rozszerzając swoje zainteresowania poza automatyzację magazynów, w którą inwestował od ponad dekady (począwszy od zakupu Kiva Systems w 2012 r.). Nowe nabytki to Fauna Robotics, producent wycenianego na 50 tys. dol. humanoidalnego robota do zastosowań domowych i szkolnych, oraz szwajcarski start-up Rivr, tworzący roboty pokonujące schody (przeznaczone do dostaw na „ostatniej mili”, pod drzwi klienta).