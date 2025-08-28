Aktualizacja: 29.08.2025 09:49 Publikacja: 28.08.2025 23:14
Naukowcy z Singapuru chcą zrewolucjonizować sztuczną inteligencję. Na zdjęciu symbol tego małago, acz prężnego gospodarczo państwa Azji
Foto: Bloomberg
Naukowcy z singapurskiej firmy Sapient chcieli dowieść, że sztuczna inteligencja nie musi być olbrzymim modelem, by efektywnie rozumować. Wygląda na to, że im się udało – stworzony przez nich Hierarchical Reasoning Model (HRM) osiągnął zaskakująco dobre wyniki w testach logicznego myślenia. AI składająca się zaledwie z 27 mln parametrów, stanowi ostry kontrast dla wielkich modeli językowych, których architektura opiera się na miliardach, a nawet bilionach parametrów, jak w przypadku GPT-5. Mimo tak ogromnej różnicy w skali, to właśnie mniejszy HRM okazał się skuteczniejszy w wymagającym teście ARC-AGI-1. Zdobył 40,3 proc. poprawnych odpowiedzi, gdy narzędzia OpenAI – 34,5 proc., a Claude 3.7 od Anthropic – 21,2 proc. W tym samym zestawieniu chiński DeepSeek R1 uzyskał zaledwie 15,8 proc.
Okazuje się, że sekret wydajności HRM tkwi w jego architekturze, która naśladuje hierarchiczne przetwarzanie informacji w ludzkim mózgu. System składa się z dwóch modułów – pierwszy, wysokiego poziomu, odpowiada za powolne, abstrakcyjne planowanie, zaś drugi, niskiego poziomu, zajmuje się szybkimi i szczegółowymi obliczeniami. Taka dwupoziomowa struktura pozwala modelowi na rozwiązywanie problemów w jednym „przebiegu”, bez konieczności nadzorowania pośrednich etapów rozumowania. Jak tłumaczy Mayukh Deb z Georgia Tech, pracujący nad podobnymi badaniami, „modele AI są niestrukturalne, podczas gdy mózgi są niezwykle zorganizowane”.
Czytaj więcej
Premiera nowego ChatGPT rozczarowała, a wielu ekspertów ostrzega, że tempo rozwoju AI wyraźnie zw...
HRM działa, jak to nazwano, w krótkich „wybuchach myślenia”, iteracyjnie analizując problem i decydując, czy kontynuować obliczenia, czy przedstawić ostateczną odpowiedź. To podejście pozwoliło mu osiągnąć niemal perfekcyjne wyniki w rozwiązywaniu sudoku i znajdowaniu dróg w labiryntach. A należy zaznaczyć, iż w takich zadaniach konwencjonalne LLM-y kompletnie sobie nie radzą.
Wprowadzony w marcu jeszcze trudniejszy benchmark ARC-AGI-2 dodatkowo uwypuklił przewagę nowego podejścia. HRM uzyskał w nim 5 proc., gdy konkurenci jak o3-mini-high i Claude 3.7 odpowiednio 3 i 0,9 proc. Choć wyniki te wciąż znacząco odbiegają od ludzkich możliwości (ok. 60 proc.), pokazują potencjał drzemiący w bardziej efektywnych architekturach.
Czytaj więcej
W 2025 r. dojdzie do zmiany globalnego lidera na rynku chatbotów – prognozują specjaliści z platf...
Ostatnia analiza przeprowadzona przez ARC Prize Foundation rzuca na sprawę nowe światło. Wyszło na jaw, że podczas odtwarzania wyników HRM jego hierarchiczna budowa miała minimalny wpływ na wydajność, a kluczowy dla sukcesu okazał się za to słabo udokumentowany proces „udoskonalania modelu podczas treningu”. To odkrycie sugeruje, że w zadaniach wymagających rozumowania innowacyjna metodologia trenowania może być znacznie ważniejsza niż sama architektura.
Eksperci sądzą, że HRM podważa sens inwestowania miliardów dolarów w coraz większe modele językowe, skoro mniejsze i efektywniej trenowane alternatywy mogą osiągać konkurencyjne, a często nawet lepsze rezultaty.
© Licencja na publikację
© ℗ Wszystkie prawa zastrzeżone
Źródło: rp.pl
Naukowcy z singapurskiej firmy Sapient chcieli dowieść, że sztuczna inteligencja nie musi być olbrzymim modelem, by efektywnie rozumować. Wygląda na to, że im się udało – stworzony przez nich Hierarchical Reasoning Model (HRM) osiągnął zaskakująco dobre wyniki w testach logicznego myślenia. AI składająca się zaledwie z 27 mln parametrów, stanowi ostry kontrast dla wielkich modeli językowych, których architektura opiera się na miliardach, a nawet bilionach parametrów, jak w przypadku GPT-5. Mimo tak ogromnej różnicy w skali, to właśnie mniejszy HRM okazał się skuteczniejszy w wymagającym teście ARC-AGI-1. Zdobył 40,3 proc. poprawnych odpowiedzi, gdy narzędzia OpenAI – 34,5 proc., a Claude 3.7 od Anthropic – 21,2 proc. W tym samym zestawieniu chiński DeepSeek R1 uzyskał zaledwie 15,8 proc.
Niepokojący trend wyłania się z najnowszego raportu ekonomistów z Uniwersytetu Stanford. Sztuczna inteligencja n...
Mamy technologie i infrastrukturę, dzięki którym możemy stworzyć łączność bardzo mocno dostosowaną do potrzeb danego przedsiębiorcy. My nazywamy to sieciami kampusowymi – mówi Mariusz Garczyński, ekspert ICT Orange Polska.
Część twórców portalu YouTube zauważyła w ostatnich miesiącach zmianę jakości publikowanych materiałów. Filmy zd...
Komputery kwantowe przestają być obietnicą, a stają się praktycznym narzędziem. Dzięki połączeniu ich mocy z kla...
Doomerzy, czyli osoby o skrajnie pesymistycznym spojrzeniu na zagrożenia stojące przed ludzkością, ostrzegają pr...
Do języka potocznego przeszło nieco romantyczne powiedzenie o tym, by może jednak rzucić wszystko i wyjechać w Bieszczady.
Setki tysięcy prywatnych rozmów z Grokiem, chatbotem od firmy Elona Muska, można znaleźć za pomocą wyszukiwarki...
Kiedyś dotacje, teraz raczej kredyty na preferencyjnych warunkach. Podejście Brukseli do finansowania rozwoju przedsiębiorstw z branży rolno-spożywczej ewoluuje, ale niezmienne jest to, że wciąż firmy mogą liczyć na wsparcie. Co więcej, już nie tylko ze środków unijnych, ale także krajowych.
Masz aktywną subskrypcję?
Zaloguj się lub wypróbuj za darmo
wydanie testowe.
nie masz konta w serwisie? Dołącz do nas