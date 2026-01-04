Z tego artykułu się dowiesz: Jak wypada polski model językowy Bielik w międzynarodowych benchmarkach?

Bielik v3, a więc najnowsza wersja sztucznej inteligencji stworzonej przez Fundację SpeakLeash, społeczność specjalistów i entuzjastów, została uwzględniona w badaniach porównawczych dla wiodących LLM-ów i wypadła zaskakująco dobrze. Mowa o benchmarkach EuroEval, platformie analizującej skuteczność i jakość modeli językowych w różnych zadaniach. W dużym uproszczeniu można powiedzieć, że testy te są niczym olimpiada dla AI. A polski model w wersji bazowej zajął 4. miejsce na świecie w zadaniach wielojęzycznych.

Mały model, wielki wynik

O sukcesie na platformie X poinformował Sebastian Kondracki, jeden z założycieli SpeakLeash. Jak podał, tzw. wersja instrukcyjna (nauczona reagować na polecenia), uplasowała się na 32. pozycji. Co też nie jest złym wynikiem, bo to rezultat lepszy niż osiągnęły systemy o znacznie większych mocach, w tym Nemotron (30B parametrów), OLMo (32B), czy rozwijana przez kierowany przez Marka Zuckerberga koncern Meta model Llama 3.1 (8B). Bielik, polska AI działająca w modelu open source, ma tylko 11B parametrów. „Takie wyniki aż proszą się o symboliczne docenienie zespołu trenującego. Choćby order (…)” – napisał na X Kondracki. „Jeśli uwzględnimy wyłącznie modele instrukcyjne, bez modeli wnioskujących, Bielik v3 plasuje się na 18. miejscu” – dodał.

SpeakLeash (znany również jako Spichlerz) zainicjowany został w 2022 r. Celem projektu jest umożliwienie prowadzenia badań nad modelowaniem języka i uczeniem maszynowym w języku polskim. Pierwotnym założeniem było zbudowanie zestawu danych w języku polskim dla dużego modelu językowego (LLM). Obecnie projekt koncentruje się na tworzeniu narzędzi do ewidencji, filtrowania oraz utrzymania zestawów danych tekstowych, które mogą być bezpłatnie wykorzystane do trenowania modeli sztucznej inteligencji w języku polskim. Sam Bielik AI zadebiutował w 2024 r. Model bazuje na zasobach obliczeniowych Akademickiego Centrum Komputerowego Cyfronet. Przedsięwzięcie wspiera mocno powiązana z Sebastianem Kulczykiem spółka Beyond, a także Rafał Brzoska. Dzięki temu ostatniemu, który będzie nie tylko finansowo wspierał projekt, aplikacja InPost Mobile, kojarzona dotychczas głównie z odbiorem przesyłek, stała się właśnie poligonem doświadczalnym dla polskiej AI (firma pod koniec 2025 r. ogłosi integrację z modelem Bielik, rozpoczynając akcję społeczną pod hasłem „Nakarm Bielika”). Grupa InPost w listopadzie ogłosiła, że obejmie strategiczny mecenat nad Fundacją SpeakLeash. Wsparcie zapewnić ma też Google Cloud, który znalazł się w powołanej niedawno Radzie Biznesowej Bielika.