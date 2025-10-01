Aktualizacja: 01.10.2025 12:09 Publikacja: 01.10.2025 10:55
Orzeł Bielik stał się patronem głośnego polskiego projektu AI
Foto: AdobeStock
Bielik AI, czyli pierwszy w pełni polski, tzw. otwartoźródłowy duży model językowy (LLM), może teraz zyskać „oczy”. Pokaźna grupa osób zainteresowanych budową rodzimego LLM-a, który wykorzystuje polskie dane do trenowania, co zapewnia mu lepsze rozumienie naszych realiów, idiomów i stylu – wszystko to dotyczy tekstu. Teraz liczy jednak, że dzięki nowej inicjatywie Bielik będzie miał też zdolność rozpoznawania „polskich” obrazów. Chodzi o to, by AI była w stanie interpretować zdjęcia i grafiki, zwłaszcza te charakterystyczne dla naszego kraju.
Społeczność określana jako SpeakLeash, która we współpracy z Akademickim Centrum Komputerowym Cyfronet AGH stworzyła Bielika AI, teraz robi kolejny duży krok w rozwoju tego zaawansowanego narzędzia. Chodzi o to, by sztuczna inteligencja była w stanie rozumieć, co „widzi”. Aby to było możliwe, potrzeba bardzo dużej liczby zdjęć, które posłużą do trenowania modelu. To żmudne i czasochłonne zadanie, stąd twórcy Bielika wpadli na pomysł, by zaangażować w to każdego chętnego Polaka. Opracowali inicjatywę Obywatel Bielik, której celem jest zebranie 1 mln odpowiednio opisanych fotografii – dowolnych zdjęć przedstawiających charakterystyczne miejsca w naszym kraju, zwierzęta typowe dla tego regionu Europy czy postaci historyczne związane z Polską.
– Zawarliśmy już, pod patronatem Ministerstwa Cyfryzacji, umowę z Narodowym Archiwum Cyfrowym – mówi nam Maciej Szymański, członek Fundacji SpeakLeash.
Jak tłumaczy, chodzi o zbudowanie czegoś na kształt „cyfrowej pamięci Polski”. I co ważne, każdy może dołączyć do tego zadania.
– To projekt obywatelselski, wyjątkowy w skali Europy, dzięki któremu polska kultura, historia i tradycja zyskają nowe życie w świecie cyfrowym – zaznacza.
Projekt nazwano Obywatel Bielik, bo to obywatele, każdy z Polaków, mają zasilać model AI swoimi zdjęciami. Wystarczy zrobić fotografię i ją opisać.
– Potrzebujemy też różnych zdjęć branżowych, m.in. związanych z motoryzacją. Finalnie powstanie obywatelski zbiór danych, cyfrowy magazyn, który będzie otwarty i udostępniany – wyjaśnia nasz rozmówca.
Na razie projekt jest w fazie beta, ale zespół entuzjastów pracuje nad osobną aplikacją mobilną, która ułatwi opisywanie i dodawanie zdjęć do bazy dla Bielika. Choć to dopiero początek zbierania, już sklasyfikowano prawie 11 tys. fotografii. SpeakLeash liczy, że zaangażuje do projektu uczelnie i zamierza też wprowadzić elementy grywalizacji, by zmobilizować i zmotywować do budowania zasobów zdjęciowych polskiej AI. Jak podkreśla Maciej Szymański, dzięki stworzeniu takiej bazy będzie można ruszyć z tzw. treningiem multimodalnym Bielika, dzięki któremu rodzimy LLM będzie rozpoznawał obrazy.
Celem całego projektu Bielik AI, który jest oddolną inicjatywą, jest zapewnienie suwerenności technologicznej Polski w obszarze przetwarzania języka naturalnego oraz dostarczenie narzędzia wyspecjalizowanego w języku polskim. Model multimodalny mógłby wystartować w przyszłym roku. W SpeakLeash liczą, że zdolność „widzenia” mogłaby zostać wykorzystana m.in. przez firmy z rynku e-commerce. Chodzi o to, że platformy internetowe w UE wspierają czytniki dla osób z niepełnosprawnościami wzrokowymi, a te powinny odpowiednio interpretować i mówić użytkownikom, co widzą. Obywatel Bielik mógłby właśnie pomóc w stworzeniu takiego polskiego narzędzia.
Co ważne, projekt obywatelskiego zbierania danych zakłada, że liczy się ilość, a nie jakość. Jednym słowem potrzeba jak najwięcej zdjęć, ale takich „zwykłych”, zrobionych np. smartfonem, a nie artystycznych. Najlepiej, gdy fotografowane są obiekty związane z Polską, zabytki, tradycyjne potrawy.
