Z tego artykułu dowiesz się:
- Czy AI jest coraz głupsza i jak to się przejawia.
- Dlaczego jakość treści w internecie spada.
- Jaka jest przyszłość modeli językowych.
- Czy firmy powinny nadal inwestować w AI.
Naukowcy z Oxfordu i Cambridge alarmują: jakość odpowiedzi tworzonych przez sztuczną inteligencję spada. – Choć trudno mówić o powszechnym „głupieniu” AI, warto zwrócić uwagę na zjawisko określane jako model collapse, czyli zapadanie się modeli. Dochodzi do niego, gdy kolejne generacje systemów AI są trenowane na treściach syntetycznych, wygenerowanych przez ich poprzedników. Błędy, które początkowo mają charakter marginalny, zaczynają się utrwalać i przenikać do kolejnych wersji systemów jako element ich obrazu rzeczywistości – wyjaśnia Patryk Oleszczuk, ekspert technologiczny SaldeoSMART.
Czytaj więcej
AI nie zniszczy rynku pracy, lecz zwiększy produktywność gospodarki, wywołując deflację i niedobór pracowników – tę wizję na konferencji VivaTech z...
Pobieranie i używanie wygenerowanych przez AI danych na potrzeby treningu kolejnych modeli stanowi cyfrowy odpowiednik znanego z biologii chowu wsobnego.
– Inne, używane w branży określenia to „kanibalizm AI” czy „AI Habsburgów” – mówi Michał Grega, prezes Aiseemo i członek AI Chamber. Podkreśla, że zasadniczy problem nie polega na tym, że „AI staje się głupsza” w potocznym sensie. Mówiąc precyzyjnie, modele trenowane rekurencyjnie na treściach generowanych przez wcześniejsze modele mogą stopniowo tracić zdolność odwzorowania prawdziwego rozkładu danych. Najpierw znikają przypadki rzadkie, nietypowe i brzegowe, a więc te, które często są najważniejsze z punktu widzenia jakości, bezpieczeństwa i reprezentatywności tworzonych systemów.
Czy AI zjada swój własny ogon?
Zubożenie internetowych treści nie wynika wyłącznie z faktu pojawienia się generatywnych algorytmów. To nie AI zatruwa cyfrową przestrzeń. Robi to nasze lenistwo i szukanie dróg na skróty.
– Największym grzechem współczesnych twórców stało się całkowite delegowanie procesu myślowego na maszyny. Wrzucamy do okna czatu lakoniczne polecenie i oczekujemy gotowego, błyskotliwego tekstu. W efekcie zalewamy sieć treściami pozbawionymi autentycznej perspektywy, bo sami zrezygnowaliśmy z kreatywności – mówi Jacek Treder, szef AI w Digitree Group.
Czy zatem rewolucja AI zjada własny ogon? Niekoniecznie. Zjawisko to pokazuje jednak, że rozwój sztucznej inteligencji coraz wyraźniej napotyka ograniczenia związane nie z mocą obliczeniową czy dostępnością modeli, ale z jakością danych. Coraz trudniej oddzielić wartościowe informacje od treści powtarzalnych, zniekształconych lub obarczonych błędami. W odpowiedzi na ten problem na znaczeniu zyskuje trend odchodzenia od gigantycznych, uniwersalnych modeli na rzecz rozwiązań wyspecjalizowanych.
– W branżach o zerowej tolerancji na błędy, takich jak finanse, prawo czy księgowość, ogromne modele ogólnego przeznaczenia mogą stanowić dodatkowe źródło ryzyka. Coraz większą przewagę zyskują mniejsze, sprofilowane systemy oparte na zweryfikowanych zbiorach danych i zaprojektowane z myślą o konkretnych procesach biznesowych – mówi Oleszczuk. Takie podejście pozwala wykorzystać potencjał AI przy jednoczesnym ograniczeniu ryzyka halucynacji.
W kontekście zastosowań biznesowych warto także zaznaczyć, że firmy rzadko potrzebują jednego uniwersalnego narzędzia do wszystkich zadań.
– Coraz częściej lepsze rezultaty przynoszą mniejsze, wyspecjalizowane rozwiązania dostosowane do konkretnych procesów, języka, regulacji i wymagań danego środowiska – mówi Wojciech Furmankiewicz, dyrektor Red Hat ds. technologii i rozwiązań w regionie Europy Środkowo-Wschodniej.
Co czeka modele językowe?
Dużym problemem jest relatywnie niewielka liczba nowych, jakościowych treści tworzonych przez ludzi w porównaniu z zalewem treści generowanych przez AI. Niektóre szacunki dla anglojęzycznych artykułów publikowanych w internecie sugerują proporcje 50/50, inne wskazują niższy, ale nadal bardzo znaczący udział treści tworzonych lub współtworzonych przez AI.
– Nie przywiązywałbym się więc do jednej konkretnej liczby. Ważniejszy jest sam kierunek: treści AI jest coraz więcej. Tym samym zwykłe sięganie po treści z internetu może oznaczać trenowanie modeli również na wynikach generowanych przez AI – mówi Marek Jeleśniański, prezes firmy Oxido i analityk modeli LLM. W jego ocenie obecne wersje modeli generatywnych trudno traktować jako gorsze od poprzednich. Owszem, zachodzą w nich zmiany, czasem pojawia się regres w niektórych obszarach i zdarza się, że prompty są interpretowane inaczej niż wcześniej. Na taki stan rzeczy składają się różne czynniki.
– Krótko mówiąc, modele językowe stają się produktami masowymi. Tym samym są coraz częściej dostosowywane do potrzeb masowego odbiorcy. Nie jesteśmy jednak pozbawieni narzędzi. Wiele chatbotów umożliwia definiowanie własnych instrukcji, które pozwalają dostosować sposób wypowiedzi LLM do naszych preferencji – wymaga to jednak dodatkowego wysiłku. Warto też dbać o dobre prompty – podsumowuje ekspert.
Czy biznes ma nadal inwestować w AI?
Pojawiające się co jakiś czas publikacje naukowe nie tyle wskazują na regres sztucznej inteligencji, ile na granice obecnych architektur modeli językowych.
– Problem polega na tym, że wyniki tych analiz bywają błędnie interpretowane, szczególnie przez laików lub podmioty mające bezpośredni interes w polaryzowaniu tej dyskusji – mówi Jacek Gralak, dyrektor ds. AI w Transition Technologies PSC. Dodaje, że z jednej strony deprecjonowanie obecnych modeli bywa wygodnym argumentem dla dostawców tradycyjnych rozwiązań IT, którzy próbują w ten sposób chronić swoje udziały w rynku i zniechęcać klientów do innowacji. Z drugiej strony, narrację o napotkaniu ściany paradoksalnie mogą podsycać czasem sami giganci technologiczni oraz fundusze VC. Pokazywanie, że dotychczasowe metody się wyczerpały, to idealny pretekst, by uzasadnić konieczność gigantycznych, kolejnych rund finansowania na rozwój zupełnie nowych autorskich architektur. W ten sposób narracja o kryzysie AI staje się paliwem rynkowym dla obu stron barykady.
W tym kontekście warto wspomnieć o tzw. prawie skalowania Chinchilla. W dużym uproszczeniu, zakłada ono, że aby proporcjonalnie zwiększać efektywność modelu, musimy równolegle podnosić liczbę unikalnych tokenów (danych), na których jest szkolony.
– Stąd bierze się dwoistość postrzegania AI. Dla masowego odbiorcy nowe modele mogą wydawać się takie same lub nawet mówiąc kolokwialnie, głupsze, jednak specjaliści, a zwłaszcza programiści, widzą ogromny skok jakościowy. Dlaczego? Ponieważ w ich obszarze działalności zawodowej wciąż łatwo o czyste, strukturyzowane dane źródłowe (kod), które pozwalają modelom realnie się rozwijać – mówi Gralak. Dodaje, że ta sytuacja nie pozostaje bez wpływu na rynek aplikacji biznesowych. Firmy mało kiedy tak naprawdę zastanawiają się nad tym, czy warto wdrożyć AI. Korzyści są na tyle oczywiste, że ważniejsze staje się to, czy dane firm są gotowe na rozwiązania wykorzystujące tę technologię.
Czytaj więcej
Aż 85 proc. polskich firm i instytucji doświadczyło w ciągu roku cyberincydentu. Mimo to połowa pracowników nie zna zasad cyfrowej ochrony, a co dz...
Jaka jest przyszłość AI?
Eksperci alarmują: aby uratować jakość treści, musimy natychmiast wdrożyć zasadę „organic-first”. Sztuczna inteligencja nie stworzy przełomowej myśli, jeśli na starcie nie dostanie unikalnego paliwa. W praktyce oznacza to prostą zmianę nawyków.
– Zamiast prosić o napisanie tekstu od zera, zacznijmy od wyposażenia modelu we własne przemyślenia, obserwacje i kontekst. Przekażmy mu naszą autorską tezę, unikalne wnioski z ostatniego projektu, specyficzne studium przypadku czy nawet chaotyczne notatki. Dopiero na takim fundamencie technologia powinna budować strukturę i dobierać słowa – mówi Treder. Radzi, aby modele językowe traktować jako zaawansowaną szlifierkę do myśli, a nie fabrykę taśmowych tekstów. Maszyna ma porządkować, polerować i strukturyzować to, co najpierw sami wypracujemy. Tylko w ten sposób unikniemy ostatecznego spłycenia treści i zachowamy to, co najważniejsze – autentyczność.
Analizy Epoch AI sugerują, że przy obecnym tempie rozwoju modeli już między 2026 a 2032 r. możemy zbliżyć się do granic wykorzystania publicznie dostępnych zasobów wysokiej jakości danych tworzonych przez ludzi.
– Dlatego tak ważne staje się kontrolowanie pochodzenia danych, ich odpowiednia selekcja oraz świadome balansowanie treści syntetycznych z ludzkimi – mówi Sylwia Gwiazda, starsza menedżerka i liderka GenAI dla sektora finansowego w Accenture w Polsce. Zaznacza, że to jednak dopiero pierwszy krok w stronę dojrzałej strategii AI. Skoro jakość danych staje się towarem deficytowym, kończy się era łatwego skalowania modeli w oparciu o ogólnodostępny internet.
– Wierzę, że przyszłość AI nie rozstrzygnie się w chmurze, lecz w naszej zdolności do ochrony własnej własności intelektualnej przed cyfrową homogenizacją. Przewagę konkurencyjną osiągną podmioty, które nauczą się traktować ludzką kreatywność jako rzadki, nieodnawialny surowiec. Zaczyna się era inteligencji selektywnej – podsumowuje ekspertka Accenture.
Czytaj więcej
Opublikowano dokumenty Google DeepMind, z których wynika, że inżynierowie w AI widzą nie „potulnych asystentów”, lecz „buntowników i wyrafinowanych...