OpenAI przygotowuje się do uruchomienia GPT-5, następcy swojego rewolucyjnego systemu GPT-4. Nowy ChatGPT, mimo pewnych opóźnień, miałby zadebiutować jeszcze w tym miesiącu. Nieoficjalnie mówi się, że nastąpi to nawet w pierwszej połowie sierpnia. W lutym szef OpenAI zapowiadał, że GPT-5 będzie dostępny bez limitów jako podstawowy model w ChatGPT. Nie wiadomo jeszcze, jakie będą jego możliwości, choć ma przewyższać istniejące modele. ChatGPT, jako dominujący gracz na rynku chatbotów, ma szansę umocnić pozycję lidera. Model, mający ponad 100 mln użytkowników, ma jednak mocną konkurencję. Jeszcze przed premierą GPT-5 swoje rozwiązanie pokazał Anthropic, firma, która już kontroluje 32 proc. rynku generatywnych systemów AI dla przedsiębiorstw (jak podaje Menlo Ventures w przypadku OpenAI to „tylko” 25 proc.).

Co potrafią nowe modele AI od Alibaby i Anthropic?

Anthropic wydało właśnie wersję Opus 4.1 swojego popularnego modelu Claude. Jak donosi serwis TechCrunch, wykazuje on poprawioną wydajność w kodowaniu, rozumowaniu i tzw. zadaniach agentowych. A przy tym dostęp do systemu będzie w tej samej cenie co do poprzednika.

Anthropic podał, że Claude Opus 4.1 osiąga 74,5 proc. dokładności w SWE-bench Verified (benchmark inżynierii oprogramowania), gdy Opus 4 miał poziom 72,5 proc. GitHub potwierdził, że Opus 4.1 zapewnia „szczególnie znaczące wzrosty wydajności” w niektórych elementach, choć w praktyce kompleksowy wzrost wydajności w poszczególnych metrykach jest jednak dość nieznaczny. I tak np. model poprawił się do 80,9 proc. w tzw. rozumowaniu na poziomie absolwenckim (z 79,6 proc. według GPQA Diamond) i osiągnął 78 proc. w konkursach matematycznych AIME 2025 (z 75,5 proc.). Choć koszt korzystania z systemu się nie zmienił (model zachowuje cennik 15 dol. za milion tokenów wejściowych i 75 dol. za milion tokenów wyjściowych), to jest i tak jednym z najdroższych dostępnych modeli.