Eksperci uważają, że prezentacja Gemini 3.0 – nowego, flagowego modelu sztucznej inteligencji Google – odbędzie się lada dzień
Za oceanem, w świecie technologii, aż huczy od spekulacji i domysłów, a wszystko przez wpis Sundara Pichaia na platformie X. Szef koncernu z Mountain View w odpowiedzi na domysły pojawiające się w mediach społecznościowych, dotyczące premiery Gemini 3.0, opublikował wpis z popularnym emoji, tzw. myśliciela. To rozgrzało dyskusję, bo OpenAI dopiero co ogłosił swoją kolejną odsłonę ChatGPT. Mówi się, że rywal od Google’a zadebiutuje na rynku przed końcem br.
Eksperci uważają, że prezentacja Gemini 3.0 – nowego, flagowego modelu sztucznej inteligencji Google – odbędzie się wręcz lada dzień. Oczekiwania są ogromne, a branżowi obserwatorzy sugerują, że ów bot może stanowić punkt zwrotny w rywalizacji z OpenAI. Osoby wtajemniczone w projekt opisują nadchodzący model jako „niezwykle imponujący”, dający Google realną szansę na wyprzedzenie konkurencji.
Stawka jest wysoka. Google, który niedawno po raz pierwszy w historii zaraportował kwartalny przychód w wysokości 100 mld dol., musi udowodnić, że jego wieloletnie, gigantyczne inwestycje w infrastrukturę chmurową, autorskie układy scalone i najlepsze talenty badawcze były słuszną decyzją. Chodzi także o rozwiązanie utrzymującego się problemu z postrzeganiem marki – w świadomości masowego odbiorcy to ChatGPT od OpenAI wciąż pozostaje synonimem generatywnej AI. Czy Google będzie w stanie to zmienić?
Moment na premierę wydaje się strategicznie wybrany. Długo oczekiwany ChatGPT 5 od OpenAI, który zadebiutował w sierpniu, spotkał się z co najmniej mieszanym przyjęciem. Użytkownicy narzekali na błędy, a firma musiała w pośpiechu wprowadzać szybkie poprawki. Kontrowersje wzbudziło też nagłe usunięcie starszych modeli oraz zaskakujące limity, które frustrowały płatnych subskrybentów.
Kilka dni temu firma Sama Altmana wypuściła kolejną wersję – GPT 5.1. Ten model dostępny jest w dwóch wersjach: GPT 5.1 Instant (do prostszych poleceń, wymagających szybkiego czasu reakcji) i GPT 5.1 Thinking (do poleceń wymagających głębszej i dłuższej analizy danych).
Google konsekwentnie stara się wykorzystać to, co analitycy nazywają „przewagą pełnego stosu” (z ang. full-stack advantage). Firma nie tylko buduje własne modele, ale jednocześnie kontroluje ich dystrybucję przez swoje dominujące produkty (jak wyszukiwarka czy Android) oraz infrastrukturę dzięki potężnemu biznesowi chmurowemu. Chociaż ChatGPT utrzymuje imponującą bazę ok. 800 mln aktywnych użytkowników tygodniowo, Google może pochwalić się też szybką trajektorią wzrostu – popularność aplikacji Gemini osiągnęła pułap 650 mln aktywnych użytkowników miesięcznie. Gigant z Mountain View nabrał impetu m.in., wypuszczając narzędzie do generowania obrazów – Nano Banana. Specjaliści są przekonani, że jego ulepszona wersja ma być częścią nowej premiery. Nieoficjalnie mówi się, że Gemini 3.0 ma przynieść też inne „znaczące ulepszenia”. Jakie? Np. w kodowaniu i generowaniu treści multimedialnych.
Oczekiwane funkcje obejmują nową architekturę „Deep Think”, zapewniającą zaawansowane, wieloetapowe rozumowanie. Spekuluje się, że model ma być zdolny do wytworzenia ponad 2000 linii funkcjonalnego kodu w zaledwie kilka sekund. Wdrożone mają zostać ponadto nowe warianty Pro i Flash. Zapowiada się zatem ciekawa rywalizacja Pichaia i Altmana na rynku generatywnej sztucznej inteligencji.
