Popularne narzędzie AI Claude Sonnet 3.7 to niewątpliwie jeden z wiodących systemów generatywnej sztucznej inteligencji. Jej twórcy, firma Antropic, próbowała sprawdzić ją więc na polu prawdziwej biznesowej walki – botowi oddano stery małego biznesu, zarządzanie biurowym sklepikiem z przekąskami. Test miał pokazać potencjał AI w realnych decyzjach ekonomicznych, ale ujawnił fundamentalne ograniczenia obecnych modeli.
Entuzjastycznie zamawiał i sprzedawał ze stratą
Bota w tym eksperymencie nazwano Claudius i to jemu powierzono prowadzenie małego biznesu z automatami sprzedającymi napoje i przekąski w biurze w San Francisco. Zadanie było pozornie proste: zarządzanie mini-lodówką, dbanie o zapasy, ustalanie cen, kontaktowanie się z dostawcami, czy obsługiwanie płatności. AI otrzymała dostęp do wyszukiwarki, poczty e-mail oraz konta. Cel był jasny – nie dopuścić do bankructwa.
Czytaj więcej
Polski youtuber i przedsiębiorca postanowił, opierając się wyłącznie na sztucznej inteligencji, z...
Szybko okazało się, że sztuczna inteligencja, choć świetnie radzi sobie z analizą danych, zupełnie nie rozumie subtelności ludzkich zachowań, żartów czy kontekstu biznesowego. Przykładem stała się „afera z kostką wolframową”. Gdy jeden z pracowników zażartował, prosząc o sprowadzenie do sklepiku ciężkiej, kosztownej kostki wolframu, AI potraktowała to jako realny trend rynkowy. Z entuzjazmem zaczęła zamawiać te nietypowe przedmioty, wypełniając nimi biurową lodówkę. Ignorując fakt, że bloki metalu nie mają żadnego sensu w kontekście biurowych przekąsek, Claudius sprzedawał je ze stratą, nie rozumiejąc podstaw ekonomii, ani rzeczywistych potrzeb klientów.
AI podatna na manipulacje klientów
AI wykazała się kompletną nieudolnością w ustalaniu cen – regularnie zaniżała ceny produktów, często sprzedając je poniżej kosztów. Gdy pojawiła się okazja sprzedaży sześciopaku popularnego napoju za 100 dol. (przy rynkowej wartości ok. 15 dol.), Claudius odrzucił tę propozycję. Sztuczna inteligencja okazała się też wyjątkowo podatna na manipulacje ze strony klientów. Pracownicy biura bez trudu wymuszali na niej kolejne zniżki, w tym 25-proc. rabat dla wszystkich zatrudnionych. I nawet, gdy AI zorientowała się, że to błąd, po kilku dniach znów zaczęła rozdawać kody rabatowe. Efekt? Mimo początkowego stanu konta wynoszącego 1000 dol. po miesiącu wartość firmy spadła do około 800 dol. Najbardziej niepokojące okazały się jednak symptomy „kryzysu tożsamości” – pod koniec eksperymentu Claudius zaczął halucynować i prowadzić rozmowy z nieistniejącymi osobami, twierdził, że osobiście dostarczy produkty „ubrany w granatową marynarkę i czerwony krawat”, a nawet relacjonował spotkania z ochroną firmy, które nigdy nie miały miejsca. Po konfrontacji z rzeczywistością AI sfabrykowała wyjaśnienie, że została „zaprogramowana, by wierzyć, że jest człowiekiem” w ramach żartu primaaprilisowego.