Z tego artykułu dowiesz się:
- Jakie zdolności prezentuje najnowszy model AI od Anthropic i dlaczego wywołuje on niepokój w branży.
- Na czym polega zagrożenie związane z rekurencyjnym samodoskonaleniem AI.
- Dlaczego liderzy rynku AI, tuż przed swoimi giełdowymi debiutami, apelują o powołanie globalnego organu nadzoru.
Na rynku zadebiutował właśnie Fable 5, pierwszy publicznie dostępny system potężnej klasy Mythos. Nowa wersja Claude'a otwiera drzwi do świata, w którym maszyny mogą zacząć ulepszać się same, poza kontrolą człowieka. To kamień milowy, który w środowisku badaczy wywołuje tyleż zachwytu, co głębokiego niepokoju. Platforma Stripe wykorzystała go do migracji 50 mln linii kodu – zadanie, które zespołowi inżynierów zajęłoby ponad dwa miesiące, algorytm wykonał w jeden dzień. Model ten wykazuje niespotykane dotąd zdolności adaptacyjne, bez trudu bijąc rekordy w benchmarkach finansowych czy samodzielnie przechodząc grę Pokémon FireRed wyłącznie przy użyciu interfejsu wizualnego.
AI wymyśli nową broń?
Możliwości technologii od firmy Anthropic robią wrażenie, ale eksperci wysyłają jednocześnie sygnał ostrzegawczy. Klasa Mythos nie bez powodu była dotychczas trzymana pod kluczem, a dostęp do jej pełnej wersji (Claude Mythos 5) wciąż posiadają wyłącznie nieliczne organizacje rządowe w ramach programu Anthropic Project Glasswing.
Czym w istocie jest zagrożenie klasy Mythos i dlaczego budzi tak ogromny paraliż u samych jej twórców?
Chodzi o zaawansowane zdolności w obszarach takich jak biochemia, synteza materiałów niebezpiecznych oraz inżynieria wsteczna oprogramowania. W rękach nieodpowiednich aktorów państwowych lub grup terrorystycznych, autonomiczny system tej klasy mógłby w kilka godzin zaprojektować nową broń biologiczną lub zidentyfikować krytyczne podatności w systemach teleinformatycznych elektrowni jądrowych, generując gotowe cyberbronie. Największym widmem pozostaje jednak tzw. rekurencyjne samodoskonalenie (recursive self-improvement), a więc moment, w którym model klasy Mythos staje się na tyle autonomiczny, że zaczyna samodzielnie pisać kod i trenować swojego następcę. W takim scenariuszu ewolucja AI mogłaby przyspieszyć w postępie geometrycznym, sprawiając, że ludzkość w kilka dni straciłaby jakikolwiek wpływ na kierunek rozwoju maszyn.
Nic dziwnego, że pojawiają się wyraźne apele o ograniczenia AI.
Czytaj więcej
Premiera Claude Design wywołała rynkowe tąpnięcie i pokazała, że modele AI mogą stać się pełnoprawnymi aplikacjami. Tradycyjny SaaS zaczyna tracić...
Ostrzeżenia przed IPO
Sam Altman oraz główny naukowiec OpenAI Jakub Pachocki opublikowali manifest ogłaszający wejście ich firmy w „trzecią fazę” rozwoju. Po etapach badań i komercjalizacji produktów, priorytetem staje się powszechne, bezpieczne udostępnianie AI oraz poddanie jej rygorystycznemu nadzorowi. Liderzy OpenAI, wspólnie z konkurującym z nimi Anthropic, wprost apelują o powołanie międzynarodowego organu zarządczego na wzór Agencji Energii Atomowej. Instytucja ta miałaby prawo do odgórnego, natychmiastowego spowolnienia lub zamrożenia badań nad technologiami „frontier” w laboratoriach na całym świecie.
Moment tego apelu jest zastanawiający, bo obie firmy znajdują się obecnie w kluczowych punktach swojej historii biznesowej. OpenAI złożyło właśnie poufny wniosek o pierwszą ofertę publiczną (IPO) w amerykańskiej SEC, a jego wycena przekracza astronomiczne 850 mld dol. Anthropic z kolei złożył swój prospekt emisyjny S-1 na początku czerwca. Czy zatem to tylko zagrywka przed IPO?
W praktyce ruchy związane z ograniczaniem najbardziej zaawansowanych modeli są pozorne. Wdrażane obecnie przez Anthropic w modelu Claude Fable 5 bezpieczniki – polegające na automatycznym przekierowywaniu wrażliwych zapytań do starszego modelu Opus – nie są idealne. Brytyjski Instytut Bezpieczeństwa AI poczynił już pewne postępy w łamaniu tych barier podczas testów.
A to nie jedyny problem. Grzegorz Gawin, data protection officer w internetowym biurze podróży eSky.pl, zwrócił uwagę, że w kontekście Claude Fable 5, z perspektywy zgodności z przepisami o ochronie danych, kluczowy jest jeden szczegół, który łatwo przeoczyć. Otóż model wymaga zatrzymania treści konwersacji przez okres do 30 dni jako warunek działania wbudowanych zabezpieczeń.
– Każda organizacja przetwarzająca dane osobowe lub informacje wrażliwe powinna traktować ten fakt jako punkt wyjścia do oceny wdrożenia, a nie jako drobny przypis w dokumentacji. W eSky Group każde narzędzie AI przechodzi przez pełną ewaluację zgodności z RODO zanim znajdzie się w środowisku produkcyjnym. Przy modelach tej klasy podejście ad hoc po prostu nie wchodzi w grę – komentuje. – Ogólna trajektoria jest obiecująca. Anthropic stara się znaleźć punkt równowagi między możliwościami a odpowiedzialnością i widać, że to rzeczywisty priorytet, a nie tylko PR. Diabeł jednak tkwi w szczegółach umownych i w tym, co faktycznie dzieje się z danymi po drugiej stronie połączenia – zaznacza.