Z tego artykułu dowiesz się:

  • Na czym polega nowa metoda ataku AudioHijack.
  • Dlaczego technika ta jest groźniejsza od tradycyjnych cyberataków.
  • Na ile obecne mechanizmy obronne są skuteczne wobec nowego wektora ataków na sztuczną inteligencję.

Dynamiczny rozwój sztucznej inteligencji szybko zwiększa paletę cyfrowych zagrożeń, wprowadzając zupełnie nowe ryzyka, na które dotąd nie byliśmy przygotowani. Jedną z najnowszych podatności ujawniono na ostatnim prestiżowym IEEE Symposium on Security and Privacy w San Francisco. Podczas wydarzenia zespół naukowców z Uniwersytetu Zhejiang, Narodowego Uniwersytetu Singapuru oraz Nanyang Technological University zaprezentował badania, które pokazują, że modele głosowej AI stają się niespodziewanie jednym z wektorów ataków. Chodzi o technikę, którą nazwano AudioHijack, a w dużym skrócie pozwala na osadzanie wrogich instrukcji w zwykłych plikach multimedialnych – piosenkach, filmach czy audycjach internetowych.

Nowa era cyfrowego sabotażu

Kluczowym elementem zagrożenia jest fakt, że ludzkie ucho nie jest w stanie zarejestrować tzw. złośliwych częstotliwości, natomiast duże modele audio-językowe wychwytują je bezbłędnie. Co gorsza, przygotowanie takiego cyberataku jest wręcz banalnie proste. Jak wyjaśniał Meng Chen, główny autor badania i doktorant na Uniwersytecie Zhejiang, „wytrenowanie” sygnału zajmuje zaledwie pół godziny, a – ponieważ jest on całkowicie niezależny od kontekstu – można go wykorzystać do ataku na dany model w dowolnym momencie, niezależnie od tego, co akurat mówi użytkownik.

Czytaj więcej

Tego dysku nie złamią nawet komputery kwantowe. Stawką są dane AI

Tradycyjne cyberataki na systemy rozpoznawania mowy ograniczały się do prostych komend tekstowych. AudioHijack idzie o krok dalej, bo uderza w warstwy rozumowania zaawansowanych modeli językowych, które posiadają autonomię działania: mogą przeszukiwać internet, modyfikować kalendarze, pobierać zainfekowane pliki czy wysyłać e-maile zawierające wrażliwe dane użytkownika.

Badacze przetestowali nową metodę na 13 otwartoźródłowych modelach sztucznej inteligencji przetwarzających dźwięk (w tym Qwen2-Audio, GLM-4-Voice, Phi-4-Multimodal oraz Kimi-Audio). Wyniki okazały się zatrważające: skuteczność wstrzykiwania złośliwych instrukcji wyniosła od 79 do nawet 96 proc. Choć technika wymagała początkowo znajomości pełnej struktury (wag) modeli open-source, eksperymenty wykazały, że ataki te bezproblemowo przenoszą się na komercyjne, zamknięte systemy gigantów technologicznych, takich jak Microsoft Azure czy Mistral AI.

Czytaj więcej

Wymykają się spod kontroli, są sprytne i kreatywne. Nowy problem z AI

Algorytmy okazują się bezbronne

Najbardziej niepokojący jest fakt, że – jak twierdzą badacze – współczesne mechanizmy obronne są w tym starciu bezużyteczne. Popularne techniki, takie jak wzmacnianie promptów (prompt hardening) czy wieloetapowa weryfikacja intencji użytkownika, obniżyły skuteczność ataków zaledwie o ok. 7 proc. Specjaliści twierdzą, iż algorytmy sztucznej inteligencji po prostu nie potrafią odróżnić autentycznej woli siedzącego przed ekranem człowieka od ukrytego w tle „szumu”. Ukrycie „złośliwego polecenia” w podcastach czy filmach na YouTube może więc narobić wielu problemów nieświadomym użytkownikom AI. Szczególnie niebezpieczne może być to w biznesie. Eksperci mówią wprost, że wdrażanie asystentów głosowych o szerokich uprawnieniach w systemach korporacyjnych rodzi fundamentalne ryzyko. Czy kanał audio stanie się więc nową formą cyberataku? Eksperci ds. cyberbezpieczeństwa ostrzegają, że ryzyko jest potężne i – dopóki architektura modeli nie zostanie zmieniona – podłączanie wrażliwych baz danych pod komendy głosowe AI to zagrożenie tożsame z zostawianiem otwartych drzwi do domu.