Z tego artykułu dowiesz się:
- Na czym polega nowa metoda ataku AudioHijack.
- Dlaczego technika ta jest groźniejsza od tradycyjnych cyberataków.
- Na ile obecne mechanizmy obronne są skuteczne wobec nowego wektora ataków na sztuczną inteligencję.
Dynamiczny rozwój sztucznej inteligencji szybko zwiększa paletę cyfrowych zagrożeń, wprowadzając zupełnie nowe ryzyka, na które dotąd nie byliśmy przygotowani. Jedną z najnowszych podatności ujawniono na ostatnim prestiżowym IEEE Symposium on Security and Privacy w San Francisco. Podczas wydarzenia zespół naukowców z Uniwersytetu Zhejiang, Narodowego Uniwersytetu Singapuru oraz Nanyang Technological University zaprezentował badania, które pokazują, że modele głosowej AI stają się niespodziewanie jednym z wektorów ataków. Chodzi o technikę, którą nazwano AudioHijack, a w dużym skrócie pozwala na osadzanie wrogich instrukcji w zwykłych plikach multimedialnych – piosenkach, filmach czy audycjach internetowych.
Nowa era cyfrowego sabotażu
Kluczowym elementem zagrożenia jest fakt, że ludzkie ucho nie jest w stanie zarejestrować tzw. złośliwych częstotliwości, natomiast duże modele audio-językowe wychwytują je bezbłędnie. Co gorsza, przygotowanie takiego cyberataku jest wręcz banalnie proste. Jak wyjaśniał Meng Chen, główny autor badania i doktorant na Uniwersytecie Zhejiang, „wytrenowanie” sygnału zajmuje zaledwie pół godziny, a – ponieważ jest on całkowicie niezależny od kontekstu – można go wykorzystać do ataku na dany model w dowolnym momencie, niezależnie od tego, co akurat mówi użytkownik.
Czytaj więcej
Rosnąca moc sztucznej inteligencji i rozwój komputerów kwantowych zmuszają firmy do szukania nowych metod ochrony danych. Western Digital zaprezent...
Tradycyjne cyberataki na systemy rozpoznawania mowy ograniczały się do prostych komend tekstowych. AudioHijack idzie o krok dalej, bo uderza w warstwy rozumowania zaawansowanych modeli językowych, które posiadają autonomię działania: mogą przeszukiwać internet, modyfikować kalendarze, pobierać zainfekowane pliki czy wysyłać e-maile zawierające wrażliwe dane użytkownika.
Badacze przetestowali nową metodę na 13 otwartoźródłowych modelach sztucznej inteligencji przetwarzających dźwięk (w tym Qwen2-Audio, GLM-4-Voice, Phi-4-Multimodal oraz Kimi-Audio). Wyniki okazały się zatrważające: skuteczność wstrzykiwania złośliwych instrukcji wyniosła od 79 do nawet 96 proc. Choć technika wymagała początkowo znajomości pełnej struktury (wag) modeli open-source, eksperymenty wykazały, że ataki te bezproblemowo przenoszą się na komercyjne, zamknięte systemy gigantów technologicznych, takich jak Microsoft Azure czy Mistral AI.
Czytaj więcej
Autonomiczne agenty sztucznej inteligencji potrafią omijać zabezpieczenia, ujawniać poufne dane, manipulować innymi systemami AI oraz działać na sz...
Algorytmy okazują się bezbronne
Najbardziej niepokojący jest fakt, że – jak twierdzą badacze – współczesne mechanizmy obronne są w tym starciu bezużyteczne. Popularne techniki, takie jak wzmacnianie promptów (prompt hardening) czy wieloetapowa weryfikacja intencji użytkownika, obniżyły skuteczność ataków zaledwie o ok. 7 proc. Specjaliści twierdzą, iż algorytmy sztucznej inteligencji po prostu nie potrafią odróżnić autentycznej woli siedzącego przed ekranem człowieka od ukrytego w tle „szumu”. Ukrycie „złośliwego polecenia” w podcastach czy filmach na YouTube może więc narobić wielu problemów nieświadomym użytkownikom AI. Szczególnie niebezpieczne może być to w biznesie. Eksperci mówią wprost, że wdrażanie asystentów głosowych o szerokich uprawnieniach w systemach korporacyjnych rodzi fundamentalne ryzyko. Czy kanał audio stanie się więc nową formą cyberataku? Eksperci ds. cyberbezpieczeństwa ostrzegają, że ryzyko jest potężne i – dopóki architektura modeli nie zostanie zmieniona – podłączanie wrażliwych baz danych pod komendy głosowe AI to zagrożenie tożsame z zostawianiem otwartych drzwi do domu.