Klonowanie głosu to nic innego jak generowana przez program komputerowy syntetyczna jego kopia. Z nagrania dowolnej mówiącej osoby AI jest w stanie odtworzyć jej głos, ale wypowiadający dowolne słowa lub zdania. Inwencja zależy od tego, co użytkownik takiego oprogramowania wpisze na klawiaturze komputera. Dźwięk jest tak dokładny, że – jak podaje BBC – znany lektor i aktor Tim Heller, który podkłada głos w filmach animowanych, audiobookach, czy grach wideo, oniemiał, gdy usłyszał AI mówiącą jego głosem.
CZYTAJ TAKŻE: Kiedy aktor umiera, zastępuje go sztuczna inteligencja
Sztuczna inteligencja nasłuchując próbek głosu wybranej osoby (wystarczy 10-minutowe nagranie) może wykryć nie tylko akcent, barwę i ton, ale również tempo, płynność wypowiadanych zdań, a nawet charakterystyczne przerwy na oddech. Sfałszowany głos nie dość, że może wypowiedzieć dowolną kwestię, to AI jest w stanie przedstawić w ten sposób każdą pożądaną emocję – od gniewu, przez szczęście, czy znudzenie, po strach.
Z oprogramowania w przyszłości chcą korzystać aktorzy. Heller już zapowiedział, że dzięki AI mógłby podjąć więcej lektorskich zleceń i wysłać do pracy jedynie swój syntetyczny głos. Jak informuje BBC, aktor zdecydował się już na sklonowanie głosu, w tym celu udał się do firmy VocaliD, bostońskiego startupu założonego przez prof. Rupala Patela z Northeastern University (wcześniej prowadził on prace kliniczne nad tworzeniem sztucznego głosu dla pacjentów, którzy utracili zdolność mowy na skutek operacji, chorób i wypadków).
Tą technologią zainteresowały się również wytwórnie filmowe. Głos anglojęzycznego aktora mógłby być wykorzystywany bowiem w zagranicznych kopiach, bez konieczności dubbingu. Kanadyjska firma Resemble AI już twierdzi, że może teraz przekształcić sklonowane angielskie głosy na 15 innych języków.