Reklama

Można spreparować wypowiedź dowolnej osoby. OpenAI przyznało, że testuje Voice Engine

Firma OpenAI, twórca popularnego bota ChatGPT, zaprezentowała Voice Engine, nowe narzędzie AI, które potrafi wygenerować głos każdego i to w różnych językach. Budzi to obawy związane z wykorzystaniem do dezinformacji i innych form nadużyć.
Sztuczna inteligencja jest w stanie wygenerować głos każdej osoby na podstawie 15-sek. próbki

Sztuczna inteligencja. Asystentka

Sztuczna inteligencja jest w stanie wygenerować głos każdej osoby na podstawie 15-sek. próbki

Foto: Adobe Stock

OpenAI udostępniło próbki z wczesnych testów narzędzia o nazwie Voice Engine, które wykorzystuje 15-sekundową próbkę mówiącej osoby w celu wygenerowania wiernej repliki jej głosu. Firma twierdzi, że narzędzie do zamiany tekstu na głos wykorzystujące AI może pomóc w tłumaczeniu, pomaganiu dzieciom w czytaniu lub pomaganiu osobom, które utraciły zdolność mówienia. Niektórzy sceptycy obawiają się jednak, że może to również sprzyjać tworzeniu się dezinformacji lub ułatwiać popełnianie oszustw.

Jak wygenerować czyjś głos

Voice Engine jest obecnie używany tylko przez „małą grupę zaufanych partnerów”, w tym firmy z branży edukacyjnej i zajmującej się technologiami medycznymi, i na podstawie ich testów OpenAI określi, czy i w jaki sposób umożliwić jego szersze wykorzystanie. Według firmy testerzy zgodzili się nie odtwarzać głosów ludzi bez ich wyraźnej zgody i wyraźnie informować słuchaczy, że to, co słyszą, jest generowane przez sztuczną inteligencję. „Wiemy, że generowanie mowy przypominającej głosy ludzi wiąże się z poważnym ryzykiem, o którym szczególnie warto pamiętać w roku wyborczym” – stwierdziła firma OpenAI w poście na swoim blogu.

Czytaj więcej

Sztuczna inteligencja przerobi każdą książkę na bestseller i hit filmowy. Ma sposób

Voice Engine może wykorzystać próbkę głosu w jednym języku, aby utworzyć replikę głosu także w wielu innych językach. Firma zaprezentowała na blogu materiał przedstawiający człowieka czytającego fragment o przyjaźni, a także dźwięk wygenerowany przez sztuczną inteligencję, który brzmi tak, jakby ta sama osoba czytała ten sam fragment w języku hiszpańskim, mandaryńskim, niemieckim, francuskim i japońskim. W każdej z próbek wygenerowanych przez sztuczną inteligencję zostaje zachowany ton i akcent oryginalnego mówcy.

Wkrótce pojawi się Sora

Voice Engine pojawia się w czasie, gdy użytkownicy czekają na publiczne wydanie Sora, narzędzia wideo generowanego przez sztuczną inteligencję, które OpenAI zapowiadało w zeszłym miesiącu. Sora może tworzyć realistycznie wyglądające 60-sekundowe filmy na podstawie instrukcji tekstowych, z możliwością wyświetlania scen z wieloma postaciami, określonymi rodzajami ruchu i wyszukanymi szczegółami tła. ChatGPT OpenAI może również generować obrazy z podpowiedzi tekstowej.

Reklama
Reklama

Czytaj więcej

Przełomowe narzędzie sztucznej inteligencji od OpenAI. Opisz, a Sora zrobi film
Technologie
Dlaczego robocie masz takie wielkie oczy? Jest ważny powód
Materiał Promocyjny
Nowy luksus zaczyna się od rozmowy. Byliśmy w showroomie EXLANTIX w Warszawie
Materiał Promocyjny
Rekordy sprzedaży i większy magazyn w Duchnicach
Technologie
„Dzień zero” coraz bliżej. Komputery kwantowe mogą złamać dzisiejsze szyfry
Materiał Promocyjny
Rozwiązania AI dla firm są coraz ważniejsze – agentowa sztuczna inteligencja staje się priorytetem dla dyrektorów IT
Materiał Promocyjny
Arabia Saudyjska. W krainie gościnności
Technologie
Ten mikroreaktor jądrowy zwiastuje rewolucję. Da się go przewieźć samolotem
Materiał Promocyjny
Dove Self-Esteem: Wsparcie dla nastolatków
Reklama
Reklama
REKLAMA: automatycznie wyświetlimy artykuł za 15 sekund.
Reklama