Można spreparować wypowiedź dowolnej osoby. OpenAI przyznało, że testuje Voice Engine

Firma OpenAI, twórca popularnego bota ChatGPT, zaprezentowała Voice Engine, nowe narzędzie AI, które potrafi wygenerować głos każdego i to w różnych językach. Budzi to obawy związane z wykorzystaniem do dezinformacji i innych form nadużyć.

Publikacja: 02.04.2024 16:18

Sztuczna inteligencja jest w stanie wygenerować głos każdej osoby na podstawie 15-sek. próbki

Sztuczna inteligencja jest w stanie wygenerować głos każdej osoby na podstawie 15-sek. próbki

Foto: Adobe Stock

OpenAI udostępniło próbki z wczesnych testów narzędzia o nazwie Voice Engine, które wykorzystuje 15-sekundową próbkę mówiącej osoby w celu wygenerowania wiernej repliki jej głosu. Firma twierdzi, że narzędzie do zamiany tekstu na głos wykorzystujące AI może pomóc w tłumaczeniu, pomaganiu dzieciom w czytaniu lub pomaganiu osobom, które utraciły zdolność mówienia. Niektórzy sceptycy obawiają się jednak, że może to również sprzyjać tworzeniu się dezinformacji lub ułatwiać popełnianie oszustw.

Jak wygenerować czyjś głos

Voice Engine jest obecnie używany tylko przez „małą grupę zaufanych partnerów”, w tym firmy z branży edukacyjnej i zajmującej się technologiami medycznymi, i na podstawie ich testów OpenAI określi, czy i w jaki sposób umożliwić jego szersze wykorzystanie. Według firmy testerzy zgodzili się nie odtwarzać głosów ludzi bez ich wyraźnej zgody i wyraźnie informować słuchaczy, że to, co słyszą, jest generowane przez sztuczną inteligencję. „Wiemy, że generowanie mowy przypominającej głosy ludzi wiąże się z poważnym ryzykiem, o którym szczególnie warto pamiętać w roku wyborczym” – stwierdziła firma OpenAI w poście na swoim blogu.

Czytaj więcej

Sztuczna inteligencja przerobi każdą książkę na bestseller i hit filmowy. Ma sposób

Voice Engine może wykorzystać próbkę głosu w jednym języku, aby utworzyć replikę głosu także w wielu innych językach. Firma zaprezentowała na blogu materiał przedstawiający człowieka czytającego fragment o przyjaźni, a także dźwięk wygenerowany przez sztuczną inteligencję, który brzmi tak, jakby ta sama osoba czytała ten sam fragment w języku hiszpańskim, mandaryńskim, niemieckim, francuskim i japońskim. W każdej z próbek wygenerowanych przez sztuczną inteligencję zostaje zachowany ton i akcent oryginalnego mówcy.

Wkrótce pojawi się Sora

Voice Engine pojawia się w czasie, gdy użytkownicy czekają na publiczne wydanie Sora, narzędzia wideo generowanego przez sztuczną inteligencję, które OpenAI zapowiadało w zeszłym miesiącu. Sora może tworzyć realistycznie wyglądające 60-sekundowe filmy na podstawie instrukcji tekstowych, z możliwością wyświetlania scen z wieloma postaciami, określonymi rodzajami ruchu i wyszukanymi szczegółami tła. ChatGPT OpenAI może również generować obrazy z podpowiedzi tekstowej.

Czytaj więcej

Przełomowe narzędzie sztucznej inteligencji od OpenAI. Opisz, a Sora zrobi film

OpenAI udostępniło próbki z wczesnych testów narzędzia o nazwie Voice Engine, które wykorzystuje 15-sekundową próbkę mówiącej osoby w celu wygenerowania wiernej repliki jej głosu. Firma twierdzi, że narzędzie do zamiany tekstu na głos wykorzystujące AI może pomóc w tłumaczeniu, pomaganiu dzieciom w czytaniu lub pomaganiu osobom, które utraciły zdolność mówienia. Niektórzy sceptycy obawiają się jednak, że może to również sprzyjać tworzeniu się dezinformacji lub ułatwiać popełnianie oszustw.

Pozostało 82% artykułu
2 / 3
artykułów
Czytaj dalej. Subskrybuj
Technologie
Boty AI już w 2025 roku będą rozumieć i pracować jak ludzie. I mogą ich zastąpić
Technologie
Fałszywe oferty pracy to już plaga. Sztuczna inteligencja wspiera oszustów
Technologie
„Babcie supermodelki”. Naukowcy wynaleźli lek przedłużający życie aż o jedną czwartą
Technologie
Chcieli tworzyć historię i nadać AI prawa pracownicze. „Bunt” i klęska dużej firmy
Materiał Promocyjny
Mała Księgowość: sprawdzone rozwiązanie dla małych i średnich przedsiębiorców
Technologie
Powstały superbaterie przyszłości. Mają niezwykłe możliwości