To rozwiązanie pozwoli wypowiedzieć AI dowolną kwestię głosem wybranej osoby. To niebezpieczne narzędzie, otwiera bowiem furtkę do dezinformacji i tworzenia tzw. fake news’ów.
Firnansowana przez Microsoft firma OpenAI na razie nie udostępnia publicznie swojego rozwiązania. Technologia o nazwie VALL-E dowodzi, że sztuczna inteligencja ma coraz większe umiejętności, bo jest w stanie nie tylko z nami konwersować pisemnie, ale tworzyć obrazy (model DALL-E 2) i naśladować ludzki głos. VALL-E wystarczą ledwie 3 sekundy, aby nauczyć się sposobu wymowy charakterystycznej dla danej osoby. Po wysłuchaniu krótkiej próbki nagrania AI w podobnym tonie, z realistyczną intonacją i emocjami, odtworzy ów głos, zamieniając przy tym pisane przez użytkownika frazy na mowę. Model został przeszkolony na 60 tys. godzin nagrań mowy w języku angielskim. Naukowcy z Cornell University wskazują, że algorytm ćwiczono na próbkach głosu pochodzących od ponad 7 tys. osób.