ElevenLabs wyrobił sobie już globalną markę – dzięki jego technologii generowania mowy za pomocą sztucznej inteligencji, można tworzyć dubbing do filmów, asystentów głosowych i awatary, czy tzw. nagrania deepfake. Za pomocą sztucznej inteligencji polskiej firmy można sklonować bowiem dowolny głos i sprawić, że przemówi w różnych językach i wypowie dowolne kwestie. Ów przełomowy projekt stworzyli Piotr Dąbkowski, absolwent uniwersytetów Oxford i Cambridge, a także Mateusz Staniszewski, który ukończył wydział matematyki w Imperial College London.
Potężni inwestorzy na pokładzie
Teraz w ten najbardziej rozpoznawalny polski startup w branży sztucznej inteligencji zainwestowali giganci z Doliny Krzemowej. Do spółki, która swoją platformę uruchomiła ledwie w styczniu br., popłynęło właśnie 19 mln dol. Finansowanie w rundzie A zapewnili m.in. Nat Friedman (były szef GitHuba, obecnie doradca w Midjourney), Daniel Gross (twórca firmy Cue, którą dekadę temu przejął Apple) oraz Andreessen Horowitz, założyciel jednego z największych funduszy VC (jednocześnie zapewnił on sobie miejsce w zarządzie spółki). Wśród aniołów biznesu, którzy wsparli ElevenLabs są także np. współtwórca Instagrama Mike Krieger, jeden z założyciel Oculus VR Brendan Iribe, a także Mustafa Suleyman, guru branży AI i współzałożyciel Deepmind (startup przejęty przez Google). Do rundy dołączyły ponadto Storytel (szwedzka platforma strumieniowania audiobooków) i TheSoul Publishing (firma specjalizująca się w produkcji filmów poprzez media internetowe: YouTube, Facebook, czy TikTok).
Czytaj więcej
Jack Krawczyk, Szymon Sidor, Wojciech Zaremba, Łukasz Kaiser i Jakub Pachocki – te nazwiska warto zapamiętać. To nasi rodacy prowadzą świat ku rewolucji AI.
Boom na generatywną AI
Platforma AI ElevenLabs w ciągu kilku miesięcy przyciągnęła już ponad milion zarejestrowanych użytkowników z branży kreatywnej, rozrywkowej i wydawniczej. Jej narzędzia mogą zamienić dowolny tekst w mowę za pomocą syntetycznych głosów, sklonowanych głosów lub tworząc całkowicie nowe sztuczne głosy, które można dostosować do płci, wieku i preferencji dotyczących akcentu. Dzięki swoim badaniom firma ElevenLabs była w stanie osiągnąć nowy poziom jakości mowy, który jest prawie nie do odróżnienia od prawdziwego człowieka z opóźnieniem poniżej 1 sekundy. Platforma została już przyjęta w wielu branżach i sektorach kreatywnych – od niezależnych autorów tworzących audiobooki, programistów podkładających głos postaciom w grach wideo, wspierających osoby niedowidzące w dostępie do treści pisanych online i zasilających pierwszy na świecie kanał radiowy oparty na sztucznej inteligencji. ElevenLabs nawiązało również szereg partnerstw, m.in. ze Storytel, TheSoul Publishing oraz platformą medialną MNTN.
Nowa era dubbingu
Teraz polski startup wprowadza na rynek nowe produkty. Pierwszy umożliwi każdemu stworzenie całego audiobooka zaledwie w ciągu kilku minut, drugi to model wykrywania mowy AI. Jak tłumaczą w firmie, jeszcze w br. wydane ma zostać narzędzie do dubbingu AI, które umożliwi kopiowanie dowolnego filmu na wybrany język przy jednoczesnym zachowaniu głosu oryginalnego mówcy. Firma przeprowadza już szereg testów z partnerami branżowymi.