W polski start-up od sztucznej inteligencji zainwestowali giganci Doliny Krzemowej

Rodzima firma ElevenLabs dostała właśnie od inwestorów 19 mln dol. na badania nad swoim inteligentnym systemem generowania mowy, nie do odróżnienia od mowy prawdziwego człowieka. Polaków wesprą znane nazwiska z branży nowych technologii.

Publikacja: 20.06.2023 10:59

Platforma AI ElevenLabs w ciągu kilku miesięcy przyciągnęła już ponad milion zarejestrowanych użytko

Platforma AI ElevenLabs w ciągu kilku miesięcy przyciągnęła już ponad milion zarejestrowanych użytkowników z branży kreatywnej, rozrywkowej i wydawniczej

Foto: AdobeStock

ElevenLabs wyrobił sobie już globalną markę – dzięki jego technologii generowania mowy za pomocą sztucznej inteligencji, można tworzyć dubbing do filmów, asystentów głosowych i awatary, czy tzw. nagrania deepfake. Za pomocą sztucznej inteligencji polskiej firmy można sklonować bowiem dowolny głos i sprawić, że przemówi w różnych językach i wypowie dowolne kwestie. Ów przełomowy projekt stworzyli Piotr Dąbkowski, absolwent uniwersytetów Oxford i Cambridge, a także Mateusz Staniszewski, który ukończył wydział matematyki w Imperial College London.

Potężni inwestorzy na pokładzie

Teraz w ten najbardziej rozpoznawalny polski startup w branży sztucznej inteligencji zainwestowali giganci z Doliny Krzemowej. Do spółki, która swoją platformę uruchomiła ledwie w styczniu br., popłynęło właśnie 19 mln dol. Finansowanie w rundzie A zapewnili m.in. Nat Friedman (były szef GitHuba, obecnie doradca w Midjourney), Daniel Gross (twórca firmy Cue, którą dekadę temu przejął Apple) oraz Andreessen Horowitz, założyciel jednego z największych funduszy VC (jednocześnie zapewnił on sobie miejsce w zarządzie spółki). Wśród aniołów biznesu, którzy wsparli ElevenLabs są także np. współtwórca Instagrama Mike Krieger, jeden z założyciel Oculus VR Brendan Iribe, a także Mustafa Suleyman, guru branży AI i współzałożyciel Deepmind (startup przejęty przez Google). Do rundy dołączyły ponadto Storytel (szwedzka platforma strumieniowania audiobooków) i TheSoul Publishing (firma specjalizująca się w produkcji filmów poprzez media internetowe: YouTube, Facebook, czy TikTok).

Czytaj więcej

Sztuczna inteligencja ma polskie DNA. Ci Polacy odgrywają kluczową rolę

Boom na generatywną AI

Platforma AI ElevenLabs w ciągu kilku miesięcy przyciągnęła już ponad milion zarejestrowanych użytkowników z branży kreatywnej, rozrywkowej i wydawniczej. Jej narzędzia mogą zamienić dowolny tekst w mowę za pomocą syntetycznych głosów, sklonowanych głosów lub tworząc całkowicie nowe sztuczne głosy, które można dostosować do płci, wieku i preferencji dotyczących akcentu. Dzięki swoim badaniom firma ElevenLabs była w stanie osiągnąć nowy poziom jakości mowy, który jest prawie nie do odróżnienia od prawdziwego człowieka z opóźnieniem poniżej 1 sekundy. Platforma została już przyjęta w wielu branżach i sektorach kreatywnych – od niezależnych autorów tworzących audiobooki, programistów podkładających głos postaciom w grach wideo, wspierających osoby niedowidzące w dostępie do treści pisanych online i zasilających pierwszy na świecie kanał radiowy oparty na sztucznej inteligencji. ElevenLabs nawiązało również szereg partnerstw, m.in. ze Storytel, TheSoul Publishing oraz platformą medialną MNTN.

Nowa era dubbingu

Teraz polski startup wprowadza na rynek nowe produkty. Pierwszy umożliwi każdemu stworzenie całego audiobooka zaledwie w ciągu kilku minut, drugi to model wykrywania mowy AI. Jak tłumaczą w firmie, jeszcze w br. wydane ma zostać narzędzie do dubbingu AI, które umożliwi kopiowanie dowolnego filmu na wybrany język przy jednoczesnym zachowaniu głosu oryginalnego mówcy. Firma przeprowadza już szereg testów z partnerami branżowymi.

ElevenLabs pozyskane od inwestorów pieniądze chce przeznaczyć na badania nad sztuczną inteligencją głosową. – W ciągu ostatnich pięciu miesięcy widzieliśmy jak nasza technologia została przyjęta przez miliony twórców, firm i ciekawskich umysłów. Jesteśmy na samym początku tej podróży – mówi Mateusz Staniszewski, prezes ElevenLabs, który wcześniej pracował m.in. dla Black Rock, czy Palantira.

Czas na przejrzystość

Piotr Dąbkowski, drugi z założycieli spółki (wcześniej pracował w Google), nie ukrywa, że celem start-upu jest całkowite przełamanie barier językowych za pomocą technologii. Platforma już dziś sprawnie zamienia tekst na mowę, wykorzystując wcześniej istniejące tzw. głosy syntetyczne, ale także umożliwia tworzenie unikalnego głosu lub cyfrowej wersji istniejącego (klonowanie). Z rozwiązań ElevenLabs można korzystać w wielu językach. Jednym z najnowszych rozwiązań firmy jest AI Speech Classifier – narzędzie, które pozwoli każdemu przesłać próbkę audio i dowiedzieć się, czy klip zawiera dźwięk wygenerowany przez sztuczną inteligencję od ElevenLabs. Produkt ten ma być krokiem ku przejrzystości i elementem budowy bezpiecznego środowiska mediów generatywnych.

ElevenLabs wyrobił sobie już globalną markę – dzięki jego technologii generowania mowy za pomocą sztucznej inteligencji, można tworzyć dubbing do filmów, asystentów głosowych i awatary, czy tzw. nagrania deepfake. Za pomocą sztucznej inteligencji polskiej firmy można sklonować bowiem dowolny głos i sprawić, że przemówi w różnych językach i wypowie dowolne kwestie. Ów przełomowy projekt stworzyli Piotr Dąbkowski, absolwent uniwersytetów Oxford i Cambridge, a także Mateusz Staniszewski, który ukończył wydział matematyki w Imperial College London.

Pozostało 88% artykułu
2 / 3
artykułów
Czytaj dalej. Subskrybuj
Materiał partnera
Cyberbezpieczeństwo w nowym wydaniu
Biznes Ludzie Startupy
Polska firma rozpycha się rynku podróży. Wchodzi do kolejnych krajów
Biznes Ludzie Startupy
Samuraj ruszył na ratunek samobójcom. Polska AI chroni Amerykanów
Biznes Ludzie Startupy
Przełomowy pomysł Szwajcarów. Auta z tkaniny mają być lżejsze i ograniczyć emisję
Biznes Ludzie Startupy
Meble z konopi. Polacy stworzyli alternatywę dla wycinki drzew
Materiał Promocyjny
Technologia na etacie. Jak zbudować efektywny HR i skutecznie zarządzać kapitałem ludzkim?