Najwięcej wart polski start-up zyskuje następcę. Plany światowej ekspansji

Rodzimy start-up Revoize idzie śladem polskiego jednorożca ElevenLabs. Stworzył technologię, która w czasie rzeczywistym, eliminując szumy i zakłócenia, poprawia jakość rozmów online czy podcastów.

Publikacja: 26.05.2025 20:12

Revoize ma ambicję stać się wiodącą firmą w zakresie transformacji audio w czasie rzeczywistym. W sp

Revoize ma ambicję stać się wiodącą firmą w zakresie transformacji audio w czasie rzeczywistym. W spółce, w którą zainwestował współtwórca Snowflake’a, nie ukrywają, że plan zakłada, by stać się kolejnym jednorożcem z Polski w branży Speech AI

Foto: shutterstock

Na wykorzystaniu zaawansowanych systemów sztucznej inteligencji w branży audio swój globalny sukces zbudował polski jednorożec – ElevenLabs. W jego ślady idzie teraz Revoize. Start-up przekonuje, że pod względem pewnych parametrów jest już od niego lepszy. Twórcy technologii poprawiającej jakość mowy powołują się na wskaźnik techniczny MOS według normy ITU-T P.800 i przekonują, że stworzyli najlepsze na świecie rozwiązanie, „idąc łeb w łeb z Adobe Podcast Enhance v2, a przebijając ElevenLabs”.

Dla firmy Stanisława Raczyńskiego to ważny etap – spółka uruchomiła już aplikację do tzw. post-processingu, a teraz kończy negocjacje z dużym klientem, znanym producentem telefonów. Przy tym liczba subskrybentów aplikacji webowej Revoize przekroczyła już pułap 5 tys.

Kolejny jednorożec? Przerabianie dźwięku i obrazu polską specjalizacją

Stanisław Raczyński, który posiada 18 lat doświadczenia w sektorze badań i rozwoju, to ekspert w dziedzinie AI i przetwarzania mowy – pracował nad rozwojem technologii mowy w Intelu i Cisco, współtworzył Sayso.ai oraz brał udział w opracowaniu zaawansowanych systemów poprawy dźwięku w BabbleLabs (projekt został przejęty właśnie przez Cisco). Teraz rozwija technologię generatywnej AI, która poprawia jakość mowy w czasie rzeczywistym, eliminując szumy, zakłócenia i przywracając naturalną klarowność i głębię głosu. To ważne dla systemów wideokonferencji i rozwiązań służących do rozmów online, ale także podcastów czy nagrań multimedialnych. Raczyński, który posiada doktorat zdobyty na Uniwersytecie Tokijskim, twierdzi, że jego technologia „znacząco wykracza poza istniejące rozwiązania” redukcji szumów, dodatkowo rekonstruując uszkodzone fragmenty mowy i „poprawiając jakość nagrań i komunikacji głosowej w różnych scenariuszach zastosowań”. Revoize widzi przyszłość dla swojego rozwiązania zarówno w zastosowaniach konsumenckich, jak i w obszarze militarnym, gdzie może pomóc w komunikacji na polu walki, w trudnych warunkach akustycznych.\

Czytaj więcej

Polska AI wzbudziła kontrowersje i podbiła Amerykę. Firma z astronomiczną wartością

– Pomysł na biznes zrodził się z moich doświadczeń w BabbleLabs, a później w Cisco, gdzie pracowałem nad technologią czyszczenia mowy pierwszej generacji. Uważałem jednak, że generatywna AI ma o wiele większy potencjał na poprawę jakości – mówi nam Raczyńki. – Generatywna rekonstrukcja pozwala na pełne kondycjonowanie sygnału mowy, nie tylko proste usuwanie szumu tła, ale też poprawę barwy głosu, usunięcie pogłosu, artefaktów kodeków – zauważa założyciel Revoize.

Jego zdaniem da się w taki sposób osiągnąć jakość studyjną. – I nasza technologia już to oferuje – zapewnia. – Lubimy określenie „transformative AI”, które kontrastujemy z „generative AI”. Generatywna sztuczna inteligencja raczej zastępuje ludzi, a my wspieramy człowieka, rozszerzamy i uzupełniamy jego możliwości poprzez znoszenie barier w komunikacji głosowej – kontynuuje Stanisław Raczyński.

Jak wyjaśnia, jego rozwiązanie pozwala transformować nagranie lub sygnał mowy do dowolnej postaci, zmieniając jej pewne aspekty (np. jakość, barwę, głos mówcy, akcent), a zachowując inne (w szczególności treść wypowiedzi).

Czytaj więcej

Polak na liście najbardziej wpływowych osób w AI. Jego firma budzi kontrowersje

– Na świecie już teraz jest dużo narzędzi potrafiących poprawiać lub zmieniać wideo w czasie rzeczywistym, choć potencjał jest nadal mocno niewyeksplorowany, ale narzędzia dla mowy i muzyki w czasie rzeczywistym możemy policzyć już tylko na palcach jednej ręki – komentuje założyciel start-upu.

Revoize ma ambicję stać się wiodącą firmą w zakresie transformacji audio w czasie rzeczywistym. W spółce nie ukrywają przy tym, że plan zakłada, by stać się kolejnym jednorożcem z Polski w branży Speech AI.

Polski projekt skusił jednego z twórców Snowflake

– Revoize powstał w mojej głowie już trzy lata temu. Jako projekt zaczęliśmy nad nim pracować w październiku 2023 r. Wtedy był to wewnętrzny projekt w software house DAC.digital, który stał się naszym pierwszym inwestorem – wspomina Stanisław Raczyński. I dodaje, że spółka wydzielona została w wakacje ub.r. – Inkorporowaliśmy ją w USA i zamknęliśmy rundę pre-seed – tłumaczy.

Wśród udziałowców, poza założycielami, są wspomniany już DAC.digital, a także AIP Seed oraz anioł biznesu Marcin Żukowski, współzałożyciel Snowflake’a. Skusiła ich wizja zagospodarowania rynkowej niszy. Obszar „real-time transformative AI” dopiero bowiem się rozwija, a polska spółka już jest w jego awangardzie (choć musi bić się z takimi rywalami, jak np. Adobe Podcast Enhance czy Descript AI).

Rodzimy gracz osiągnął już kilka tzw. kamieni milowych, a kolejne cele ma na horyzoncie.

– Przeszliśmy przez rundę pre-seed, której celem było opracowanie prototypów technologii oraz opracowanie MVP produktu czasu rzeczywistego, co udało nam się osiągnąć. Zaczynamy również łapać pierwszą trakcję biznesową oraz spore zainteresowanie w wielu obszarach. Prowadzimy pilotażowe projekty z dużym producentem telefonów i słuchawek oraz z firmą z branży medialnej, która doceniła produkcyjną jakość naszej technologii dla swoich materiałów strumieniowanych na żywo w sieci. Prowadzimy rozmowy z firmami w branżach komunikacji głosowej, call center software, a także wojskowej komunikacji głosowej czy np. producentami sprzętu telekonferencyjnego i zestawów głośnomówiących w autach – wylicza Raczyński.

Na dalszą ekspansję firma potrzebuje jednak kolejnego zastrzyku pieniędzy. Start-up wskazuje, iż chce „wyskalować operacje” w zakresie produktu i sprzedaży. – Obecnie zbieramy rundę seed (z ang. zalążkową – red.) – przyznaje założyciel Revoize.

Wartość rynku oprogramowania do przetwarzania dźwięku opartego na AI w 2023 r. szacowano na 68 mld dol. Verified Market Research przewiduje, że do 2031 r. będzie to 126 mld dol.

Na wykorzystaniu zaawansowanych systemów sztucznej inteligencji w branży audio swój globalny sukces zbudował polski jednorożec – ElevenLabs. W jego ślady idzie teraz Revoize. Start-up przekonuje, że pod względem pewnych parametrów jest już od niego lepszy. Twórcy technologii poprawiającej jakość mowy powołują się na wskaźnik techniczny MOS według normy ITU-T P.800 i przekonują, że stworzyli najlepsze na świecie rozwiązanie, „idąc łeb w łeb z Adobe Podcast Enhance v2, a przebijając ElevenLabs”.

Pozostało jeszcze 92% artykułu
2 / 3
artykułów
Czytaj dalej. Subskrybuj
Biznes Ludzie Startupy
Latający skuter Polaka stał się hitem. Teraz pojawił się kolejny model
Biznes Ludzie Startupy
Digitalizacja musi wzmocnić ludzkie zespoły
Biznes Ludzie Startupy
Prosperująca firma w 90 dni. AI potrafi już niemal wszystko
Biznes Ludzie Startupy
Cyfryzacja zwiększa wydajność przemysłu
Materiał Promocyjny
Bank Pekao nagrodzony w konkursie The Drum Awards for Marketing EMEA za działania w Fortnite
Biznes Ludzie Startupy
„Zabójcy banków" wychodzą z internetu. Nowe, zaskakujące usługi