To koniec nauczania języków? Tłumacze AI przełomem, z każdego zrobią poliglotę

Systemy AI potrafią dziś już – w czasie rzeczywistym – tłumaczyć, podkładać sklonowany głos i generować obraz tak, by ruch ust wyglądał możliwie naturalnie. Niebawem łatwe będzie porozumiewanie się bez znajomości języków obcych.

Publikacja: 03.10.2023 07:56

Globalny rynek tłumaczy AI rośnie w tempie 20 proc. rocznie. Jak prognozują analitycy Acumen Researc

Globalny rynek tłumaczy AI rośnie w tempie 20 proc. rocznie. Jak prognozują analitycy Acumen Research, wartość takich usług do roku 2030 wzrośnie (z 812 mld dol. w 2021 r.) do ok. 4,1 mld dol.

Foto: shutterstock

AWFull (z ang. awfull – okropny) – tak o wizji przekładu obcych języków za pomocą sztucznej inteligencji oraz systemów translacyjnych mówią sami tłumacze. AWFull to akronim od sformułowania „AlWays Full Automation” (zawsze pełna automatyka). To dobitnie pokazuje, że perspektywa wykorzystania automatycznych technologii tłumaczących dla przedstawicieli tej branży stanowi ponurą wizję przyszłości. Dziś tłumaczenie artykułów, dokumentów czy e-maili na dowolny język nie jest już dla nikogo problemem – wystarczy kilka kliknięć myszką w komputerzy czy ruchów palcem na ekranie smartfona. Ale teraz za sprawą dynamicznego rozwoju botów konwersacyjnych ta rewolucja idzie jeszcze dalej. Tłumaczenie naszej mowy w wersji audio, i to w czasie rzeczywistym, przestaje być wyzwaniem. Giganci sektora nowych technologii udostępniają kolejne narzędzia AI, które zapewne w nieodległej perspektywie pozbawią pracy tłumaczy symultanicznych i sprawią, że każdy z nas – w pewnym sensie – stanie się poliglotą. Znajomość języka przestanie być bowiem jakąkolwiek barierą w komunikacji.

Klonowanie głosów

5 października w kalifornijskim kampusie Monterey Institute of International Studies dojdzie do zjazdu Międzynarodowej Federacji Tłumaczy w Ameryce Północnej. Uczestnicy będą debatować o branży i największych jej wyzwaniach. Nic dziwnego, że wiodącym tematem będzie generatywna sztuczna inteligencja. Systemy AI przez kolejne branże przechodzą niczym tornado, a właśnie na rynku „ludzkich” tłumaczy mogą zrobić największe spustoszenie. O skali tego problemu mogą świadczyć statystyki: internauci korzystający z Google Translate tłumaczą ponad 100 mld słów dziennie. Tłumacze „ludzcy” przekładają ich dwa razy więcej – ale rocznie. Eksperci podkreślają, że AI nie jest jeszcze doskonała i przed nami długa droga, aby zapewnić wolne od błędów tłumaczenia maszynowe (MT), ale trend został już wyznaczony. Z pewnością na korzyść algorytmów przemawiają powszechny dostęp do e-tłumaczy oraz wygoda z ich korzystania. Nie bez znaczenia są też koszty tej technologii. Szacuje się, że średni koszt MT dla pojedynczego słowa to 0,10 dol. Tłumaczenie z udziałem człowieka to zaś 0,22 dol. Kalkulacja jest więc prosta.

Czytaj więcej

„Zabójca smartfonów” wchodzi do sprzedaży. Ekran na dłoni i sztuczna inteligencja

Za zaawansowane systemy translacyjne wzięli się najwięksi gracze: od Google i IBM, przez Microsoft oraz Amazon, po chińskich potentatów – Baidu, Alibabę czy Tencent. Przełom w tłumaczeniu AI właśnie się dokonuje. Wystarczy wspomnieć o projekcie rozwijanym przez Spotify, który ma klonować głos autorów podcastu, aby potem emitować dowolnie wypowiadane kwestie w niemal każdym języku. Pilotaż nowatorskiej funkcji właśnie ruszył. Za innowacją stoi technologia od OpenAI, a więc firmy, która stworzyła popularnego bota ChatGPT. – Dopasowując się do głosu twórcy, funkcja Voice Translation daje słuchaczom na całym świecie możliwość odkrywania nowych podcastów i inspirowania się nimi w sposób bardziej autentyczny niż kiedykolwiek wcześniej – komentuje Ziad Sultan, wiceprezes Spotify.

Klonowanie głosu to tylko jedna z niesamowitych możliwości. Firmy – jak np. izraelska spółka Kudo – pracują również nad edycją obrazu wideo na żywo w taki sposób, aby osoby biorące udział w telekonferencji mogły się wypowiadać w czasie niemal rzeczywistym (opóźnienie sięga kilku sekund) w dowolnie wybranym języku. Systemy AI w tym wypadku nie tylko tłumaczą, ale również podkładają sklonowany głos i generują obraz tak, by ruch ust wyglądał możliwie naturalnie.

Imponująco wygląda też projekt tokijskiego start-upu Pocketalk, który stworzył urządzenie wielkości małego smartfona, umożliwiające natychmiastową rozmowę w jednym z ok. 90 języków. Opracowany przez Japończyków tłumacz już przykuł uwagę inwestorów, a firma szykuje się do debiutu na nowojorskiej giełdzie, przy imponującej wycenie sięgającej 1 mld dol.

Odbudowa wieży Babel

Księga Rodzaju opisuje ogromną budowlę, którą wznoszono, by lud nie rozpraszał się po Ziemi. To wieża Babel, w trakcie budowy której Jahwe pomieszał języki budowniczym tak, że jeden nie rozumiał drugiego. W efekcie plan konstrukcji runął w gruzach, a boska ingerencja sprawiła, iż ludzie rozeszli się po świecie, mówiąc różnymi językami. Czy teraz projekty jak ten Spotify, Kudo czy Pocketalk odbudują mityczną wieżę Babel? Zadanie – wbrew pozorom – nie będzie łatwe. Technologie tłumaczy AI wciąż natrafiają na wiele raf. Jedną z nich są oskarżenia o stronniczość. Boryka się z tym choćby Meta i jej system SeamlessM4T, który w tłumaczeniach nadreprezentuje formę męską. Podobne kłopoty ma Google Translate (algorytmy wychodzą w niektórych językach z założenia, że lekarze to mężczyźni, a pielęgniarki to kobiety) czy Bing. Inne modele mają też problem z prawidłową transkrypcją osób czarnoskórych. Przyszłość osób pracujących w charakterze tłumaczy nie musi być więc w ciemnych barwach. Specjalizująca się w tłumaczeniach izraelska firma Blend zwraca uwagę, że – choć oprogramowanie AI rozwija się w szybkim tempie – wciąż sztuczna inteligencja nie jest w stanie zapewnić całkowicie wiarygodnych wyników. „Oznacza to, że istnieje ciągłe zapotrzebowanie na korektorów i redaktorów przetłumaczonych tekstów” – zauważa.

Zresztą Blend, choć rozwija usługi w oparciu o tłumaczy AI, współpracuje z tysiącami lingwistów na całym świecie.

AWFull (z ang. awfull – okropny) – tak o wizji przekładu obcych języków za pomocą sztucznej inteligencji oraz systemów translacyjnych mówią sami tłumacze. AWFull to akronim od sformułowania „AlWays Full Automation” (zawsze pełna automatyka). To dobitnie pokazuje, że perspektywa wykorzystania automatycznych technologii tłumaczących dla przedstawicieli tej branży stanowi ponurą wizję przyszłości. Dziś tłumaczenie artykułów, dokumentów czy e-maili na dowolny język nie jest już dla nikogo problemem – wystarczy kilka kliknięć myszką w komputerzy czy ruchów palcem na ekranie smartfona. Ale teraz za sprawą dynamicznego rozwoju botów konwersacyjnych ta rewolucja idzie jeszcze dalej. Tłumaczenie naszej mowy w wersji audio, i to w czasie rzeczywistym, przestaje być wyzwaniem. Giganci sektora nowych technologii udostępniają kolejne narzędzia AI, które zapewne w nieodległej perspektywie pozbawią pracy tłumaczy symultanicznych i sprawią, że każdy z nas – w pewnym sensie – stanie się poliglotą. Znajomość języka przestanie być bowiem jakąkolwiek barierą w komunikacji.

Pozostało 82% artykułu
2 / 3
artykułów
Czytaj dalej. Subskrybuj
Technologie
Mają dość przekręcania swoich nazwisk. Podjęli radykalne działania
Technologie
Samouczące się protezy z AI pomagają ukraińskim żołnierzom. Mogą wrócić na front
Technologie
Afera wokół ChatGPT. Scarlett Johansson oskarża firmę o kradzież głosu
Technologie
Blisko przełomu. Sztuczna inteligencja zyskuje umiejętność abstrakcyjnego myślenia
Technologie
Współtwórca ChatGPT oskarża firmę. „AI jest mądrzejsza od nas”