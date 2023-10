AWFull (z ang. awfull – okropny) – tak o wizji przekładu obcych języków za pomocą sztucznej inteligencji oraz systemów translacyjnych mówią sami tłumacze. AWFull to akronim od sformułowania „AlWays Full Automation” (zawsze pełna automatyka). To dobitnie pokazuje, że perspektywa wykorzystania automatycznych technologii tłumaczących dla przedstawicieli tej branży stanowi ponurą wizję przyszłości. Dziś tłumaczenie artykułów, dokumentów czy e-maili na dowolny język nie jest już dla nikogo problemem – wystarczy kilka kliknięć myszką w komputerzy czy ruchów palcem na ekranie smartfona. Ale teraz za sprawą dynamicznego rozwoju botów konwersacyjnych ta rewolucja idzie jeszcze dalej. Tłumaczenie naszej mowy w wersji audio, i to w czasie rzeczywistym, przestaje być wyzwaniem. Giganci sektora nowych technologii udostępniają kolejne narzędzia AI, które zapewne w nieodległej perspektywie pozbawią pracy tłumaczy symultanicznych i sprawią, że każdy z nas – w pewnym sensie – stanie się poliglotą. Znajomość języka przestanie być bowiem jakąkolwiek barierą w komunikacji.

Klonowanie głosów

5 października w kalifornijskim kampusie Monterey Institute of International Studies dojdzie do zjazdu Międzynarodowej Federacji Tłumaczy w Ameryce Północnej. Uczestnicy będą debatować o branży i największych jej wyzwaniach. Nic dziwnego, że wiodącym tematem będzie generatywna sztuczna inteligencja. Systemy AI przez kolejne branże przechodzą niczym tornado, a właśnie na rynku „ludzkich” tłumaczy mogą zrobić największe spustoszenie. O skali tego problemu mogą świadczyć statystyki: internauci korzystający z Google Translate tłumaczą ponad 100 mld słów dziennie. Tłumacze „ludzcy” przekładają ich dwa razy więcej – ale rocznie. Eksperci podkreślają, że AI nie jest jeszcze doskonała i przed nami długa droga, aby zapewnić wolne od błędów tłumaczenia maszynowe (MT), ale trend został już wyznaczony. Z pewnością na korzyść algorytmów przemawiają powszechny dostęp do e-tłumaczy oraz wygoda z ich korzystania. Nie bez znaczenia są też koszty tej technologii. Szacuje się, że średni koszt MT dla pojedynczego słowa to 0,10 dol. Tłumaczenie z udziałem człowieka to zaś 0,22 dol. Kalkulacja jest więc prosta.

Za zaawansowane systemy translacyjne wzięli się najwięksi gracze: od Google i IBM, przez Microsoft oraz Amazon, po chińskich potentatów – Baidu, Alibabę czy Tencent. Przełom w tłumaczeniu AI właśnie się dokonuje. Wystarczy wspomnieć o projekcie rozwijanym przez Spotify, który ma klonować głos autorów podcastu, aby potem emitować dowolnie wypowiadane kwestie w niemal każdym języku. Pilotaż nowatorskiej funkcji właśnie ruszył. Za innowacją stoi technologia od OpenAI, a więc firmy, która stworzyła popularnego bota ChatGPT. – Dopasowując się do głosu twórcy, funkcja Voice Translation daje słuchaczom na całym świecie możliwość odkrywania nowych podcastów i inspirowania się nimi w sposób bardziej autentyczny niż kiedykolwiek wcześniej – komentuje Ziad Sultan, wiceprezes Spotify.

Klonowanie głosu to tylko jedna z niesamowitych możliwości. Firmy – jak np. izraelska spółka Kudo – pracują również nad edycją obrazu wideo na żywo w taki sposób, aby osoby biorące udział w telekonferencji mogły się wypowiadać w czasie niemal rzeczywistym (opóźnienie sięga kilku sekund) w dowolnie wybranym języku. Systemy AI w tym wypadku nie tylko tłumaczą, ale również podkładają sklonowany głos i generują obraz tak, by ruch ust wyglądał możliwie naturalnie.