Większość stosowanych dziś generatywnych systemów AI opiera się o najbardziej popularne języki – zdecydowanie lepiej rozumieją więc kontekst mowy i niuanse takich języków jak angielski, czy chiński. A to – jak uważają założyciele start-upu Silo AI – zagrożenie dla „suwerenności językowej” w przypadku wielu mniej popularnych języków i dialektów.
Viking ochroni języki przed sztuczną inteligencją
Fińska firma, która reklamuje się jako największe na Starym Kontynencie prywatne laboratorium sztucznej inteligencji, chce stanąć w ich obronie, bo uważa, że liczne chatboty dyskryminują lokalną mowę. Spółka uruchamia więc projekt Viking, w ramach którego udostępni własny model – Nordic LLM, przeznaczony właśnie dla rodziny języków europejskich. Ów projekt, mający za zadanie chronić różnorodność językową, na razie skupi się na językach nordyckich, integrując ze swoim chatbotem: duński, fiński, islandzki, norweski oraz szwedzki. Peter Sarlin, współzałożyciel Silo AI, tłumaczy, że projekt Viking skupi się na uwzględnieniu niuansów tych języków, ale też odzwierciedleniu wartości i kultury nordyckiej. Wyzwanie jest dość trudne, bo wszystkie te języki charakteryzują tzw. niskie zasoby. To oznacza, że brakuje danych językowych potrzebnych do szkolenia wysokowydajnych LLM.
Czytaj więcej
Tym razem wpadka Mety, właściciela Facebooka i Instagrama. AI koncernu ma wyraźne trudności w tworzeniu obrazów par lub przyjaciół o różnym pochodzeniu rasowym, dyskryminując białych. Wcześniej „problemy z rasizmem" miała sztuczna inteligencja Google.
Według ekspertów to wielkie wyzwanie w świecie chatbotów. Rozwój technologii LLM zagraża bowiem przyszłości takich języków w świecie cyfrowym. W dalszej kolejności, brak prawidłowego tłumaczenia maszynowego może pozbawić lokalne społeczności do dostępu usług (np. spersonalizowanej opieki medycznej, czy nowoczesnej edukacji), a w efekcie prowadzić do wymierania takich języków. Silo AI ruszyło właśnie ze swoim przedsięwzięciem, by – w miarę jak sztuczna inteligencja rozprzestrzenia się, a różnorodność językowa i dziedzictwo kulturowe mogą zanikać – postawić tamę takim czarnym scenariuszom.
Jak chronić język polski
Silo AI podkreśla, iż Nordic LLM charakteryzuje się „niezrównaną biegłością” w językach nordyckich, ale przy tym nie zaniedbuje jęz. angielskiego. Testy mają wskazywać, iż wyniki w tym zakresie są porównywalne z innymi otwartymi modelami, jak Mistral, czy Llama (Meta).