Największe chińskie firmy szkolą swoje modele sztucznej inteligencji za granicą, aby uzyskać dostęp do chipów Nvidii i ominąć amerykańskie próby zapobieżenia rozwojowi tej potężnej technologii – pisze „Financial Times”. Alibaba i ByteDance należą do grup technologicznych szkolących swoje najnowsze duże modele językowe (LLMs) w centrach danych w Azji Południowo-Wschodniej, jak poinformowały dwie osoby mające bezpośrednią wiedzę na ten temat. Stwierdziły, że nastąpił stały wzrost szkolenia modeli w lokalizacjach poza Chinami po tym, jak administracja Donalda Trumpa w kwietniu podjęła działania mające na celu ograniczenie sprzedaży chipa H20, półprzewodnika Nvidii przeznaczonego wyłącznie dla Chin.

Singapur i Malezja rosną na nowych centrach treningowych AI dla Chin

„To oczywisty wybór, żeby tu przyjechać” – powiedział jeden z operatorów centrów danych z siedzibą w Singapurze. „Potrzebujesz najlepszych chipów, aby szkolić najbardziej zaawansowane modele, a wszystko jest zgodne z prawem”. W ciągu ostatniego roku modele Qwen Alibaby i Doubao ByteDance stały się jednymi z najlepiej działających LLM-ów na świecie. Qwen jest również szeroko adaptowany poza Chinami przez deweloperów, ponieważ jest swobodnie dostępnym, „otwartym” modelem.

Klastry centrów danych przeżywają boom w Singapurze i Malezji, napędzany chińskim popytem. Wiele z tych centrów danych jest wyposażonych w wysokiej klasy produkty Nvidii, podobne do tych używanych przez amerykańskie giganty technologiczne, jak OpenAI, Google czy Meta do szkolenia LLM-ów. Według osób zaznajomionych z tą praktyką, chińskie firmy zazwyczaj podpisują umowę najmu na korzystanie z zagranicznych centrów danych, których właścicielami i operatorami są podmioty niechińskie. Jest to zgodne z amerykańskimi przepisami dotyczącymi kontroli eksportu, ponieważ zasada „dyfuzji” z czasów prezydenta Joego Bidena, mająca na celu zamknięcie tej luki prawnej, została uchylona przez prezydenta USA Donalda Trumpa na początku tego roku.

DeepSeek został w domu

Jednym z wyjątków jest DeepSeek, twórca wysokiej jakości i tanich modeli AI, który jest szkolony w kraju. Firma zgromadziła znaczący klaster chipów Nvidii, zanim weszły w życie amerykańskie zakazy eksportowe. Ponadto ściśle współpracuje z krajowymi producentami procesorów, na czele z Huawei, w celu optymalizacji i rozwoju następnej generacji chińskich chipów AI, jak podają te osoby. Huawei ma zespół inżynierów stacjonujących w głównej siedzibie DeepSeek w Hangzhou. Firma postrzega swoje partnerstwo z DeepSeek jako strategiczny wysiłek na rzecz rozwoju swoich systemów półprzewodnikowych i oprogramowania, które mają być adaptowane do szkolenia AI w całym kraju.