Alibaba та ByteDance навчають свої топові моделі ШІ за межами Китаю – у чому причина

Трамп скасував одне з обмежень і тепер Китай це використовує на свою користь.

Провідні китайські компанії навчають свої моделі штучного інтелекту за кордоном, щоб отримати доступ до чипів Nvidia і обійти спроби США перешкодити розвитку їхніх технологій.

Після того, як у квітні адміністрація президента США Дональда Трампа ввела обмеження на продаж напівпровідників Nvidia H20, призначених виключно для Китаю, кількість тренувань за кордоном постійно зростала, пише The Financial Times.

“Приїхати сюди — це очевидний вибір”, — сказав один із операторів дата-центрів у Сінгапурі. — Для тренування найсучасніших моделей потрібні найкращі чипи, і все це відповідає законодавству”.

За останній рік Qwen від Alibaba та Doubao від ByteDance стали одними з найефективніших великими мовними моделями (LLM) у світі. Qwen також здобув популярність за межами Китаю серед розробників через доступність вільного використання.

Кластери центрів обробки даних переживають бум у Сінгапурі та Малайзії, що зумовлено попитом з боку Китаю. Багато з них оснащені висококласними продуктами Nvidia, подібними до тих, що використовуються американськими технологічними гігантами для навчання LLM.

За словами тих, хто знайомий з цією практикою, китайські компанії зазвичай підписують договір оренди для використання закордонних центрів обробки даних, що належать і експлуатуються некитайськими організаціями. Це відповідає експортному контролю США, оскільки “правило поширення”, розроблене в епоху Джо Байдена для усунення цієї лазівки, було скасоване Трампом на початку цього року.

Винятком є DeepSeek, виробник високоякісних і недорогих моделей штучного інтелекту, які навчаються всередині Китаю. Компанія створила значний запас чипів Nvidia до набрання чинності експортних заборон США.

За словами співрозмовників видання, також DeepSeek тісно співпрацює з вітчизняними виробниками на чолі з Huawei з метою оптимізації та розробки нового покоління китайських чипів штучного інтелекту.

Huawei має команду інженерів, які працюють у штаб-квартирі DeepSeek в Ханчжоу. Компанія розглядає своє партнерство з DeepSeek як стратегічне зусилля з метою вдосконалення своїх напівпровідникових і програмних систем, які будуть використовуватися для навчання штучного інтелекту по всій країні.

Навчання LLM вимагає величезної обчислювальної потужності для обробки величезних масивів даних, тому більшість китайських компаній віддають перевагу передовим продуктам Nvidia для виконання цього завдання. Однак техногіганти все частіше звертаються до чипів місцевого виробництва для “висновків”, коли системи штучного інтелекту відповідають на запити користувачів.

Крім навчання, китайські компанії також використовують центри обробки даних у Південно-Східній Азії для обслуговування закордонних клієнтів, оскільки Alibaba і ByteDance прагнуть збільшити свою частку на світовому ринку хмарних обчислень. Вони також збільшують доступ до дата-центрів у інших регіонах, зокрема на Близькому Сході.

Одне з обмежень полягає в тому, що китайським технологічним компаніям заборонено вивозити приватні дані за межі країни. Це означає, що для налаштування моделі штучного інтелекту на основі даних, наданих локальними користувачами, процес навчання повинен залишатися в Китаї.

Нагадаємо, xAI та Nvidia збудують у Саудівській Аравії один з найбільших дата-центрів регіону.

Штучний інтелект уже тестує закони, прогнозує вибори й створює віртуальні держави. Але хто контролюватиме ці симуляції — люди чи алгоритми? І як вони впливатимуть на наше реальне життя? Чи не втратимо ми право на реальність?

Про це в статті “Віртуальна держава: як ШІ переписує суспільство й чи залишиться у людини право на вето?” пише завідувач Наукової лабораторії імерсивних технологій і права Інституту інформації, безпеки і права Національної академії правових наук України Олексій Костенко.

Джо БайденДональд ТрампКитайСША