Техногігант Alibaba випустив нову версію свого ШІ — там кажуть, що вона перевершує DeepSeek

Автор:
Анастасія Могилевець
Дата:

Китайська компанія Alibaba випустила нову версію своєї моделі штучного інтелекту Qwen 2.5. Представники корпорації стверджують, що її можливості перевершують «широко розрекламовану» DeepSeek-V3.

Про це повідомляє Reuters.

Версію Qwen 2.5-Max випустили в перший день китайського Нового року за місячним календарем, коли у більшості китайців вихідний. Це говорить про тиск DeepSeek не лише на іноземних, але й на внутрішніх конкурентів, пише видання.

«Qwen 2.5-Max майже за всіма параметрами перевершує GPT-4o, DeepSeek-V3 і Llama-3.1-405B», — написали представники Alibaba в китайській соцмережі WeChat, маючи на увазі передові моделі OpenAI і Meta.

Разом з Tencent і Baidu Alibaba вклала значні ресурси в сегмент хмарних сервісів, пише Bangkok Post. Стартап DeepSeek, заснований у рідному місті Alibaba Ханчжоу, ймовірно, став еталоном, якому корпорація хоче відповідати.

Що таке DeepSeek

Компанію DeepSeek у 2023 році заснував 40-річний Лянь Веньфенг, випускник факультету інформаційної та електронної інженерії. Він створив магазин чипів Nvidia A100, які зараз заборонено експортувати в Китай. Медіа припускають, що це могло спонукати його запустити DeepSeek, поєднавши ці чипи з дешевшими, нижчого класу, які все ще доступні для імпорту.

DeepSeek працює на основі моделі DeepSeek-V3 з відкритим вихідним кодом. Деякі фахівці кажуть, що цю модель розробили менш ніж за $6 мільйонів — конкуренти витрачають значно більші суми. Інші спеціалісти, утім, заперечують таку інформацію.

Застосунок зʼявився в той час, коли Вашингтон обмежує продаж Пекіну передових чипів, що забезпечують штучний інтелект. Щоб продовжувати роботу без імпортних компонентів, китайські розробники ділилися один з одним своїми напрацюваннями й експериментували.

Вони створили моделі ШІ, які вимагають набагато менше обчислювальної потужності, ніж раніше. Відповідно, вони набагато дешевші — це може докорінно змінити галузь.

На початку січня DeepSeek похвалилася продуктивністю на рівні з продуктами OpenAI, коли застосунок використовують для розвʼязування математичних задач, написання коду тощо.

Популярність розробки вже вплинула на ринки: вартість акцій ASML, нідерландського виробника мікросхем, впала на понад 10%, водночас акції Siemens Energy, виробника обладнання, повʼязаного з ШІ, — на 21%.

Також на 16% — до $118,26 — впали акції компанії Nvidia. Ще в червні минулого року вона була найдорожчою компанією у світі.