Невеликий китайський стартап DeepSeek обвалив акції західних IT-корпорацій та їхні плани на майбутнє. Що ж сталося? З OpenAI та Nvidia можна прощатися? Пояснення від програмістів (людською мовою)
- Автори:
- Антон Семиженко, Гліб Гусєв
- Дата:

Згенеровано за допомогою ШІ / «Бабель»
Двадцятого січня китайський стартап DeepSeek опублікував глобальну версію свого чат-боту з ШІ. За кілька діб застосунок обігнав у списку найпопулярніший ChatGPT, а капіталізація найбільших західних розробників систем штучного інтелекту зменшилась на десятки, а в когось і на сотні мільярдів доларів. Як невеликій компанії з підсанкційної комуністичної країни вдалось налякати технологічних інвесторів? Оглядач «Бабеля» Антон Семиженко ознайомився з технологічною документацією чат-боту та коментарями програмістів й експертів технологічного ринку ― і коротко відповідає на головні запитання про феномен DeepSeek.
Чим особливий DeepSeek? Чому сполошився Захід?
Чат DeepSeek аналізує інформацію і ґрунтовно відповідає загалом не гірше за провідні версії ChatGPT від OpenAI і Gemini від Google та набагато якісніше за проєкт Llama від Meta. А ще має загальнодоступну опцію reasoning, тобто пояснює, як система дійшла того чи іншого висновку, коли відповідала на запитання користувача. В останній версії ChatGPT активація цієї опції коштує $20 на місяць.
При цьому американські компанії витрачали на дослідження мільярди доларів і використовували найновіші чипи. DeepSeek натренував свою модель за кілька місяців і, якщо вірити заявам програмістів, приблизно $6 мільйонів. Також китайська компанія працювала на простіших чипах: США забороняють постачати до Китаю нові моделі мікропроцесорів, а їхній провідний виробник ― Nvidia ― робить для китайського ринку чипи з навмисно погіршеним функціоналом. Усе це китайським розробникам вдалось подолати. Так, китайське походження дається взнаки: DeepSeek не може надати адекватних відповідей щодо статусу Тайваню чи Тибету, але попри «відповідність цінностям соціалізму», як йдеться в технічному описі застосунку, продукт цілком робочий.
Слово, яке ледь не найчастіше зараз трапляється в обговоренні продукту DeepSeek, ― це «рів». Намагаючись утримати першість у розробці систем штучного інтелекту, США створили чимало «ровів» ― як фінансових, та і технологічних перепон для розробників з інших країн, особливо тих, які вважає недружніми. Спочатку це працювало: системи штучного інтелекту, які розробляли китайські компанії на кшталт Alibaba, Huawei та ByteDance, істотно поступались західним за точністю й ефективністю. Але вже торік між виходом нової версії ChatGPT і продукта китайських розробників з подібним функціоналом минало всього близько місяця. DeepSeek показує, що цей розрив вже подолано.
Як DeepSeek це вдалося? (трохи технічних деталей)
Найбільше програмістам допомогли саме обмеження. Працюючи лише з чипами доволі невисокої потужності, вони мусили переробити вихідний код на значно глибшому рівні, розбивши запити до системи на простіші. Із цих будівельних блоків зрештою вдалося створити краще оптимізовану систему, яка використовує для надання відповідей менше енергії та обчислювальних потужностей.
Значною мірою ця оптимізація стосується так званого міксу експертів, більш відомого як MoE (від mixture of experts). Якщо спростити, це ніби система папок на жорсткому диску компʼютера, створена за принципом розподілу на різні сфери знань чи деталі мови. Це допомагає заожаджувати енергію: так модель штучного інтелекту аналізує не всю наявну в себе інформацію, а лише найрелевантнішу для конкретного запиту. DeepSeek вдосконалила цей (тепер уже) стандартний підхід, розбивши експертів на загальних і вузькоспеціалізованих.
Ще одне ноу-хау DeepSeek ― виділення більшого обсягу обчислювальних потужностей на формулювання відповіді. Це допомагає ШІ краще систематизувати інформацію та в підсумку подавати її.
Звідки взагалі ці програмісти? Це велика компанія?
За мірками лабораторій штучного інтелекту, DeepSeek ― це невеликий стартап, там працюють менше ніж дві сотні людей. Його заснував 39-річний програміст Лян Веньфен, попередній бізнес якого ― хедж-фонд High-Flyer. Цей фонд із капіталізацією приблизно $8 мільярдів ― основний спонсор DeepSeek. Веньфен каже, що фінанси не є проблемою для його розробок. Значно серйозніший виклик ― потужність доступних для роботи чипів.
На китайському ринку DeepSeek давно відома як компанія-дизраптор, яка змінює правила гри. По-перше, за доступ до розширеної версії своєї системи вона встановила дуже низьку ціну ― у сім разів нижчу, ніж у конкурентів. Це спонукало інші компанії теж знизити ціни. При цьому продукти DeepSeek приносять прибуток ― просто маржа компанії невелика.
Керівник DeepSeek Лян Веньфен — праворуч. Знайомі вважають його «більше гіком, ніж бізнесменом».
Beeld CCTV / «Бабель»
Також компанія викладає вихідний код своїх продуктів у вільний доступ. Це не означає, що чат-бот DeepSeek можна легко скопіювати, адже його треба навчити на якомусь матеріалі. Але «скелет» програми може дослідити й розібрати на складові будь-хто. Кожен реліз розробники супроводжують поясненням, чому вони ухвалили ті чи інші рішення.
Така політика допомагає приваблювати фахівців. Розробники OpenAI та деталі їхньої роботи невідомі світу: американська компанія тримає код свого продукту в таємниці. DeepSeek у кожному релізі називає всіх причетних.
Тобто про Nvidia можна буде забути?
На тлі новин від DeepSeek капіталізація Nvidia спершу втратила 17%. Інвестори почали сумніватися, чи є сенс виготовляти все потужніші й дорожчі чипи, якщо проривних результатів можна досягати й на дешевших.
Однак зараз акції Nvidia знову зростають і вже компенсували чверть падіння. По-перше, з потужними чипами все ж таки краще, ніж із застарілими. DeepSeek і самі визнають, що вони б воліли працювати з кращою технікою. А по-друге, більшість складних ШІ-систем використовують софтову оболонку CUDA ― багато в чому вона схожа на окрему мову програмування. Це розробка Nvidia і працює лише на її чипах. Тому принаймні в середньостроковій перспективі статус американського виробника як провідного постачальника чипів для індустрії збережеться.
І що тепер?
Китайська IT-індустрія вважалась другорядною ― спроможною лише адаптувати й масштабувати те, що придумали на Заході. Як висловився Лян Веньфен, вважалось, що Захід майстерно розвиває продукт «від нуля до одиниці», а Китай ― «від одиниці до десяти». Тепер це змінилось. Успіх DeepSeek додасть впевненості іншим розробникам, тож наступні технологічні прориви родом із Китаю ― лише питання часу.
Те, що США заборонили постачати Китаю сучасні моделі чипів, спонукало його вкладатись у розробку своїх. Деякі розробки Huawei вже конкурують з мікропроцесорами Nvidia ― очевидно, що тенденція не зміниться. А оскільки розробка DeepSeek дешевша, Китай, як і у сферах споживчих товарів чи дронів, може зайняти нішу бюджетних аналогів західної продукції.
Споживачі від цього виграють, упевнений, наприклад, CEO Microsoft Сатья Наделла. Дешева система штучного інтелекту, яку легко можуть інтегрувати у свої продукти виробники побутової техніки чи аграрні компанії, ― це більше клієнтів у розробників і загалом краща якість життя. Якщо цей ШІ не використовують для того, щоб знищити людину, компанію чи країну.
Ми роботів до «Бабеля» майже не підпускаємо — це продукт ручної роботи, як у старі добрі часи. Це заслуговує на підтримку, чи не так? https://babel.ua/donate.