В Кремниевой долине наступило что-то вроде паники. На прошлой неделе малоизвестная китайская компания выпустила новую большую языковую модель искусственного интеллекта, которая по своим характеристикам оказалась не хуже аналогов, сделанных в США. Это было бы еще полбеды: главная проблема состоит в том, что «китаянка» оказалась в десятки раз дешевле и потребовала несопоставимо меньшего объема вычислительных ресурсов. По сути, речь идет о настоящей революции, которая может выплеснуться далеко за пределы рынка искусственного интеллекта. Вполне возможно, что сейчас мы видим начало нового «краха доткомов». Подробности — в материале «Известий».
«Момент спутника»
На форуме в Давосе в этом году руководители американских технологических корпораций признавали, что отрыв от Китая в разработке больших языковых моделей (LLM) является очень небольшим — в лучшем случае год. Но оказалось, что и эта оценка является завышенной. 20 января китайцы предложили модель DeepSeek R1, которая мгновенно стала хитом. В рейтинге приложений Apple и Google Store уже к концу минувшего уикенда она взлетела на первое место. И неудивительно: независимые тесты показали, что программа как минимум не уступает имеющимся на рынке новейшим разработкам OpenAI, Anthropic и Meta (запрещена в России), а в чем-то и превосходит их.
Ключевая разница со всеми этими моделями заключается в том, что R1, как и предыдущие варианты DeepSeek, бесплатна для частного пользования. Любой может скачать виртуального помощника себе на смартфон, разговаривать с ним на сайте компании или установить локально на компьютер (при условии достаточной мощности «железа»). Почти у всех американских конкурентов — проприетарная система распространения, она требует оплаты по подписке.
Популярность модели зашкалила настолько, что она была вынуждена временно ограничить доступ к регистрации. Хотя в компании оправдались тем, что сайт был перегружен злонамеренными атаками, скорее всего, он просто не выдержал глобального спроса на продукт.
Всё это произвело эффект разорвавшейся бомбы в кругах, близких к хайтеку и разработке ИИ в частности. Американский инвестор и инженер Марк Андриссен назвал ситуацию «моментом спутника», сравнивая выход DeepSeek R1 с запуском первого искусственного спутника Советским Союзом в 1957 году, который оказался холодным душем для американцев, уверенных в своем превосходстве в области ракетных и космических технологий. Глава Microsoft Сатья Наделла признал, что появление нового игрока в индустрии резко усилит конкуренцию, что в конечном итоге будет полезно для развития искусственного интеллекта. Гендиректор OpenAI Сэм Альтман поприветствовал соперника и пообещал разрабатывать улучшенные модели, чтобы выдержать конкурентную гонку. По большей части позиция CEO американских интернет-компаний была хорошей миной при плохой игре: такого эффекта мало кто ожидал.
Что такое DeepSeek
Можно было бы ожидать, что конкуренция для американских гигантов будет исходить от их китайских аналогов — корпораций вроде Alibaba или Tencent. Но модели DeepSeek были разработаны скромным стартапом из города Ханчжоу, образованным в 2023 году руководителем хедж-фонда High Flyer Ляном Вэньфэном, который учредил компанию со всего 10 млн юаней ($1,4 млн) основного капитала. За считаные месяцы фирма выпустила несколько моделей, предпоследняя из которых — V3 — уже привлекла всеобщее внимание. Однако R1 показала поистине колоссальный прогресс, достигнув мировых топов.
При этом средства, которыми оперирует компания, достаточно ограниченны в сравнении как с американскими, так и с китайскими конкурентами. Точная сумма, вложенная в разработку последней модели, официально не объявляется, но по косвенным подсчетам речь идет о семизначном (в долларах США) числе. Наиболее часто упоминается цифра $5,5 млн, что выглядит смешно в сравнении с $75 млн, выделенных на тренировку последней модели ChatGPT.
Но еще важнее, что DeepSeek потратила значительно меньше вычислительных мощностей. Компания признала, что для обучения модели потребовалось всего около 2000 чипов Nvidia H800. Это не самые новые и не самые мощные чипы, для их покупки не приходилось обходить наложенные на китайских потребителей санкции. Это опять же копейки в сравнении с системами процессоров, используемых американскими конкурентами стоимостью в десятки миллионов долларов.
Минусов у новой модели пока не очень много. Говорят об ограничениях в плане цензуры, но скандалы с различными фильтрами были слышны и относительно американских разработок, равно как и других китайских предложений. Для большинства целей, в которых может использоваться программа, это не особо критично. Другие, наоборот, предупреждают, что ограничительные барьеры в R1 легко обойти и модель может использоваться для незаконной активности. Наконец, как уже говорилось, компания пока не очень готова к своему успеху и не может обеспечить доступ всем желающим. Но на горизонте даже пары недель эта проблема не слишком существенна.
Минус $600 млрд за день
Последствия для индустрии искусственного интеллекта уже огромны — равно как и для широкой экономики. Новости об успехах DeepSeek спровоцировали эпичную распродажу на американском фондовом рынке. Индекс NASDAQ за один день рухнул на 3%, причем богатейшие люди мира, являющиеся совладельцами могущественных технологических компаний, потеряли за эти часы в сумме более $108 млрд своего состояния. Ситуация выглядит тревожно похожей на крах интернет-компаний в 2000 году, когда рынок внезапно осознал, что их оценка грандиозно завышена. Этот обвал привел к почти 10-летней стагнации в самом быстрорастущем секторе. Повторится ли сейчас такое? Пока говорить об этом рано, но риски ненулевые, учитывая рекордные соотношения цены акций к прибыли хайтек-корпораций.
Среди них на первом месте находится Nvidia, которая 27 января потеряла 17% своей капитализации, или около $600 млрд, — с огромным отрывом рекордное дневное падение в истории фондового рынка США, если говорить об абсолютных цифрах рыночной стоимости. Компания, производящая графические процессоры, в последние 10 лет как будто раз за разом выигрывала в лотерею, подтверждая, что во время золотой лихорадки больше всего зарабатывают производители лопат. Сначала был криптовалютный бум, затем спрос на видеокарты во время пандемии и вот сейчас — ИИ. В 2023 году бумаги корпорации выросли на 239%, в 2024-м — на 171%. За счет этого прыжка Nvidia в кратчайшие сроки обошла Microsoft и Apple, став самой дорогой компанией мира (около $3,45 трлн до падения).
Но теперь выясняется, что для выпуска качественных и современных моделей ИИ не обязательно нужно самое навороченное «железо». Это автоматически означает, что, вероятно, и чипы в таких объемах не понадобятся, и конкуренты Nvidia вполне могут вступить в игру. А вопрос, оправданны ли сотни миллиардов инвестиций в погоне за всё более мощными чипами, ставится ребром. И в этом последствия не только для компании Дженсена Хуанга. Но и шире — относительно действий США на этом поле.
Начиная с конца 2010-х годов американцы стали вводить эмбарго на поставку современных чипов в Китай, постепенно сильнее закручивая гайки — всё для того, чтобы не допустить создания конкурентного китайского ИИ. Но DeepSeek R1 показывает, что эти усилия по большей части ушли впустую и запреты лишь стимулировали инновации, подтверждая поговорки «голь на выдумки хитра» и «сила есть — ума не надо» (последняя относительно американских техгигантов, тратящих большие суммы на техническое обеспечение вместо поиска элегантных решений). Вполне возможно, что вскоре нечто подобное произойдет и в производстве самих чипов — если, конечно, гонка полупроводников всё еще будет актуальна через несколько лет.
Для российских компаний происходящее тоже может быть хорошим уроком. Отечественная ИИ-индустрия, хоть и относится к мировому топу, всё же уступает в своих продуктах американцам и китайцам. Данный случай, однако, показывает, что отставание в бюджетах некритично и может быть компенсировано нестандартными способами.