Рынок отыгрывает новость о том, что китайскому стартапу DeepSeek удалось создать модель искусственного интеллекта, не уступающую o1 от OpenAI, но при этом обойтись вдвое урезанными для китайского рынка и не самыми последними чипам Nvidia. Более того, модель (R1) имеет открытый исходный код и “щедрую” лицензию MIT на коммерческое использование производных продуктов.
Все это означает, что инвесторам придется переоценивать американские ИИ-компании как минимум по трем параметрам.
Во-первых, больше не очевидно, что эффективному ИИ-решению необходимо только самое дорогое “железо”. Лидеров ИИ критиковали именно за несоразмерные инвестиции в основные фонды, однако в последние месяцы сложился консенсус, что это неизбежно. Теперь он разрушен. Во-вторых, под вопросом тезис о том, что жизнеспособной альтернативы чипам Nvidia не существует. Наконец, Китай, как выясняется, не так уж отстал от США в области искусственного интеллекта, а значит, его ИИ-компании заслуживают повышенной оценки.
“DeepSeek показал, что топ-модели ИИ можно создавать дешевле, — сказал Bloomberg Вейзерн Лин из швейцарского управляющего активами Union Bancaire Privee. — В потенциале это рушит инвестиционный кейс всей пищевой цепочки ИИ, существующей за счет огромных расходов горстки компаний”.
Ведущие бизнес-СМИ воздерживаются от радикальных суждений, но техноблоги полны оценок от sputnik moment до “черного лебедя”. Первое выглядит вернее: как первый спутник Земли, запущенный СССР в 1957 году, ознаменовал старт космической гонки, так запуск R1 символизирует гонку ИИ между США и Китаем.
R1 доступна для пользователей уже неделю, но требует регистрации. Независимые тесты в целом подтверждают, что она вполне на уровне достижений OpenAI и особенно хорошо справляется с задачами в области программирования и математики. Как и о1, это модель с рассуждением — то есть она способна “разбирать” свои действия, строить логические цепочки, обучаться на запросе и тем самым избегать типичных для менее совершенных ИИ ошибок.
Кроме основной модели с 671 млрд параметров, доступна облегченная — R1-Zero, обученная вообще без “человеческого” файн-тюнинга (почему это важно, можно почитать здесь), и несколько дистиллированных мини-моделей. Самая младшая из них, с 1,5 млрд параметров, способна работать на локальном устройстве типа мощного десктопа с хорошей видеокартой.
“Большая” R1, хотя она и выложена в свободный доступ, требует мощных распределенных серверов и практически доступна пользователям и компаниям только в виде чат-бота или по API. Однако последний в 10—20 раз дешевле, чем у о1 от OpenAI, замечает TechCrunch. Правда, в соответствии с требованиями китайской цензуры ИИ не ответит ни на вопросы о площади Тяньаньмэнь, ни о независимости Тайваня.
Экономия при разработке R1 была достигнута за счет самостоятельного обучения. Качество выхода разработчики, начавшие именно с R1-Zero, улучшали не за счет разметки данных, а за счет эталонных логических цепочек, а также отбором правильных ответов (rejection sampling), которые потом поступали в обучающую выборку. При этом им удалось как-то избежать отравления данных.
“DeepSeek R1 — одно из самых удивительных и впечатляющих достижений, которые я когда-либо видел, а с открытым исходным кодом — это ценный дар миру”, — написал глава Andreessen Horowitz Марк Андрессен у себя в X. По скачиваниям на AppStore приложение DeepSeek в моменте опережает ChatGPT от OpenAI.
Успех стартапа стал неожиданностью даже в самом Китае, где до этого прорывов в ИИ ждали скорее от гигантов вроде ByteDance и Alibaba, пишет FT.
Его можно считать идеальным в современном контексте: DeepSeek основана китайцем, нанимает ученых из передовых китайских университетов и сосредоточена только на исследованиях, а не на коммерческой выгоде. “У нас не было людей, которые вернулись из-за границы. Все местные... Мы должны сами развивать лучшие таланты”, — говорил основатель компании, владелец хедж-фонда Лян Вэньфэн, увлекшийся нейросетями в 2021 году.
Во время мирового финансового кризиса 2007—2008 годов Лян Вэньфэн совмещал учебу в Чжэцзянском университете с трейдингом, а в 2016 году основал успешный количественный хедж-фонд High-Flyer. В 2023 году — после экспортных ограничений США — фонд остался с 10 тысячами ИИ-чипов Nvidia H100, задействованных в суперкомпьютерах для алгоритмического анализа, — и внезапно “переобулся” в ИИ-стартап.
Сам предприниматель говорит, что им двигало чисто научное любопытство. Но все равно внезапный переворот выглядел странно, замечает Wired: “это как если бы бросить все силы на ИИ решил трейдер уровня Jane Street”. Но каким-то образом он сработал. Не последнюю роль сыграла ориентация на молодых исследователей-энтузиастов без груза жизненных проблем, которых привлекали реальной ответственной работой и полным доступом к вычислительным мощностям.
Неделя началась неудачно для бигтехов, между тем на ней выходят отчеты серьезно вложившихся — или обслуживающих ИИ — компаний, включая Apple и Microsoft. Ожидания нельзя было назвать оптимистичными и до DeepSeek: падение темпов прибыли при росте инвестиций. Падать еще есть куда, напоминает Bloomberg: индекс Nasdaq 100 торгуется в среднем по 27 к прогнозируемой прибыли (P/E) против среднего за последние три года 24. А Nvidia — даже по 33.
Вряд ли можно считать случайностью и то, что DeepSeek выложила модель 20 января — в день инаугурации Дональда Трампа, прямо пообещавшего США абсолютное лидерство в области ИИ. Фактически Китай принял вызов — по крайней мере, свои чипы от санкционной Huawei, сопоставимые с H100, находятся как минимум в высокой степени готовности.
Подобные R1 модели в разработке как минимум у Alibaba и Kimi. Судя по всему, абсолютное лидерство США придется отстаивать дальнейшими крупными инвестициями — вместе с запретами и санкциями.
Что скажете, Аноним?
[07:00 16 апреля]
[19:57 15 апреля]
14:10 16 апреля
13:55 16 апреля
12:20 16 апреля
12:10 16 апреля
11:00 16 апреля
10:30 16 апреля
10:00 16 апреля
[17:17 14 апреля]
[11:50 03 апреля]
[19:12 15 марта]
(c) Укррудпром — новости металлургии: цветная металлургия, черная металлургия, металлургия Украины
При цитировании и использовании материалов ссылка на www.ukrrudprom.ua обязательна. Перепечатка, копирование или воспроизведение информации, содержащей ссылку на агентства "Iнтерфакс-Україна", "Українськi Новини" в каком-либо виде строго запрещены
Сделано в miavia estudia.