Нейросетевые модели, представленные компанией DeepSeek, в последние дни произвели настоящий фурор и даже вызвали панику у западных IT-гигантов. Бесплатное приложение китайского стартапа вышло в топ по числу скачиваний на различных платформах. На этом фоне американские конкуренты серьезно «покраснели» на фондовом рынке. Например, капитализация производителя видеокарт Nvidia просела на 600 млрд долларов.
Главное преимущество DeepSeek — нетребовательность, сказал в беседе с НТВ директор института прикладных компьютерных наук ИТМО Антон Кузнецов. Он пояснил, что для запуска современных нейросетей типа GPT o1 могут понадобиться десятки видеокарт, тогда как DeepSeek модели R1 можно запустить и на обычном домашнем компьютере. Результат почти сопоставимый — в обоих случаях ИИ-модели дают ответы на самые разные вопросы (от энциклопедических до запросов на написание программ).
Статья
DeepSeek: китайский ответ ChatGPT за «копейки»
Китайцы показали, что нейросети — это «не всегда что-то навороченное, требующее заоблачного железа», отметил, в свою очередь, доцент кафедры инженерной кибернетики НИТУ МИСИС Андрей Филимонов. Разработчики DeepSeek тестировали чат-бот всего пару месяцев, потратив при этом около 6 миллионов долларов против 78 миллионов, которые израсходовал их прямой конкурент из США — компания OpenAI, создавшая ChatGPT. Собеседник НТВ называет это не очередным успехом китайских айтишников, как считают многие, а лишь попыткой «выехать на рекламе».
Андрей Филимонов: «Разработчики DeepSeek поторопились выбросить свой чат-бот на рынок. Они сэкономили на тестировании, объеме памяти, функционале. DeepSeek не умеет обрабатывать голос и генерировать картинки, работает только с текстом. С тем же ChatGPT он несопоставим. Вы не сравниваете внедорожник и автомобиль представительского класса, а используете их для разных целей. Сейчас DeepSeek — как онлайн-переводчик из 90-х: работает, но выдает анекдот вместо грамотного перевода».
Инженер Лаборатории ИИ в медицине научно-образовательного центра ИИ РТУ МИРЭА Вадим Кириллов считает, что называть DeepSeek «убийцей ChatGPT» пока рано. Хотя для Поднебесной, по словам эксперта, это безусловный прорыв. Китайская компания, в отличие от той же Open AI, решилась выложить в открытый доступ исходный код своей нейросети и технический отчет о процессе ее обучения. Это может дать уже российским разработчикам суперпотенциал для развития своих продуктов.
Вадим Кириллов: «Успех DeepSeek, во-первых, показывает, что конкуренция с западными продуктами вполне реальна даже при ресурсных ограничениях. Во-вторых, публичность китайской компании — довольно прорывная концепция. Мы можем взять то же самое, адаптировать под русский язык, сделать еще лучше, дообучать языковые модели для более узких задач, например для бизнеса».
В МИРЭА с помощью DeepSeek уже обрабатывают текстовые данные для Федерального казначейства России и развивают интеграцию больших языковых моделей в медицинские процессы.
В России сформировано довольно сильное сообщество ИИ-профессионалов, уверены опрошенные НТВ эксперты. Активно ведутся работы над генеративными моделями (какими являются ChatGPT и DeepSeek) и ИИ-сервисами. По словам Андрея Филимонова, неплохо себя показывает нейросеть GigaChat от «Сбера», которая при небольшой доработке будет сопоставима с ChatGPT. Антон Кузнецов, в свою очередь, похвалил YandexGPT, результаты работы которой в области текстов иногда превосходят аналоги. Если удастся внедрить наработки DeepSeek в архитектуру этих ИИ-моделей, то, возможно, получится существенно продвинуться, допустил эксперт.
Антон Кузнецов: «Наступает эра, когда все будут стараться при сохранении качества максимально уменьшить затраты. Опыт китайских коллег показывает, что, даже не обладая огромным количеством денег и вычислительных мощностей, можно создавать инновации, которые способны обгонять лидеров рынка. Поэтому я верю, что и у нас будут появляться такого рода новинки».
Помимо «Яндекса» и «Сбера», над языковыми моделями работают некоторые стартапы и научные лаборатории в университетах, рассказал Вадим Кириллов. Их разработки известны меньше, поскольку реже рекламируются, но они уже успешно применяются в бизнес-решениях и конкурируют с лучшими русскоязычными моделями того же класса.