DeepSeek, китайский стартап в сфере искусственного интеллекта, которому чуть больше года, вызвал благоговение и ужас в Кремниевой долине, продемонстрировав прорывные модели искусственного интеллекта, которые по производительности сопоставимы с лучшими в мире чат-ботами, но при этом стоят в разы дешевле.
Появление DeepSeek может стать противовесом широко распространённому мнению о том, что для развития ИИ в будущем потребуется всё больше энергии и мощности.
В конце января мировые технологические компании понесли убытки, поскольку ажиотаж вокруг инноваций DeepSeek нарастал, а инвесторы начали оценивать последствия для американских конкурентов и их поставщиков оборудования.
Что именно такое DeepSeek?
DeepSeek была основана в 2023 году Лян Вэньфэном, главой хедж-фонда High-Flyer, занимающегося количественными инвестициями на основе ИИ. Компания разрабатывает модели ИИ с открытым исходным кодом, что означает, что сообщество разработчиков может проверять и улучшать программное обеспечение. После выпуска в начале января мобильное приложение компании возглавило рейтинг загрузок на #iPhone в США.
Приложение отличается от других чат-ботов, таких как #ChatGPT от #OpenAI, тем, что четко формулирует свои рассуждения перед отправкой ответа на запрос. Компания утверждает, что ее версия R1 обеспечивает производительность наравне с последней версией OpenAI, и предоставила лицензию частным лицам, заинтересованным в разработке чат-ботов с использованием технологии, основанной на ней.
Как DeepSeek R1 соотносится с OpenAI или Meta* AI?
Хотя компания не раскрывает полную информацию, стоимость обучения и разработки моделей DeepSeek, по-видимому, составляет лишь малую часть от того, что требуется для лучших продуктов OpenAI или Meta Platforms Inc.* (признана экстремистской и запрещена в России). Гораздо более высокая эффективность модели ставит под сомнение необходимость огромных капиталовложений для приобретения новейших и самых мощных ускорителей ИИ от таких компаний, как Nvidia Corp.. Это также привлекает внимание к ограничениям на экспорт таких передовых полупроводников из США в Китай, которые были введены, чтобы предотвратить прорыв, подобный тому, который, по-видимому, представляет DeepSeek.
DeepSeek утверждает, что R1 близок к моделям-конкурентам или превосходит их по нескольким ведущим показателям, таким как AIME 2024 для математических задач, MMLU для общих знаний и AlpacaEval 2.0 для работы с вопросами и ответами. Он также входит в число лучших моделей в рейтинге Калифорнийского университета в Беркли под названием Chatbot Arena.
Что вызывает тревогу в США?
Вашингтон запретил экспорт высокотехнологичных технологий, таких как полупроводники для графических процессоров, в Китай, чтобы замедлить развитие страны в области искусственного интеллекта, которая является ключевым направлением в борьбе США и Китая за технологическое превосходство. Однако прогресс DeepSeek говорит о том, что китайские инженеры в области искусственного интеллекта нашли способ обойти ограничения, сосредоточившись на повышении эффективности при ограниченных ресурсах. Хотя до сих пор неясно, к какому количеству передового оборудования для обучения ИИ имел доступ DeepSeek, компания продемонстрировала достаточно, чтобы предположить, что торговые ограничения не полностью препятствуют развитию Китая.
Когда DeepSeek вызвал интерес во всем мире?
За разработчиком ИИ пристально следили с момента выпуска его первой модели в 2023 году. Затем, в ноябре, он представил миру свою модель R1, разработанную для имитации человеческого мышления. Эта модель лежит в основе его мобильного приложения-чат-бота, которое вместе с веб-интерфейсом в январе стало всемирно известным как гораздо более дешёвая альтернатива OpenAI.
К 25 января мобильное приложение DeepSeek было загружено 1,6 млн. раз и заняло 1 место в магазинах приложений для iPhone в Австралии, Канаде, Китае, Сингапуре, США и Великобритании.
Please open Telegram to view this post
VIEW IN TELEGRAM