Сумма технологий

«DeepSeek»: как порвать рынок нейросетей

Всего одна китайская нейросеть умудрилась обрушить не только весь мировой рынок нейросетей, но и фондовый рынок США.

Китайцы собрали простую и дешевую сеть «DeepSeek», которая оказалась гораздо эффективнее, чем «ChatGPT». Нюанс в том, что ChatGPT ориентирован на экстенсивное развитие, то есть на наращивание вычислительных мощностей нейросети. DeepSeek же основывается на более современных алгоритмах и принципиально новом подходе к разработке нейросетей.

Грубо говоря, там, где все технологические гиганты просто добавляли всё новые и новые процессорные блоки, разработчики DeepSeek сели и подумали, как сделать лучше программным способом. И сделали.

Основной плюс DeepSeek – он бесплатен. Он работает быстрее, лучше и надёжнее, чем ChatGPT, на который уже потратили сотни миллионов долларов. У него нет так называемых «галлюцинаций», то есть заведомо ложных и несуществующих выводов.

По данным анализа ведущих экспертов, DeepSeek использует на 75% меньше памяти в сравнении с основными конкурирующими нейросетями, и использует систему мультитокенов, позволяющую анализировать фразы целиком. В DeepSeek реализована модель специализированных экспертов и параметров, которые «включаются» только по мере необходимости. Как следствие, система может работать не на дорогостоящих серверных платформах, а на обычных игровых компьютерах, а стоимость её API на 95% дешевле, чем у ChatGPT.

По факту DeepSeek «одной левой» сломала всю отлаженную «западную» схему по превращению искусственного интеллекта в деньги, по которой якобы «только крупные tech-компании могут играть в ИИ». Оказывается, нет. И за короткий срок DeepSeek стал самым популярным бесплатным приложением в Apple App Store в США, обойдя ChatGPT.

Ну и вишенка на торте. Код DeepSeek публичный. Техническая документация находится в открытом доступе. Каждый человек может купить мощный компьютер и сделать себе свой собственный DeepSeek. Это не революция — это крупнейший прорыв в сфере ИТ со времён изобретения персонального компьютера, который «убил» мейнфреймы.

На фоне успехов DeepSeek в мире началась настоящая нейросетевая лихорадка, тут же перекинувшаяся на биржи. Только за сутки акции технологических гигантов, в первую очередь Nvidia, рухнул на несколько процентов, а это примерно триллион долларов. Вся бизнес-модель ИТ-гигантов была построена на принципе продажи супердорогих GPU (Graphics Processing Unit) с маржой 90%. Теперь оказалось, что эти GPU просто не нужны.

В ответ DeepSeek подвёргся масштабным кибератакам. В течение 28 января в сервисе было невозможно зарегистрироваться, десктопная версия нейросети не отвечал на запросы, хотя и загружалась.

Что дальше?

OpenAI, Anthropic и Nvidia просели, но не убиты. Само собой, они сделают выводы, переформатируют бизнес и выведут на рынок, вероятнее всего, бесплатные нейросети. А деньги будут зарабатывать на том же, на чём их зарабатывают поисковые системы: на анализа запросов пользователей и продаже этого анализа коммерсантам, то есть на формировании маркетинговых стратегий. Рано или поздно это должно было случиться — но этот момент все изо всех сил оттягивали.

Кстати, только в январе 2025 года Китай обошёл «Starlink» со своим проектом «Chang Guang Satellite Technology», достигнув скорости передачи данных со спутника на Землю в 100 гигабит в секунду. А китайская тороидальная установка для магнитного удержания плазмы с целью достижения условий, необходимых для протекания управляемого термоядерного синтеза (токамак) «EAST» смогла добиться поддержания температуры свыше 100 миллионов градусов в течение 1066 секунд, побив свой собственный предыдущий рекорд в 403 секунды. На основе подобного токамака будут создаваться плазменные электростанции, которые смогут давать практически бесплатную электроэнергию в неограниченных масштабах.

#ai #ии #deepseek

1.3K viewsedited 11:52

Сумма технологий

DeepSeek R1 теперь можно запустить на относительно доступном оборудовании: революция в мире нейросетей

Исследователи из компании Unsloth, специализирующейся на обучении и файнтюнинге языковых моделей, совершили прорыв в области оптимизации нейронных сетей. Им удалось сжать языковую модель DeepSeek R1 на 80% от её оригинального размера, что открывает новые возможности для использования мощных ИИ-решений на более доступном оборудовании. Теперь модель занимает всего 131 ГБ вместо первоначальных 720 ГБ, что делает её доступной для запуска даже на относительно слабых устройствах. При этом производительность модели остаётся на достаточно высоком уровне, что делает этот подход особенно ценным.

Ключевым инструментом, позволившим достичь такого результата, стал метод динамической квантизации. Этот подход позволяет сохранить веса высокопроизводительных слоёв модели, в то время как менее значимые блоки сжимаются до 1,58 бита. Таким образом, удаётся минимизировать потери в точности и производительности, сохраняя при этом компактность модели.

Благодаря этому сжатую версию DeepSeek R1 теперь можно запустить даже на CPU с 20 ГБ оперативной памяти, что делает её доступной для использования на мощных домашних компьютерах или серверах начального уровня. Это особенно важно для исследователей, разработчиков и компаний, которые не имеют доступа к дорогостоящему оборудованию, но хотят использовать передовые технологии искусственного интеллекта.

Unsloth не только сжала модель, но и сделала её доступной для широкой аудитории. Сжатые версии DeepSeek R1 были опубликованы в публичном доступе, а также размещены подробные инструкции для их локального запуска. Это позволяет любому желающему, обладающему базовыми навыками работы с нейронными сетями, использовать модель для своих задач.

Сжатие модели позволяет экономить не только место на диске, но и вычислительные ресурсы. Это особенно важно для компаний, которые хотят минимизировать затраты на инфраструктуру. Несмотря на значительное сжатие, модель сохраняет высокий уровень производительности. Это делает её пригодной для решения сложных задач, таких как генерация текста, анализ данных и даже создание контента.

DeepSeek R1 — это одна из самых мощных языковых моделей, способная конкурировать с такими гигантами, как GPT-4 или Gemini. Её сжатие до 131 ГБ открывает новые горизонты для использования ИИ в различных сферах, включая образование, медицину, финансы и развлечения. Например, теперь небольшие компании или даже индивидуальные разработчики могут использовать DeepSeek R1 для создания собственных чат-ботов, анализа текстов или автоматизации бизнес-процессов.

Сжатие DeepSeek R1 до 131 ГБ — это настоящая революция в мире нейронных сетей. Она демонстрирует, что даже самые мощные модели можно адаптировать для использования на более доступном оборудовании без значительной потери производительности. Это открывает новые возможности для разработчиков, исследователей и бизнеса, делая передовые технологии ИИ доступными для всех.

#ai #ии #deepseek

19 views02:39

Сумма технологий

Развитие искусственного интеллекта (ИИ) в Китае достигло такого уровня, что власти США начали принимать экстренные меры для сдерживания китайской экспансии в этой сфере.

Одним из ключевых объектов внимания стал китайский ИИ-проект DeepSeek, который вызвал серьёзные опасения у американских властей. В ответ на растущую угрозу в США был разработан законопроект, направленный на ограничение доступа к китайским ИИ-технологиям и предотвращение их распространения на территории страны.

Согласно тексту документа, под запрет попадут все китайские ИИ-модели, созданные лабораториями, колледжами или компаниями, а также любой импорт технологий и интеллектуальной собственности в сфере ИИ, если они были разработаны в Китае.

Также будет запрещено распространять Open Source модели так, чтобы к ним могли получить доступ китайские пользователи и разработчики. За нарушение этого правила предусмотрено наказание в виде лишения свободы на срок до 20 лет.

Подробности:
http://vk.com/@sum_tech-ekstrennye-mery-ssha-protiv-kitaiskogo-ii

#ai #ии #deepseek

1.1K viewsedited 03:26

Сумма технологий

Hawley_Decoupling_Americas_Artificial_Intelligence_Capabilities.pdf

66.6 KB

"Закон о разъединении возможностей искусственного интеллекта Америки с Китаем" (Decoupling America’s Artificial Intelligence Capabilities from China Act of 2025), проект.

#ai #ии #deepseek

32 views04:10

About

Blog

Apps

Platform