Американский стартап Cerebras Systems объявил о том, что его инференс-платформа позволила установить мировой рекорд производительности при использовании «рассуждающей» ИИ-модели DeepSeek R1 в модификации с 70 млрд параметров (DeepSeek-R1-Distill-Llama-70B).
#hardware #cerebras #deepseek #ии #инференс
#servernews @servernewsru
https://servernews.ru/1117588/?utm_source=nova&utm_medium=tg&utm_campaign=sn
#hardware #cerebras #deepseek #ии #инференс
#servernews @servernewsru
https://servernews.ru/1117588/?utm_source=nova&utm_medium=tg&utm_campaign=sn
ServerNews - все из мира больших мощностей
Самый быстрый инференс DeepSeek R1 в мире: ИИ-платформа Cerebras снова поставила рекорд производительности
Американский стартап Cerebras Systems объявил о том, что его инференс-платформа позволила установить мировой рекорд производительности при использовании «рассуждающей» ИИ-модели DeepSeek R1 в модификации с 70 млрд параметров (DeepSeek-R1-Distill-Llama-70B).
Шок, вызванный недавним триумфом китайского ИИ-стартапа DeepSeek, представившего дешёвые и эффективные ИИ-модели, заставил многих усомниться в результативности масштабных вложений в инфраструктуру на базе дорогих ИИ-ускорителей, сообщает The Register. Тем не менее эксперты уверены, что отказываться от инвестиций было бы нецелесообразно.
#hardware #инвестиции #ии #цод #китай #llm #инференс #оптимизация #строительство #deepseek #прогноз
#servernews @servernewsru
https://servernews.ru/1117625/?utm_source=nova&utm_medium=tg&utm_campaign=sn
#hardware #инвестиции #ии #цод #китай #llm #инференс #оптимизация #строительство #deepseek #прогноз
#servernews @servernewsru
https://servernews.ru/1117625/?utm_source=nova&utm_medium=tg&utm_campaign=sn
ServerNews - все из мира больших мощностей
The Register: Успех DeepSeek показал важность обдуманных инвестиций в ИИ, но потребность в развитии инфраструктуры никуда не денется
Шок, вызванный недавним триумфом китайского ИИ-стартапа DeepSeek, представившего дешёвые и эффективные ИИ-модели, заставил многих усомниться в результативности масштабных вложений в инфраструктуру на базе дорогих ИИ-ускорителей, сообщает The Register. Тем…
Китайский стартап DeepSeek наделал много шума в Кремниевой долине, анонсировав «рассуждающую» ИИ-модель DeepSeek R1 c 671 млрд параметров. Утверждается, что при её обучении были задействованы только 2048 ИИ-ускорителей NVIDIA H800, а затраты на данные работы составили около $6 млн. Это бросило вызов многим западным конкурентам, таким как OpenAI, а акции ряда крупных ИИ-компаний начали падать в цене. Однако, как сообщает ресурс SemiAnalysis, фактические расходы DeepSeek на создание ИИ-инфраструктуры и обучение нейросетей могут быть гораздо выше.
#hardware #deepseek #nvidia #ии #ускоритель #кластер #китай #разработка #llm
#servernews @servernewsru
https://servernews.ru/1117640/?utm_source=nova&utm_medium=tg&utm_campaign=sn
#hardware #deepseek #nvidia #ии #ускоритель #кластер #китай #разработка #llm
#servernews @servernewsru
https://servernews.ru/1117640/?utm_source=nova&utm_medium=tg&utm_campaign=sn
ServerNews - все из мира больших мощностей
Реальные затраты DeepSeek на создание ИИ-моделей на порядки выше заявленных, но достижений компании это не умаляет
Китайский стартап DeepSeek наделал много шума в Кремниевой долине, анонсировав «рассуждающую» ИИ-модель DeepSeek R1 c 671 млрд параметров. Утверждается, что при её обучении были задействованы только 2048 ИИ-ускорителей NVIDIA H800, а затраты на данные работы…
После того, как ИИ-индустрия немного отошла от шока, вызванного неожиданным триумфом китайской DeepSeek, эксперты пришли к выводу, что отрасли, возможно, придётся пересмотреть методики обучения моделей. Так, исследователи DeepMind заявили о модернизации распределённого обучения, сообщает The Register.
#ии #deepmind #сети #deepseek #кластер #google #интерконнект
#servernews @servernewsru
https://servernews.ru/1118392/?utm_source=nova&utm_medium=tg&utm_campaign=sn
#ии #deepmind #сети #deepseek #кластер #google #интерконнект
#servernews @servernewsru
https://servernews.ru/1118392/?utm_source=nova&utm_medium=tg&utm_campaign=sn
ServerNews - все из мира больших мощностей
Исследователи DeepMind предложили распределённое обучение больших ИИ-моделей, которое может изменить всю индустрию
После того, как ИИ-индустрия немного отошла от шока, вызванного неожиданным триумфом китайской DeepSeek, эксперты пришли к выводу, что отрасли, возможно, придётся пересмотреть методики обучения моделей. Так, исследователи DeepMind заявили о модернизации распределённого…
Компания SambaNova объявила о том, что в её облаке SambaNova Cloud стала доступна большая языковая модель DeepSeek-R1 с 671 млрд параметров. При этом благодаря применению фирменных ускорителей SN40L обеспечивается рекордно высокая скорость инференса.
#hardware #sambanovasystems #deepseek #ии #инференс
#servernews @servernewsru
https://servernews.ru/1118739/?utm_source=nova&utm_medium=tg&utm_campaign=sn
#hardware #sambanovasystems #deepseek #ии #инференс
#servernews @servernewsru
https://servernews.ru/1118739/?utm_source=nova&utm_medium=tg&utm_campaign=sn
ServerNews - все из мира больших мощностей
SambaNova развернула самую быструю инференс-платформу для ИИ-модели DeepSeek-R1 671B
Компания SambaNova объявила о том, что в её облаке SambaNova Cloud стала доступна большая языковая модель DeepSeek-R1 с 671 млрд параметров. При этом благодаря применению фирменных ускорителей SN40L обеспечивается рекордно высокая скорость инференса.
Китайские техногиганты Alibaba, ByteDance и Tencent наращивают закупки урезанных ускорителей NVIDIA H20. Даже ослабленные чипы весьма востребованы китайским бизнесом для обеспечения работы ИИ-моделей, сообщает Reuters. Это опровергает опасения относительно падения спроса на фоне того, что модели DeepSeek для обучения и инференса требуют гораздо менее производительного оборудования.
#hardware #h20 #nvidia #ии #китай #санкции #deepseek
#servernews @servernewsru
https://servernews.ru/1118871/?utm_source=nova&utm_medium=tg&utm_campaign=sn
#hardware #h20 #nvidia #ии #китай #санкции #deepseek
#servernews @servernewsru
https://servernews.ru/1118871/?utm_source=nova&utm_medium=tg&utm_campaign=sn
ServerNews - все из мира больших мощностей
Триумф ИИ-моделей DeepSeek подстегнул спрос на ускорители NVIDIA H20 в Китае
Китайские техногиганты Alibaba, ByteDance и Tencent наращивают закупки урезанных ускорителей NVIDIA H20. Даже ослабленные чипы весьма востребованы китайским бизнесом для обеспечения работы ИИ-моделей, сообщает Reuters. Это опровергает опасения относительно…