This media is not supported in your browser
VIEW IN TELEGRAM
Свободу котикам ❤️
Forwarded from Сиолошная
Elon Musk твитнул, что сегодня ночью они запустили тренировку на свежепостроенном суперкластере X.AI в Мемфис, штат Теннеси.
В этом датацентре установлено 100'000 видеокарт H100😨 это ОЧЕНЬ много — META недавно запустила 2 кластера по 24'576 GPU, а GPT-4 тренировали, по слухам, на 25'000 карт.
Мало того, что самих чипов больше, каждый из них ещё и в 2-3 раза мощнее. Точную оценку дать сложно, многое упирается в инфраструктуру и способ обмена разных серверов информацией. Чем больше карт — тем дольше их синхронизировать, и потому падает утилизация.
Если прикидывать грубо, то система в 10 раз мощнее тренировавшей модель OpenAI (x4 за кол-во карт и x2.5 за новое поколение чипов). Честно, я не ждал, что уже в этом году заработает такой кластер — думал, может, на 75-80 тысячах остановятся. Тем более я не ждал этого от Elon — ведь его X.AI буквально последними запрыгнули в AI гонку, когда видеокарточек уже буквально не было!
Но если новичок смог за полтора года так разогнаться, то, наверное, у OpenAI x Microsoft или Google мощностей для запуска одной тренировки может быть в 2-3 раза больше. Думаю, тезис про «самый большой кластер» под вопросом (просто они непубличные и мы про них не знаем).
В любом случае, развитие продолжается, ждём Grok 3 в декабре — а вместе с ним и моделей от других ведущих лабораторий!
В этом датацентре установлено 100'000 видеокарт H100
Мало того, что самих чипов больше, каждый из них ещё и в 2-3 раза мощнее. Точную оценку дать сложно, многое упирается в инфраструктуру и способ обмена разных серверов информацией. Чем больше карт — тем дольше их синхронизировать, и потому падает утилизация.
Если прикидывать грубо, то система в 10 раз мощнее тренировавшей модель OpenAI (x4 за кол-во карт и x2.5 за новое поколение чипов). Честно, я не ждал, что уже в этом году заработает такой кластер — думал, может, на 75-80 тысячах остановятся. Тем более я не ждал этого от Elon — ведь его X.AI буквально последними запрыгнули в AI гонку, когда видеокарточек уже буквально не было!
Но если новичок смог за полтора года так разогнаться, то, наверное, у OpenAI x Microsoft или Google мощностей для запуска одной тренировки может быть в 2-3 раза больше. Думаю, тезис про «самый большой кластер» под вопросом (просто они непубличные и мы про них не знаем).
В любом случае, развитие продолжается, ждём Grok 3 в декабре — а вместе с ним и моделей от других ведущих лабораторий!
Please open Telegram to view this post
VIEW IN TELEGRAM
Futuris
Meta AI представляет Llama 3 - новое поколение своих открытых больших языковых моделей✨ Новые модели Llama 3 с параметрами 8B и 70B демонстрируют значительное повышение производительности по сравнению с предыдущими моделями, включая улучшенные способности…
Пишут, что сегодня - завтра должна релизнуться LLaMA 405B от Meta, а в сеть уже утекли метрики по которым она рвёт даже gpt4o, хоть LLaMA и меньше раза в 4-5🤯
В общем ждём, если это правда, то у опенсорса появится свой король (и возможно это подтолкнёт побыстрее выпустить какую нибудь gpt 4.5o например или Claude 3.5 Opus 🌚)
В общем ждём, если это правда, то у опенсорса появится свой король (и возможно это подтолкнёт побыстрее выпустить какую нибудь gpt 4.5o например или Claude 3.5 Opus 🌚)
Futuris
Пишут, что сегодня - завтра должна релизнуться LLaMA 405B от Meta, а в сеть уже утекли метрики по которым она рвёт даже gpt4o, хоть LLaMA и меньше раза в 4-5🤯 В общем ждём, если это правда, то у опенсорса появится свой король (и возможно это подтолкнёт побыстрее…
Модель выложили - пообщаться можно тут https://llama.meta.com/
или тут https://huggingface.co/chat/models/meta-llama/Meta-Llama-3.1-405B-Instruct-FP8
или тут https://huggingface.co/chat/models/meta-llama/Meta-Llama-3.1-405B-Instruct-FP8
Meta Llama
The open-source AI models you can fine-tune, distill and deploy anywhere. Choose from our collection of models: Llama 3.1, Llama 3.2, Llama 3.3.
Futuris
https://www.aiuncensored.info/ - не благодарите (советую использовать с VPN) - вот оно неизбежное будущее - опенсорс нейронка без цензуры, в гугле если что всю эту инфу тоже можно найти при желании, так что запрещать нет смысла🌚 Название модельки нравится)…
Ржака, сайт с нейронками без цензуры добавил LLaMA 405B с цензурой 😁зато работает без впн и позже зафайнтюнят её же для 18+🌚
This media is not supported in your browser
VIEW IN TELEGRAM
Ничего необычного, просто тесты армии робособак🤖 скоро увидим такие же тесты бипедальных, вообще ждёте робо-революцию🦾?
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи из DeepMind представили две новые системы искусственного интеллекта - AlphaProof и AlphaGeometry 2, которые достигли уровня серебряной медали на Международной математической олимпиаде 2024 года. Системы решили 4 из 6 задач олимпиады, набрав 28 из 42 возможных баллов. AlphaProof использует формальный язык Lean и обучение с подкреплением для доказательства математических утверждений. Обе модели показали впечатляющие результаты, решив в том числе самую сложную задачу олимпиады.
DeepMind планирует интегрировать разработанные технологии математического рассуждения в систему Gemini. Это позволит улучшить способности Gemini в области математики и логического мышления. В будущем Gemini сможет помогать математикам исследовать гипотезы, предлагать новые подходы к решению сложных задач и ускорять процесс доказательств. Исследователи надеются, что такие инструменты ИИ откроют новые возможности для научных открытий и технологических инноваций, основанных на продвинутом математическом анализе✨
УСКОРЯЕМСЯ⚡️
DeepMind планирует интегрировать разработанные технологии математического рассуждения в систему Gemini. Это позволит улучшить способности Gemini в области математики и логического мышления. В будущем Gemini сможет помогать математикам исследовать гипотезы, предлагать новые подходы к решению сложных задач и ускорять процесс доказательств. Исследователи надеются, что такие инструменты ИИ откроют новые возможности для научных открытий и технологических инноваций, основанных на продвинутом математическом анализе✨
УСКОРЯЕМСЯ⚡️
Тут OpenAI решили не отставать от инфоповодов и потизерить свой поисковик (зачем?) Кажется, если они не представят ничего серьёзного в ближайшее время, то у компании явно проблемы, тк недавние gpt4o-mini уже не выдерживают конкуренции🌚
коммент на скрине очень ёмко описывает ситуацию
P.S.
но в лист ожидания встану🤓
UPD
Альтман пообещал начать выкатывать новый VoiceMode со след недели✨ - первым делом испытаю в своей Rpg-Gpt с разными голосами🧙♂️
коммент на скрине очень ёмко описывает ситуацию
P.S.
но в лист ожидания встану🤓
UPD
Альтман пообещал начать выкатывать новый VoiceMode со след недели✨ - первым делом испытаю в своей Rpg-Gpt с разными голосами🧙♂️
This media is not supported in your browser
VIEW IN TELEGRAM
Ну не зря все-таки ИИ изобрели ❤️
This media is not supported in your browser
VIEW IN TELEGRAM
А вот это красиво ✨
Надо будет так же самому Kling помучать🌚
Надо будет так же самому Kling помучать🌚
This media is not supported in your browser
VIEW IN TELEGRAM
Попался тут AI сервис для 3д дизайна. Он вам и текстуру и модельку сгенерит ✨ го пробовать https://www.meshy.ai/
А вот что-то очень интересное: неизвестная компания Topology вдруг представила новую концепцию языковых моделей - Continuous Learning Model (CLM) со слов в презентации: " CLM - языковая модель, способная накапливать знания и навыки со временем, подобно людям. В отличие от традиционных моделей, CLM не имеет ограничений по времени обучения, сохраняет память между разговорами и может приобретать новые навыки без дополнительной настройки. Модель состоит из двух ключевых компонентов: модуля памяти для кодирования и организации данных, и модуля интроспекции для формирования идей на основе воспоминаний." 🤯
Звучит очень круто (если, конечно, это не пиар ход для обычной LLM🌚), но всё это можете протестировать сами тут (работает без впн): https://t.co/QfbYeW4Lfj
По крайней мере мой короткий разговор на русском с этой моделькой получился вполне органичным и натуральным и игру Atari breakout она мне тоже написала с первой попытки, да и дату и курс битка тоже знает🤔
P.S.
Пообщался, а дальше просит закинуть денег🤷♂️
Звучит очень круто (если, конечно, это не пиар ход для обычной LLM🌚), но всё это можете протестировать сами тут (работает без впн): https://t.co/QfbYeW4Lfj
По крайней мере мой короткий разговор на русском с этой моделькой получился вполне органичным и натуральным и игру Atari breakout она мне тоже написала с первой попытки, да и дату и курс битка тоже знает🤔
P.S.
Пообщался, а дальше просит закинуть денег🤷♂️
OpenAI начали предоставлять доступ к обновлённой GPT4o с длииинннными ответами в 64к токенов за раз (около 50 тыс слов) ✨ но пока только избранным
Тут OpenAI начали выкатывать новый voice mode в альфа версии, ну и похоже учителя иностранных языков могут начинать переквалификацию в другие сферы деятельности 😅 ну и стендаперы заодно 😜
This media is not supported in your browser
VIEW IN TELEGRAM
И всё-таки она поёт, как бы OpenAI не урезали голосовые возможности🌚
Google представила Gemma 2 2B, компактную AI-модель, превосходящую по производительности более крупные аналоги, включая GPT-3.5. Модель с 2,6 млрд параметров демонстрирует высокие результаты в тестах LMSYS, MMLU и MBPP, превосходя конкурентов с десятикратным размером.
Gemma 2 2B оптимизирована для работы на устройствах, что открывает новые возможности для мобильного AI (ждём в новых пикселях📱). Google делает Gemma 2 2B доступной в открытом коде, способствуя развитию более доступных AI-технологий.
Попробовать уже можно в Google ai studio с VPN-USA
____
И сразу второе интересное - на этом сайте можно без танцев с бубном и регистрации погонять Llama 405b со скоростью генерации около 50 слов в сек✨
Gemma 2 2B оптимизирована для работы на устройствах, что открывает новые возможности для мобильного AI (ждём в новых пикселях📱). Google делает Gemma 2 2B доступной в открытом коде, способствуя развитию более доступных AI-технологий.
Попробовать уже можно в Google ai studio с VPN-USA
____
И сразу второе интересное - на этом сайте можно без танцев с бубном и регистрации погонять Llama 405b со скоростью генерации около 50 слов в сек✨
Forwarded from эйай ньюз