Sberloga
2.56K subscribers
200 photos
26 videos
7 files
247 links
Data Сообщество
По всем вопросам обращаться @SberlogaHelperBot
Чат - @sberlogadataclub
加入频道
Forwarded from Machinelearning
📌 США могут ускорить гонку ИИ, вложив в "Манхэттенский проект ИИ" ресурсы, сопоставимые с программой «Аполлон».

Идея «Манхэттенского проекта для ИИ», витавшая последние месяцы на самом высоком уровне в США, кажется, начинает обретать очертания. Но за громкими сравнениями обычно теряется суть: а что это значит на практике?

Аналитики из Epoch AI решили посчитать, какой вычислительный монстр может появиться, если американское правительство консолидирует ресурсы частного сектора и вложит в проект долю ВВП, сопоставимую с пиком лунной программы.

Epoch AI - некоммерческий исследовательский институт, который изучает траекторию развития искусственного интеллекта, анализирует тренды в вычислениях, данных и алгоритмах, чтобы прогнозировать влияние ИИ на экономику и общество.


🟡Картина получается масштабная.

Расчеты показывают, что к концу 2027 года такой проект мог бы обеспечить тренировочный прогон модели с вычислительной мощностью порядка 2 × 10²⁹ FLOP.

Чтобы понять масштаб: это примерно в 10 000 раз больше, чем потребовалось для обучения GPT-4. По сути, это рывок, который по текущим прогнозам должен был случиться на несколько лет позже.

Финансирование на уровне программы «Аполлон» (около 0.8% ВВП или 244 млрд. долларов сегодня) позволило бы закупить и объединить в один кластер эквивалент 27 миллионов NVIDIA H100. Эта цифра, кстати, совпадает с экстраполяцией текущих доходов NVIDIA от продаж в США.

🟡А хватит ли на это электричества?

27 миллионов GPU потребуют около 7.4 ГВт мощности - это больше, чем потребляет весь город Нью-Йорк. Оказывается, это не главная преграда. Аналитики говорят, что к 2027 году в США и так планируется ввод 8.8 ГВт за счет новых газовых электростанций, значительная часть которых уже предназначена для дата-центров.

При наличии политической воли и используя законодательные инструменты, правительство США сможет сконцентрировать эти мощности в одном месте, так что энергия не станет узким местом.

🟡Разумеется, у сценария есть свои «но».

Геополитическая напряженность, например, вокруг Тайваня, может сорвать поставки чипов. Кроме того, нельзя просто так взять и увеличить масштаб в тысячи раз. Масштабирование требует времени на отладочные прогоны и эксперименты, но это скорее инженерное, а не ресурсное ограничение.

Тем не менее, анализ показывает: при должной координации и инвестициях технологический скачок в области ИИ может произойти гораздо быстрее, чем мы думаем. И это уже вполне просчитываемая возможность.

🔜 Статья на Epoch AI

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍3🔥31😁1
📣 Внимание! 17 июля (четверг) в 18:00 в Sberloga пройдет доклад на тему
GNN в рекомендациях OKKO

🎙️ Спикер - Никифоров Роман, Senior Data Scientist в отделе рекомендаций онлайн-кинотеатра Окко.

Роман поделится опытом использования графовой нейронной сети для создания персонализированных рекомендаций для пользователей. Узнайте об их экспериментах и достигнутых результатах.

🕕 Ждем вас в @Sberloga в 18:00!
(ссылку пришлю перед докладом в канал, подписывайтесь, чтобы не пропустить)
🔥4
Media is too big
VIEW IN TELEGRAM
МТС True Tech и ComDS приглашают на Summer Data Science Night — вечерний open-air митап для специалистов по DS и ML. Встречаемся 29 июля в 19:00 во дворе бара «Стрелка», который на одну ночь превратится в летний кинотеатр для data-фанатов.

Обсудим:

⭐️«Вызовы для DS 2025 в России».
Спикеры:
— Никита Зелинский, CDS & Head of ML Platforms МТС, автор канала Дата канальи – про „специалистов“ данных в ML/AI
— Евгений Смирнов, CDS & Head of ML Lab, Alfa-Bank, автор канала Нескучный Data Science
— Шамаев Юлий, начальник управления моделирования партнерств и ИТ-процессов, Банк ВТБ.
⭐️ «Наши RecSys-технологии: как мы завариваем вашу любимую музыку». — Дмитрий Берестнев, начальник управления машинного обучения, Hi-Fi стриминга Звук.
⭐️ «Трансформеры в кино. Как мы строим персональные рекомы в KION». — Даниил Пименов, Team Lead RecSys в KION, MWS Big Data.
⭐️ «Георекомендации: как мы подсказываем клиентам, где тратить деньги». — Алексей Пустынников, DS Team Lead команды GeoML Банка ВТБ.
⭐️«Serving по-взрослому: ускорение NLP inference в 50 раз в Антиспаме» — Илья Денисов, ML Team Lead команды Антифрод MWS Big Data.
⭐️«Практические кейсы внедрения Rag: помощник оператора и HelpDesk» — Александр Вавилкин, Middle Data Scientist, Альфа Банк.

Готовьте ваши вопросы спикерам, под попкорн будем выбирать лучшие!

🗓 29 июля
🕗 19:00–22:30
🔗
Офлайн. Количество мест ограничено. Регистрируйтесь по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41
можно подключаться
Sberloga
📣 Внимание! 17 июля (четверг) в 18:00 в Sberloga пройдет доклад на тему GNN в рекомендациях OKKO 🎙️ Спикер - Никифоров Роман, Senior Data Scientist в отделе рекомендаций онлайн-кинотеатра Окко. Роман поделится опытом использования графовой нейронной сети…
📖️ Видеопост прошедшей лекции, как обещал!

Отдельный респект Роману за его крутой доклад! Очень подробно раскрыл специфику построения моделей, тонкости и разные подходы. 👍️ Рекомендую к просмотру!

Кстати, для удобства выкладываю видео и в VK, и в YouTube, чтобы не мучиться с VPN из России:

🎬 VK: https://vkvideo.ru/video-231661716_456239017

🎬 YouTube: https://youtu.be/7vfsl9HV5_c

Смотрите и наслаждайтесь! 🎥
👍7🦄1
1
Сейчас на Summer Data Science Night на площадке киона. Доклады обещают быть интересными ❤️ Потом поделюсь впечатлениями
👍3
Первый доклад был от Димы Берестнева из "Звука". На мой взгляд, это был лучший доклад дня, посвященный внутреннему устройству рекомендательной платформы в "Звуке". 🎧️

Дима рассказал о том, какие модели используются и как происходит взаимодействие продуктов. 🛠️

Честно говоря, количество различных моделей и решений было впечатляющим. Осталось неясным, как ребята пришли к такой архитектуре - кажется, схема довольно сложная и росла она исторически. Не факт, что каждый элемент вносит значительный вклад. 🤔️

Интересным моментом было то, что отбором кандидатов занимается RL. 📊️
Второй доклад подготовил Даниил Пиманов из "Кион". Темой его выступления стали трансформеры. 📽️

Даниил подробно рассказал о проблемах, возникающих при рекомендациях фильмов. Он поделился, как выбирались метрики, как происходила работа с популярными фильмами и как происходило модифицирование loss функции под конкретные задачи. 🎯️

Доклад был интересным и содержательным, однако за отведенные 20 минут не удалось рассказать обо всем. Осталось ощущение, что хотелось бы уделить этой теме больше времени. ⏰️
Третий доклад был от Алексея Пустынникова из ВТБ. Темой его презентации стало использование геоэмбедингов для решения задачи оптимального расположения банкоматов. 🏧️

Вкратце, рассматривались геопатчи размером 500х500 метров, для которых строились геоэмбединги. Также строились эмбединги клиентов и модель, определяющая для каждого клиента оптимальные патчи для расположения банкоматов. 🌍️

Проект выглядит весьма интересным, но сложным. Остается неясным, дал ли он эффект выше, чем аналитический подход с анализом локаций, где клиенты снимают деньги, но нет собственных банкоматов. На этот вопрос, по всей видимости, был дан ответ о проведении А/В-теста... но, если честно, в это сложно поверить. 🙂️
Четвертым выступлением стал доклад Ильи Денисова из МТС, посвященный ускорению инференса на GPU. 🚀️

Илья подробно рассказал о эволюции решений инференса, начиная от FastAPI и заканчивая Triton Inference Server. Он поделился информацией о выборе бэкенда, о том, как удалось оптимизировать модель и как происходило ее масштабирование. 🏗️

Это был интересный технический доклад, который будет полезен тем, кто планирует не только обучать модели, но и внедрять их в продакшн. 🛠️
Пятый доклад был от Александра Вавилкина из "Альфа-Банка". Он рассказывал о кейсах применения RAG в банковской сфере. 🏦️

Были рассмотрены сценарии использования LLM при обращениях клиентов. Однако, на мой взгляд, в этом не было много новизны - сегодня подобные решения уже не кажутся чем-то необычным. 🔄️

Однако, это не делает доклад менее ценным. 🧐️
😁7🥰2
Forwarded from VTORNIK.Company
VTORNIK.Вечер

26 августа, с 19:00 до 21:00 мы приглашаем на наше первое мероприятие. Оно будет проходить офлайн в Москве и будет посвящено вопросам внедрения AI в процессы компании.

Программа мероприятия:

1. Lessons Learned. Уроки, которые мы можем извлечь из предыдущих трансформаций и внедрений на примере Big Data

Спикер: Денис Афанасьев, CPO в Crossover Markets Group. В прошлом директор дивизиона b2b-продуктов Салют SberDevices, CEO в CleverDATA.

2. Q&A-сессия о трудностях внедрения AI в корпорации

Спикер: Яна Чаруйская, Директор продвинутой аналитики корпоративных клиентов Альфа-банка. В прошлом Head of XR в SberDevices, Chief Data Scientist (ML/DL) в Сбере, CPO продуктов Big Data в МТС, руководитель DWH-аналитики.

Место проведения: м. Кропоткинская, пространство Perfect Pitch, Берсеневский переулок 5 стр 2.

Мероприятие бесплатное. Регистрация обязательна. Количество мест ограничено.

Будем рады видеть наших старых друзей и выпускников и познакомиться с новыми людьми!

Хорошего вторника!