ML with MiLE
166 subscribers
7 photos
1 video
8 links
If you don't fail, you're not even trying
Канал про AI/ML с фокусом на LLMs

https://www.linkedin.com/in/mile-mitrovic
加入频道
Channel created
Channel photo updated
📢 Всем привет!

🙋 Меня зовут Миле Митрович и я рад приветствовать вас на канале "ML with MiLE"

🧑‍💻🧑‍🎓 Я исполнительный директор по исследованию данных в Sber AI Lab (Сбербанк). Обладатель PhD в области искусственного интеллекта. Являлся соучредителем 3 стартапов в области искусственного интеллекта в Германии, Сербии и Канаде. Родом из Сербии, но уже несколько лет прожил в Москве. Являюсь членом Serbian AI Society.

📢 На этом канале буду делится новостями из мира искусственного интеллекта и своей жизнью инженера и исследователя.

🙂 Присоединяйтесь!
9🔥6👍3🤝21
Forwarded from LightAutoML framework
📺📺📺
Привет! Помимо работы над LightAutoML, мы занимаемся и следим за многими другими темами в области ML.

Завтра сотрудник нашей команды Миле Митрович выступит на научном семинаре с обзорным докладом на тему агентов, ждем вас онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7🆒3👍1
📢 Alibaba обучила QwQ 32b с RL который достигает уровень Deepseak-R1 671b в ризонинг и кодинг. Это означает, что 20 раз меньшая модель достигает тоже самую точность. 🤔

👌 Также говорят что они активно исследуют использование агентов с RL чтобы обеспечило long-horizon резонинг с масштабированием времени инференса

https://qwenlm.github.io/blog/qwq-32b/
👌6👍1🔥1
📢 Inception Labs представила Mercury, первую коммерческую диффузионную LLM, которая генерирует текст параллельно, а не последовательно, как другие авторегрессионные модели.

👉 Таким образом, она делает инференс с очень высокой скоростью. Она может генерировать более 1000 токенов в секунду на GPU H100, что в 5-10 раз быстрее авторегрессионных LLM

👌 Тесты показывают, что генерирует токены очень быстро. Похоже на будущее LLM-ках

https://www.inceptionlabs.ai/
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
📢 В понедельник (10. марта) в Технологии Доверия (ТеДо) прошла  панельная дискуссия на тему LLM-агентах.

Среди спикеров, таких как Юрий Симонов, Валентин Малых, Марк Паненко и Антон Воронов, я принял участие.

👆Не много атмосфери можно увидет на видео.

👌 Большое спасибо Юрию и команде ТеДо за отличную организацию!
🔥11👍8👏1
📢 Yann LeCun и его команда представили Dynamic Tanh (DyT) в качестве замены традиционных слоев нормализации в моделях глубокого обучения. Этот новый подход, основанный на функции масштабированного tanh, показывает производительность, сравнимую или превосходящую такие методы, как LayerNorm и RMSNorm. Самым захватывающим аспектом является его потенциал для снижения вычислительных затрат при сохранении эффективности модели.

🤔 DyT заменяет слои нормализации масштабированной функцией tanh (tanh(αx)), где параметр α (альфа) управляет коэффициентом масштабирования функции tanh. DyT имитирует поведение слоев нормализации, сжимая экстремальные значения, сохраняя линейный центр

Преимущества:
👉 DyT снижает затраты на обучение и инференс.
👉 Требуется только один обучаемый параметр масштабирования (α).
👉 Работает быстрее, чем RMSNorm на графических процессорах H100
👍5🆒5🔥4
📢 В субботу (15 марта) в Сколково прошла конференция IT Purple Conf. Конференция привлекла множество специалистов и студентов из разных городов России и зарубежья.

🥁 Я был спикером и выступил с докладом про LLMs и AI Agents.

👆 Немного атмосферы вы можете увидеть на фотографиях.

😊 Я был рад новым знакомством и встречи с старыми друзьями :)
🔥20👍7👏2🆒1😎1
🥁 Майские праздники давно прошли и пришло время новых рабочих побед. Уже завтра стартует Data Fest, но в этом году впервые у меня дома в Сербии в Белграде 🥳 🇷🇸

🤝 Буду рад встрече, если вы планируете приехать на трек в Белград! Если нет, ждите фотографии атмосферы из Белграда 👌

А вы собираетесь посетить Data Fest в этом году?
🔥116👍4🆒1
🛰️ Как и обещал, делюсь фотографиями и атмосферой с Data Fest в Яндексе в Белграде.

🏋️ Вместе с Лёшей @AleXXL1986, мы из Sber AI Lab выступали с докладомы про наши open source библиотеки и различные подходы к улучшению reasoning в LLM.

🍾 В целом, программа была очень насыщенной: среди самых интересных запомнились выступления о применении VLM в продуктах Яндекса, кейсы с умным помощником для Яндекс Лавки и очень необычный проект по обучению межславянской языковой модели. Помимо содержательных докладов, на фестивале царила по-настоящему дружеская и вдохновляющая атмосфера — яркие дискуссии, новые знакомства и море свежих идей!

🥇 Особенно выделю квиз по тематике Data Science — это было не только увлекательно, но и азартно, ведь нашей команде удалось победить!
🔥20👍5👏51💅1